SLIK

Projektdetails

Projekt: BEENDET

Dauer: 24 Monate

Kickoff: Mai 2022

Förderung: Bundesministerium für Bildung und Forschung (BMBF)

Die Verfügbarkeit ausreichender Trainingsdaten ist eine wichtige Voraussetzung dafür, dass kleine und mittlere deutsche Unternehmen am Fortschritt der KI teilhaben können. Gerade in der automatischen Sprachverarbeitung, insbesondere für die deutsche Sprache, fehlen bislang jedoch weitgehend Tools, mit denen sich aus kleinen Sprachdatenmengen automatisch die für maschinelles Lernen notwendigen Datenmengen erzeugen lassen. Das Verbundprojekt Synthese linguistischer Korpusdaten (SLIK) schließt diese Lücke. Es richtet sich an deutsche KMU, die KI-basierte Sprachassistenten einsetzen möchten, bislang aber nicht über genügend eigene Trainingsdaten für Sprachverarbeitungsmodelle verfügen.

Dafür stellt SLIK Werkzeuge zur Erzeugung domänenspezifischer synthetischer Sprachdaten bereit. In das Projekt fließen die Expertise der Kauz GmbH im Bereich regelbasierte Analyse und Generierung schriftsprachlicher Daten, der Aristech GmbH in den Bereichen Spracherkennung und Text-to-Speech sowie der Universität des Saarlandes im Bereich Low-Resource-Deep-Learning ein. So entstehen mithilfe von Data-Augmentation Korpora geschriebener und gesprochener Sprache für verschiedene relevante KMU-Domänen. Gleichzeitig entwickelt das Projekt einfach nutzbare Tools, mit denen Unternehmen aus wenigen Nutzerdaten ausreichend Trainingsdaten für Sprachassistenten und andere Systeme der automatischen Sprachverarbeitung erzeugen können.

Das Projekt SLIK wird im Rahmen von „KI4KMU – Erforschung, Entwicklung und Nutzung von Methoden der Künstlichen Intelligenz in KMU“ durch das Bundesministerium für Bildung und Forschung gefördert.

Im Projekt SLIK arbeiten wir mit verschiedenen Projektpartnern zusammen:

Gefördert vom:

Bundesministerium für Bildung und Forschung

06/01/2022