Service

Unser Service umfasst maßgeschneiderte Schulungen für Sprachspezialisten, die Anpassung eines Sprachmodells an eine neue Domäne, die Optimierung des Spracherkennungssystems sowie die Entwicklung neuer Sprachkomponenten.

Schulungen

Sprechen zu lernen ist kinderleicht, Sprachtechnologie zu beherrschen hingegen nicht. Sie erfordert eine Kombination aus linguistischer, informatischer und ingenieurwissenschaftlicher Kompetenz. Das EML bietet spezielle Schulungen für Sprachspezialisten an, um sie im Umgang mit den Sprachtechnologie-Werkzeugen zu schulen. Die Teilnehmer lernen, Sprachmodelle und akustische Modelle für eine "neue" Sprache zu entwickeln, ein Sprachmodell an eine neue Anwendung anzupassen oder die Sprachtechnologie in die eigene Anwendung zu integrieren.
Ein Beispiel: Der italienische Sprachtechnologieanbieter Cedat 85 nutzte einen EML-Workshop um mit dem erworbenen Know-How die Sprachkomponenten für die italienische Sprache zu entwickeln und diese in die existierende Transkriptionsumgebung zu integrieren.

Link: Cedat 85

Domänenanpassung

Eine wichtige Komponente in der Sprachverarbeitung ist das Sprachmodell. Das Sprachmodell umfasst das Vokabular und die Wahrscheinlichkeiten für Wortsequenzen. Das heißt, es deckt alle Wörter ab, die erkannt werden können. Außerdem enthält es eine Aufstellung von typischen Gesprächen in der Anwendungsdomäne. Das Sprachmodell beschreibt also „WAS wahrscheinlich gesprochen wird.“ Die besten Erkennungsergebnisse werden erzielt, wenn diese Information aus „echten“ Äußerungen stammt, die von der Anwendung aufgezeichnet wurden.
Das EML bietet seinen Kunden und Partnern an, das Sprachmodell an gewünschte Anwendungsdomänen anzupassen. Dazu sind lediglich Daten, genauer Texte, der jeweiligen Domäne (Wörter und Sequenzen) notwendig. Durch die Domänenanpassung werden noch höhere Erkennungsraten erzielt. Mit den EML-Arbeitsplätzen kann der Kunde in vielen Bereichen, zum Beispiel Speech Analytics, seine Anwendungsdomäne selbst dynamisch anpassen.

Link: Produkte EML Language Model Workplace

Erkennungsoptimierung

Ein besonderer Service des EML für seine Kunden und Partner ist die Erkennungsoptimierung über das akustische Modell. Das akustische Modell bildet die gesprochenen Laute einer bestimmten Sprache in statistischer Form ab. Es formt also, „WIE man sprechen wird.“ Alle modernen Transkriptionssysteme verwenden Hidden-Markov-Modell-Techniken für das akustische Modell. Diese statistischen Modelle basieren auf einer großen Menge manuell transkribierter, gesprochener Daten. Dazu gehören sprechertypische Daten wie Dialekt, Sprachstil, Geschlecht oder Alter. Außerdem wird berücksichtigt, woher das akustische Signal kommt, zum Beispiel aus einem Mobiltelefon, über Nahbesprechungsmikrofone oder VoIP. Und schließlich kommt es auch auf die Umgebungsgeräusche (Büro, Zug, Auto, Bahnhof) der Aufnahmen an. So wird eine genaue, sprecherunabhängige Erkennung unter sich verändernden Bedingungen oder Umgebungsgeräuschen gewährleistet. Obwohl das akustische Modell überwiegend anwendungsunabhängig ist, bewirkt die Anpassung an eine bestimmte Anwendung oder akustische Umgebung, dass die Erkennung weiter verbessert wird.

Links: Produkte EML Language Model Workplace, EML Transcription Workplace

Sprachkomponenten

Das EML entwickelt Sprachkomponenten für „neue“ Sprachen zur Erweiterung seines Sprachenportfolios. Darüber hinaus erstellt das EML akustische Modelle und Sprachmodelle auch im Auftrag seiner Kunden. Meist stellt dazu der Kunde die Sprachdaten seiner Anwendung zur Verfügung. Damit wird erreicht, dass das akustische Modell für die Anwendung optimal angepasst ist. Das Leistungsspektrum des EML schließt auch die Anpassung der Sprachmodelle anhand von Kundendaten ein.

Links: Produkte EML Language Model Workplace, EML Transcription Workplace