24.02.2016

Zur Sprache gebracht: Ein Plädoyer für asynchrone Kommunikation

„Best-Practice“-Beispiele für den Einsatz von EML-Sprachtechnologie (Teil 3) – Messestand und Demonstration live auf der CCW in Berlin vom 23. bis 25. Februar.

Die Zeichen der Zeit stehen auf Sprache: Nach der neuesten Bitkom-Studie bedienen in Deutschland mehr als die Hälfte aller Smartphone-Nutzer ihre Geräte per Stimme. Unter dem Motto „Zur Sprache gebracht“ zeigt der Sprachtechnologie-Spezialist EML European Media Laboratory GmbH drei Praxisbeispiele aus verschiedenen Branchen. Zum Abschluss erläutert Dennis Schottler, Geschäftsführer des Cloudservice-Anbieters voiXen GmbH,  im Interview die Vorteile der automatischen Verschriftung von Sprachnachrichten im Kundendialog:

EMLVoice: Ihr Unternehmen bietet eine Webapplikation zur Archivierung, Analyse und Suche von Sprachdateien an. In welchen Bereichen agieren Ihre Kunden und welche Motive haben sie, die Lösungen von voiXen zu nutzen?

Schottler: Der Großteil unserer Kunden stammt aus der Branche der Callcenter-Dienstleister, die täglich tausende Telefonate aus verschiedenen Gründen aufzeichnen. Hier sind die Motive ganz klar in der Qualitätssicherung zu finden. Ohne den Aufwand für manuelle, stichprobenartige Qualitätsprüfung einzelner Voicefiles findet voiXen schulungswürdige Gespräche genau dann, wenn sie stattfinden, und ermöglicht flexibles und effektives Coaching. Aber auch im Bereich Medien / Printmedien unterstützen wir mit unserer Lösung Kunden. Stellen Sie sich beispielsweise die vielen Interviews vor, die für Zeitschriften oder fürs Radio gemacht werden. voiXen-Kunden sind hier in der Lage, jede Aufzeichnung aufzufinden, in der beispielsweise ein beliebiges Stichwort oder ein bestimmter Name genannt wurde.

EMLVoice: Sie sind seit über 20 Jahren im Call-Center-Bereich tätig und bieten speziell für diese Branche maßgeschneiderte Lösungen an. Welchen Mehrwert hat aus Ihrer Sicht der Einsatz von Sprachtechnologie und automatischer Transkription im Call-Center?

Schottler:  Mit einem Wort lautet meine Antwort: „Automatisierung!“. Der Kundendialog kann und wird künftig nicht mehr mit Niedriglöhnern exklusiv am Telefon stattfinden. Ich glaube an asynchrone Kommunikation. Böse Zungen behaupten, ich predige das Revival des Anrufbeantworters, und irgendwie ist da auch was dran. Nur werden Servicesuchende neben Selfservice-Modulen und Selbsthilfe-Motivation durch das permanent verfügbare WWW künftig nicht irgendwo anrufen, um ihre Serviceanfrage zu platzieren. Der Frust über Inkompetenz der Callcenter-Agenten (nicht nur fachlich – auch in Bezug auf Entscheidungskompetenz) ist zu groß geworden. Künftig wird man Sprachnachrichten auf Websites oder sogar auf an das Internet angeschlossenen Geräten hinterlassen. Und dann kommen die Transkription und die echte Business Intelligence zum Zuge, in Form einer Weiterleitung (Routing) der Anfrage zum Sachbearbeiter, der wirklich helfen und lösen kann. Das gesprochene Wort in Text gewandelt, editiert um Informationen zur betroffenen Hardware (Alter, Garantie, Kaufort, nächstgelegener Servicetechniker etc.), wird die Kundenkommunikation in den nächsten fünf Jahren grundlegend verändern. Fragen Sie mal Teenager, wie die heute mit Serviceanfragen umgehen, dann bekommen Sie ein Bild davon, was Serviceanbieter künftig erwartet. Ohne Speech2Text geht in Sachen „Big Data“ künftig gar nichts mehr. Wer da nicht mitspielt, wird vom Markt verschwinden, und zwar lautlos.

EMLVoice: Das EML ist „Technical Partner“ von voiXen. Welche EML-Produkte und Services  nutzen Sie?

Schottler: Wir verwenden den „EML Transcription Server“, der eingehende Anrufe sofort vollautomatisch und sprecherunabhängig in maschinell durchsuchbaren Text umwandelt. Außerdem nutzen wir den „EML Language Model Workplace“, mit dem wir die Spracherkennung an die jeweilige Anwendungsdomäne unserer Kunden anpassen können.

EMLVoice: Wie sind Ihre bisherigen Erfahrungen damit? Wodurch unterscheiden sich die EML-Lösungen von denen anderer Anbieter?

Schottler: Das EML entwickelt seine Produkte und Lösungen aus der Forschung heraus. Das macht EML zu einem Partner. Denn im Gegensatz zu anderen Anbietern will das EML nicht einfach nur von voiXen den Marktzugang erhalten, um seine Produkte zu verkaufen.  Und die Forschung zahlt sich aus: Durch den Einsatz von „Deep Learning“-Methoden und nicht zuletzt durch ihre große Erfahrung mit automatischer Spracherkennung haben die EML-Technologen eine Erkennungsrate erreicht, die derzeit auf dem Markt nicht zu toppen ist. 

EMLVoice: Sie glauben an die Zukunft der „asynchronen Kommunikation“ im Call-Center, also: Voicemail statt Warteschleife.  Welche Vorteile  bietet hier die Sprachtechnologie?

Schottler: Der Vorteil liegt auf der Hand: Der Anrufer kann sein Problem oder sein Anliegen sofort loswerden, ohne die nervtötende Odyssee durch ein IVR oder das Festsitzen in einer Warteschleife. Einfach losreden! Durch die Sprachtechnologie können die Voicemails nach Schlüsselworten (Keywords), Auftragsnummern, Namen etc. durchsucht und dem richtigen Bearbeiter oder Projekt zugeordnet werden. Dieser kümmert sich dann um das Anliegen. Callcenter geben viel zu viel Geld für Erreichbarkeit aus. Darunter leidet die FCR-Quote. Der Anrufbeantworter mit Spracherkennung kann mehr zum besseren Preis.

EMLVoice: Welche Bereiche werden Ihrer Meinung nach in Zukunft vom Einsatz der automatischen Transkription gesprochener Sprache profitieren?

Schottler: Jeder, der Audioinhalte (gesprochen - nicht gesungen) publiziert, kann mit Speech2Text Inhalte findbar machen und genau sagen, an welcher Stelle welche Werbeeinblendung sinnvoll ist. Den Rest überlassen wir dann Google, Facebook und Co. Oder: Durchsuchen Sie mal YouTube nach allen Interviews von Frau Merkel, in denen sie das Wort „Datenschutz“ sagt, und springen Sie direkt zu dieser Stelle im Video. Geht heute nicht. Aber morgen!