Die Spitch-Systeme können gesprochene Sprache verstehen, ChatGPT und Co. nur Texte generieren
Frankfurt/Zürich, 28. Februar 2023 – Die bei Sprachdialogsystemen verwendete Künstliche Intelligenz (KI), um gesprochene Sprache zu verstehen und darauf zu reagieren, und die von ChatGPT und Bard bereitgestellte KI zum automatischen Generieren von Texten ergänzen sich. Mit dieser Stellungnahme grenzt die Spitch AG ihre eigene KI-Entwicklung von den jüngsten Veröffentlichungen von OpenAI/Microsoft und Google ab. „Spitch versteht Sprache, ChatGPT und Co. erzeugen Texte“, bringt Jörg Rebell, Presales Manager, Business Development DACH bei Spitch den Unterschied auf den Punkt.
Er erklärt: „Einen Text zu generieren anhand einiger Stichworte beeindruckt viele Menschen, wenn sie dieses Phänomen zum ersten Mal erleben. Daraus resultiert der Wirbel um ChatGPT. Doch tatsächlich ist es relativ einfach, einen Artikel über ein Thema anhand des geballten Wissens der Menschheit, das im Internet bereits in Textform vorliegt, zu erstellen. Um ein Vielfaches schwieriger ist es jedoch zu verstehen, was ein Mensch sagt und vor allem, was er damit meint.“
Jörg Rebell gibt ein Beispiel:
„ChatGPT liefert auf die Anfrage ‚Schreibe einen Artikel über Marbella aus der Sicht eines Touristen‘ einen ziemlich guten Text, der verblüfft, weil man so etwas zuvor nicht gewohnt war. Doch wenn man genauer darüber nachdenkt, wird schnell klar, wie einfach das im Grunde ist. Das Ergebnis ist kaum mehr als ein gekürzter Wikipedia-Artikel. Bei der Frage ‚Welche jüngsten Entdeckungen des James Webb Space Teleskops kann ich meinem neunjährigen Kind erzählen?‘ patzt die Google-KI Bard bereits: Das Ergebnis liest sich plausibel, ist aber teilweise schlichtweg falsch – obgleich auch diese Anfrage vergleichsweise einfach ist.
Schwierig wird es erst, wenn beispielsweise jemand bei einer Versicherung anruft und erzählt, dass seine Katze auf das Sofa des Nachbarn gesprungen ist und dieses zerkratzt hat. Der Anrufer will nämlich weder über Katzen noch über Sofas und auch nicht über seinen Nachbarn sprechen, sondern er will einen Schadensfall melden, den seiner Meinung nach seine Haftpflichtversicherung begleichen soll. Das Sprachdialogsystem von Spitch versteht das. Der Unterschied ist offensichtlich: Bei ChatGPT und Bard fallen alle relevanten Begriffe wie ‚Marbella, Tourist, James Webb Space Teleskop, neunjähriges Kind‘, aber bei Spitch gehen alle vom Anrufer verwendeten Worte an dem vorbei, was er meint, obgleich er es gar nicht ausspricht. Anhand dieser Beispiele wird deutlich, warum die von Spitch verwendete Künstliche Intelligenz viel weiter reichen muss als bei ChatGPT oder Bard.“
In diesem Sinne ergänzen sich ChatGPT, Bard und Spitch. Die ersten beiden können mehr oder minder gute Texte erzeugen, Spitch kann viele – aber auch nicht alle – Anrufe verstehen. Die Sprachdialogführung ist aus zwei Gründen besonders schwierig: Erstens drücken sich Menschen sehr unterschiedlich aus, und zweitens sprechen sie ein breites Spektrum an Dialekten. Dabei steht das System vor der Herausforderung, die Absicht – den sogenannten „Intend“ – zu erkennen, also aus „Katze“, „Sofa“ und „Nachbar“ schlusszufolgern, dass es um eine Haftpflichtversicherung geht, um beim Beispiel zu bleiben.
Die Sprachdialogsysteme von Spitch schaffen diese Intend-Erkennung mit einer Quote von über 85 Prozent. Dazu müssen sie allerdings vor dem Einsatz in einem bestimmten Unternehmen auf diese Firma hin trainiert werden. Dazu gehört die Aufnahme des in der jeweiligen Branche und im Betrieb üblichen Fachvokabulars. Hinzu kommt die Analyse Tausender von Anrufen, um herauszufiltern, was Anrufer typischerweise wollen („Intend“) und mit welchen Worten oder Sätzen sie dies ausdrücken. „Erst wenn alle diese Schritte zufriedenstellend durchlaufen sind, wird ein Sprachdialogsystem von Spitch bei einem Unternehmen in den Regelbetrieb überführt“, erläutert Jörg Rebell.
Ausgabetechnologien wie GPT (Generative Pre-trained Transformer) oder LaMDA (Language Model for Dialog Applications) können in betrieblichen Anwendungsszenarien erst dann zum Einsatz gelangen, wenn der „Intend“ klar ist und Antworten erzeugt werden müssen. „Dabei ist es egal, ob der Artikel als Text angezeigt oder künftig möglicherweise mittels Sprachausgabe vorgelesen wird“, stellt Jörg Rebell klar. Er sagt: „Entscheidend ist für Sprachdialogsysteme der erste Schritt, nämlich den Anrufer zu verstehen und zu begreifen, worum es ihm geht. Darin liegt ein Alleinstellungsmerkmal von Spitch gegenüber allen generativen KI-Systemen. Wir sprechen in diesem Zusammenhang von Conversational AI, also von Konversations-KI.“
Die Spitch AG mit Präsenz in zahlreichen europäischen Ländern und Nordamerika ist ein führender Entwickler und Anbieter von Sprach- und Textdialogsystemen für Unternehmen und Behörden. Spitch-Systeme verstehen nicht nur Wörter und Sätze, sondern insbesondere auch den Sinn des Gesagten. Hierzu setzt Spitch auf durchgängig eigenentwickelte Software, die Natural Language Processing (NLP), Artificial Intelligence (AI) und Machine Learning (ML) kombiniert. Je nach Anforderungen werden unterschiedliche Module auf Grundlage einer einheitlichen Omnichannel-Plattform zu einer kundenspezifischen Lösung zusammengeführt. Spitch-Systeme arbeiten in namhaften Call- und Contact-Centern, Banken und Versicherungen, Telekommunikationsfirmen, der Automobil- und Transportbranche, dem Gesundheitswesen und im öffentlichen Dienst. Mehr als 50 Millionen Interaktionen wurden 2021 über Spitch-Systeme abgewickelt und das Wachstum geht weiter.
Um dir ein optimales Erlebnis zu bieten, verwenden wir Technologien wie Cookies, um Geräteinformationen zu speichern und/oder darauf zuzugreifen. Wenn du diesen Technologien zustimmst, können wir Daten wie das Surfverhalten oder eindeutige IDs auf dieser Website verarbeiten. Wenn du deine Zustimmung nicht erteilst oder zurückziehst, können bestimmte Merkmale und Funktionen beeinträchtigt werden.
Funktional
Immer aktiv
Die technische Speicherung oder der Zugang ist unbedingt erforderlich für den rechtmäßigen Zweck, die Nutzung eines bestimmten Dienstes zu ermöglichen, der vom Teilnehmer oder Nutzer ausdrücklich gewünscht wird, oder für den alleinigen Zweck, die Übertragung einer Nachricht über ein elektronisches Kommunikationsnetz durchzuführen.
Vorlieben
Die technische Speicherung oder der Zugriff ist für den rechtmäßigen Zweck der Speicherung von Präferenzen erforderlich, die nicht vom Abonnenten oder Benutzer angefordert wurden.
Statistiken
Die technische Speicherung oder der Zugriff, der ausschließlich zu statistischen Zwecken erfolgt.Die technische Speicherung oder der Zugriff, der ausschließlich zu anonymen statistischen Zwecken verwendet wird. Ohne eine Vorladung, die freiwillige Zustimmung deines Internetdienstanbieters oder zusätzliche Aufzeichnungen von Dritten können die zu diesem Zweck gespeicherten oder abgerufenen Informationen allein in der Regel nicht dazu verwendet werden, dich zu identifizieren.
Marketing
Die technische Speicherung oder der Zugriff ist erforderlich, um Nutzerprofile zu erstellen, um Werbung zu versenden oder um den Nutzer auf einer Website oder über mehrere Websites hinweg zu ähnlichen Marketingzwecken zu verfolgen.
Comments are closed