Sprachassistenten

Digitale Sprachassistenten und das Marketing

| Autor / Redakteur: Robert C. Mendez * / Annika Lutz

Digitale Sprachassistenten sind weit mehr als nur eine Modeerscheinung.
Digitale Sprachassistenten sind weit mehr als nur eine Modeerscheinung. (Bild: gemeinfrei / CC0)

Digitale Sprachassistenten wie Alexa, Siri, Google Assistant, Cortana oder Bixby gehen nicht wieder weg. Auch wenn es bei der aktuellen großen Masse an medialen Superlativen so scheint: Digitale Sprachassistenten sind keine Modeerscheinung, da sie an vielen Stellen zwar schon sehr gut funktionieren – an vielen anderen aber noch nicht gut genug.

So sind Sprachassistenten auch nicht die nächste große Disruption oder die nächste große Nutzerschnittstelle, so wie viele Wortwirbler es gerne in die Medien blasen. Das ist der Beweis, dass noch viel zu lernen ist und dass Sprachassistenten die gleichen Entwicklungen durchmachen wie andere Technologien zuvor.

Smart-Voice-fähige Geräte sind zum Beispiel kein eigenes Geräte-Ökosystem, denn dazu müssten sie die Grundbedingung zum Betrieb der Geräte sein, was aber nicht der Fall ist. Sämtliche Geräte die sprechen können, werden lediglich um den effizienten „Kanal“ Stimme erweitert und sind damit stets nur ein Teil anderer Ökosysteme, – wenn auch ein sehr effizienter Teil. Eine Mikrowelle, die sprechen kann, bleibt eine Mikrowelle, auch wenn ihre Nutzung vielleicht massiv effizienter wird.

Sicher. die Zahlen über mögliche Umsätze, Entwicklungen und Nutzungen hören sich ja attraktiv an, sind am Ende aber dann doch nur gefühlte Zahlen ohne wirklich reale Basis. Bisher sind aus vielen großen Versprechungen am Ende dann doch keine geworden, besonders im Digitalen. Digitale Sprachassistenten machen hier keinen Unterschied. In vielen anderen Bereichen tun sie das dagegen dann aber doch sehr massiv. Daher steckt in jeder Zahl und jedem Chart dann doch auch wieder Wahrheit, nur eben nicht so Superlativ wie es leider zu oft verscherbelt wird. Grundsätzlich sollten Vorträge, Artikel und Berichte, die zu großen Teilen aus Zahlen und Charts bestehen, jedoch eher ins Märchenregal gestellt werden. Es sind maximal Trends – mehr nicht. Glaubhaft ist lediglich, dass der massive Absatz von Geräten, die sprechen können, ein Beweis ist – und, dass Sie gerade diesen Artikel lesen.

Definitionssache

Der erste Klärungsbedarf entsteht schon in der Bezeichnung des Marktsegments, in dem die „persönlichen virtuellen Assistenten“ ihre Wirkungen zeigen. Der Begriff „Voice" (engl. Stimme) ist zwar nicht ganz falsch, wird der Sache aber nicht gerecht. Voice ist traditionell von Dienstleistungen von Telekommunikationsdiensten oder Stimmbildung belegt, da reicht ein kurzer Griff in die Suchmaschine um das zu erforschen. So wie zusätzliche vernetzbare Geräte das eigene Zuhause smarter machen (=Smart Home), so erweitern digitale Sprachassistenten die Möglichkeiten unserer Stimme. Ergo sollte es „Smart Voice" heißen, wenn es einigermaßen der Sache entsprechen soll!?

Ebenso möchten auch die etablierten Suchmaschinenoptimierer ihren Fuß in der Smart-Voice-Tür haben und erklären der Welt „Voice Search“. Klar, auf dem Bildschirm und über die Stimme etwas einzugeben und eine Suche durchzuführen ist definitiv eine Voice Search im technisch-formalen Sinne. Da digitale Sprachassistenten sich jedoch in einem gesprochenen Dialog mit dem Menschen unterhalten, fließen die Worte in ganzen Sätzen und Absichten (Intents) und nicht in einer geplanten Folge von Schlagworten.

Geschriebene Dialoge/Sprache ist nicht wie gesprochene Sprache, daher sind Chatbots (Conversational) eben auch nicht mit Voicebots (Speakable) gleichzusetzen, auch wenn sie natürlich gewisse Schnittpunkte haben. So ist also die viel gepredigte Voice Search auf den Bildschirm bezogen richtig, muss auf den Kanal von Smart Voice aber eigentlich „Intent Search“ heißen, da nicht nur Inhalte in die Bewertung der an den Nutzer auszugebenden Infos einfließen, sondern auch Funktionen, da die Nutzung von Sprachassistenten auf der aktuellen Situation des Nutzers basiert, höchst interaktiv ist und auch die Gerätesteuerung beinhaltet. Im Grunde müsste man die Gestaltungsrichtlinie zu Smart Voice (Voice First), eher „Situation First" oder „Smart First“ nennen, denn in jeder möglichen Situation soll unser persönlicher virtueller Assistent zur Seite stehen, egal ob er dann auch spricht, Bilder zeigt oder Geräte steuert.

So ist dann also „Voice Marketing“ das Marketing der Marktschreier auf dem Wochenmarkt oder die Kaltakquise per Telefon, aber eher nicht das sensible Content Marketing (Intent Marketing), welche digitale Sprachassistenten nicht nur brauchen, um den Nutzer exakt zu erreichen, sondern es geradezu verursachen. Doch genug der möglichen Definitionen, auch wenn es da noch ein paar Baustellen gäbe, die man aufreißen müsste...

Warum ist Voice das nächste große Interface?

Voice-Technologie

Warum ist Voice das nächste große Interface?

06.03.19 - 2018 – ein Jahr, in dem die Begriffe „Alexa“, „Hey Google“ und „Siri“ einen exklusiven Bekanntheitsgrad bekommen konnten. Das Thema ist längst in jeder Geschäftsführung angekommen und auf so gut wie jeder Digitalisierungsagenda zu finden gewesen. Doch ist es wirklich die nächste große Revolution in Zeiten des Internets? Oder doch nur ein kurzer Hype? lesen

Der Unterschied zwischen Sprachassistenten und smarten Lautsprechern

Aktuell werden digitale Sprachassistenten als smarte Lautsprecher wie dem Google Home oder Amazon Echo wahrgenommen. Dabei sind Google Assistant und Co. komplexe Online-Serverdienste die sich auch in fast jedem Smartphone finden lassen. Da die Nutzung der Stimme stets mit der aktuellen Situation des Nutzers verbunden ist, finden die Systeme immer mehr ihren Weg in alle möglichen Geräte, so dass smarte Lautsprecher mit Sicherheit irgendwann keine relevante Geräteklasse für die Verwendung mit Sprachassistenten sind. Digitale Sprachassistenten haben keine feste physische Form, da sie Dienste sind und in jedes Geräte gepflanzt werden können.

Die Qual der Systemwahl

Die Frage nach dem für seine Zwecke besten geeignetsten digitalen Sprachassistenten, macht am Ende des Tages wenig Sinn, da alle Systeme im Grunde die gleiche Leistungsfähigkeit bieten müssen, um beim Nutzer als „persönlicher virtueller Assistent, der sprechen kann" anzukommen.

Aktuell unterscheiden sich die Systeme jedoch noch deutlich. Nicht nur, weil die Systeme noch immer in Tag Eins ihrer Entwicklung stecken, sondern besonders, weil die entwickelnden Konzerne aus verschiedenen Welten kommen. Diese Erfahrungswelten der Konzerne und die damit verbundenen Datengrundlagen bilden damit die entsprechenden Entwicklungsgrundlagen und auch Unterschiede der Leistungen der Sprachassistenten. Ein Google Assistant dürfte aktuell mit viel Wissen trumpfen, wohingegen eine Alexa im E-Commerce punktet. Dies gilt es natürlich auch in Bezug zu anderen Funktionsgebieten zu bewerten, wie zum Beispiel der Erfahrung der Konzerne in der Spracherkennung, der künstlichen Intelligenz oder auch Smart Home und Gerätesteuerung. Nicht zuletzt lohnt sich auch ein Blick auf die Nutzerschaft der Systeme, um festzustellen, welches System die Nutzer beherbergt, die eine mögliche Marketingstrategie und Zielgruppe vorsieht.

Das Internet der Stimme

Internet of Voice

Das Internet der Stimme

17.10.18 - Schreiben ist Silber, Reden ist Gold. Der Trend zum Internet der Stimme krempelt aktuell so einiges um. Zum Beispiel die Suche im Internet oder die Bedeutung von Audio in der digitalen Welt. Denn die Stimme ist die neue Schnittstelle zwischen Mensch und Internet. Wie wirkt sich das auf Marketing, SEO, Content & Co. aus? Und: Wie spricht man im neuen Audio-Universum? lesen

Sprache ist sensibel

Die ersten Wahrnehmungen des Menschen sind der Herzschlag und die Stimme unserer Mütter. Es gibt für den Menschen keinen emotionaleren und persönlicheren Kommunikationskanal als die Stimme. So können wir in der Stimme feinste Untertöne wahrnehmen, die wir aus der Gesichtsmimik weniger gut erfassen können (Ich traue meinen Augen nicht!). Wie könnten die Menschen auch einem Organ vertrauen, welches so rasend schnell Informationen aufnehmen kann wie das Auge? Das Ohr ist bis zu 100 Mal langsamer und vor allem emotionaler. Da wundert es nicht, dass Sprache extremst sensibel ist und entsprechende Fauxpas vom Menschen sofort und hart mit Desinteresse abgestraft werden. Wer es jedoch schafft, im Ohr des Menschen zu bleiben, hat definitiv auch sein Vertrauen und damit eine einzigartige und vor allem langfristige Verbindung zu ihm.

Wenn der Mensch Emotionen erfährt, schließt er die Augen und nicht die Ohren. Wenn er dagegen emotional überfordert ist, „will er es nicht hören“. Stimme + Gehör = Emotionalität total!

Inhalte müssen versprachlicht werden

Seit nun Dekaden kämpfen die Unternehmen um die erste Seite und den ersten Platz in den Suchmaschinen. Nun kommt durch digitale Sprachassistenten die Nutzung gesprochener Sprache in den Suchschlitz von Google und Co – und da fällt dann sofort auf, dass sämtliche Medien, Datenbanken und das gesamte Internet in keinster Weise auf Sprechbarkeit und sprechbare Inhalte ausgelegt sind. Daher ist es besonders für das Marketing in erster Instanz bitter nötig, genau diesen Mangel zu beheben und sämtliche Inhalte so emotional wie möglich zu versprachlichen. Ohne diese Grundlagenarbeit werden alle anderen Folgemaßnahmen, um im Smart-Voice-Markt Anker zu werden, desaströs versagen. Ein hilfreicher Ansatz zur Versprachlichung von Inhalten liefern dabei zum Beispiel die „Evaluation of Speech Guidelines" von Google aus Dezember 2017.

Entsprechend sind zum Beispiel Kurse, in denen man lernt, Sprachassistenten zu programmieren für Programmierer zwar sinnvoll, für den Aufbau einer Smart-Voice-Strategie oder eines entsprechenden Projektes aber grundverkehrt und gar kontraproduktiv. Produktion und Programmierung liegen erst ganz am Ende eines Smart-Voice-Projekts und umfassen circa 20 Prozent des gesamten Aufwands.

Das Wesen der Stimme und Sprache zu kennen ist die oberste Prämisse. Wer keine sprechbaren Inhalte hat, braucht keinen weiteren Schritt gehen, da die Sprache durch ihre große Sensibilität sofort versagen wird. Und nein... Dialoge aus einem Chatbot sind keine sprechbaren Inhalte – und Bildschirminhalte schon gar nicht.

Wer also seine Inhalte versprachlicht, hat gute Chancen, beim Nutzer gut anzukommen,wenn der Sprachassistent es ausspricht, damit ein tiefes Vertrauen beim Nutzer zu gewinnen und lange „der Punkt der Erfüllung" beim Nutzer zu bleiben.

Da es für sprechbare Inhalte aktuell keine entsprechend zugeordneten Rankingfaktoren in den Suchmaschinen gibt, unterliegen die aktuellen Rankingfaktoren momentan noch den üblichen Faktoren für den Bildschirm. So sind also die schon oft angepriesenen Optimierungen für Voice Search lediglich gängige Optimierungen für Displays und das für die aus der Nutzerabsicht nötige Ranking für Funktionen noch gar nicht entdeckt. (Intent Ranking > Intent Search).

Inhalt des Artikels:

Kommentare werden geladen....

Kommentar zu diesem Artikel abgeben

Der Kommentar wird durch einen Redakteur geprüft und in Kürze freigeschaltet.

Anonym mitdiskutieren oder einloggen Anmelden

Avatar
Zur Wahrung unserer Interessen speichern wir zusätzlich zu den o.g. Informationen die IP-Adresse. Dies dient ausschließlich dem Zweck, dass Sie als Urheber des Kommentars identifiziert werden können. Rechtliche Grundlage ist die Wahrung berechtigter Interessen gem. Art 6 Abs 1 lit. f) DSGVO.
  1. Avatar
    Avatar
    Bearbeitet von am
    Bearbeitet von am
    1. Avatar
      Avatar
      Bearbeitet von am
      Bearbeitet von am

Kommentare werden geladen....

Kommentar melden

Melden Sie diesen Kommentar, wenn dieser nicht den Richtlinien entspricht.

Kommentar Freigeben

Der untenstehende Text wird an den Kommentator gesendet, falls dieser eine Email-hinterlegt hat.

Freigabe entfernen

Der untenstehende Text wird an den Kommentator gesendet, falls dieser eine Email-hinterlegt hat.

copyright

Dieser Beitrag ist urheberrechtlich geschützt. Sie wollen ihn für Ihre Zwecke verwenden? Infos finden Sie unter www.mycontentfactory.de (ID: 45849374 / Data)