In München hat die zweite All About Voice Konferenz stattgefunden. Über 200 Teilnehmer aus der DACH-Region lernten einen Tag lang von führenden Experten und tauschten sich zur Voice-First-Thematik aus. Ich war mit am Start. Hier gibt’s meine wichtigsten Takeaways:

Momentan gibt es international keinen besseren Kenner der Voice-Szene als ihn: Bret Kinsella von voicebot.io. Mit gut belegten Zahlen zeigte er den Voice-Markt und seinen Zustand auf. Wie er richtig bemerkte, kann Europa viel vom Voice-Markt in den USA lernen. Die USA sind uns einmal mehr in dieser Hinsicht einen Schritt voraus. Im «Gartner Hype Cycle» sind die Voice Assistent in der «Trough of Disillusionment» Phase. Das will heissen, wir sind mitten im Tal der Enttäuschungen angelangt. Dieser Dämpfer ist normal bei einer neuen Technologie. Wir stehen nun vor der Herausforderung für einen sinnvollen Einsatz der Technologie. Gartner sagt voraus, dass in zwei Jahren “Speech Recognition” Mainstream sein wird und die Voice Assistants dicht dahinter folgen werden. Eine Statistik aus seinem Talk will ich euch nicht vorenthalten: Die Smart Speaker Penetration pro Haushalt aus vier Ländern in Europa. Meistens in Ländern, in denen Amazon aktiv am Markt ist. Zum einen sieht man sehr gut das extreme Wachstum und die Tatsache, dass in den UK bereits jeder fünfte und in Deutschland jeder zehnte Haushalt einen Smart Speaker nutzt.

Smart Speaker Houshold Penetration by EU Country Graph by voicebot.ai

Quelle: voicebot.ai

Eine der besten Aussagen von Bret Kinsella war aus meiner Sicht die folgende:

„We’ve always had to adjust to the language of the technology to take advantage of it. It’s the first time, with voice that technology understands us.”


►Ein Hinweis in eigener Sache: Momentan erfassen wir gerade die Daten des Voice Barometer Schweiz 2019. Falls sie an den Ergebnissen interessiert sind, können sie weiterhin die Top 12 Insights Voice Barometers 2018 runterladen. So werden sie dann automatisch auf die neuen Resultate hingewiesen.


Adva Levin von Pretzel Labs gab einen Einblick, wie je nach Anwendung die Persönlichkeit eines Voice Assistant anhand einer Voice-App für Kinder, geschaffen werden muss. Das Testen von Voice-Apps ist wichtig, damit nach dem Go-Live die User nicht gleich wieder abspringen. Wenn zum Beispiel die Stimme falsch gewählt wird, die Geschwindigkeit der Sprache oder aber auch die richtige Wortwahl, werden die Kinder relativ schnell das Interesse an der Voice-App verlieren. Auch wurde den Entwicklern durch das Testen bewusst, dass es drei verschieden Arten des Dialoges geben muss. Kinder unterscheiden sich im Lerntempo, in der Art und Weise wie sie sprechen und den Voice Assistant verstehen. Kinder haben wie Erwachsene nicht alle in der Gleichen Schublade Platz und haben verschiedene Bedürfnisse.


Jon Bloom von Google arbeitet seit 20 Jahren mit Voice User Interfaces. Missverständnisse in der Kommunikation sind normal. Auch zwischen Menschen gibt es die tagtäglich. Aber gegenüber Voice Assistants haben wir Menschen scheinbar weniger Geduld. Wichtig ist, dass wir für diese Fehler eine Strategie haben und uns darauf vorbereiten.

Es gibt vier Arten von Fehlern bei Voice User Interfaces:

·       Spracherkennung

·       Sprecheridentifikation

·       Kontextfehler

·       Systemfehler

Eine seiner Aussagen brachte seinen Talk auf den Punkt:

„I use an audio signal and you reconstruct it – there’s what I said and what you understood. We can start thinking of it more and more of grounding or finding the common ground. Let’s call it grounding strategies and not errors.“


Andrea Muttoni von Amazon erlaubte uns einen Einblick in die Welt von Alexa, dem Voice Assistant von Amazon. Alexa ist überall! Man muss sich vom Gedanken lösen, dass Alex nur auf den Smart Speakern stattfindet. Mit den neuen Gadgets wie Beispielsweise: dem Ring (Echo Loop), den Alexa Buds oder der Brille welche vor kurzem vorgestellt wurden ist Alexa nun überall. Als Beweis erwähnte er den Amazon Smart Oven, welcher sich scheinbar sehr gut verkaufe. Ausserdem baut Amazon ein ähnliches Ökosystem auf wie wir es von den Apps auf dem Handy kennen. Neu kann man In-Skill-Verkäufe tätigen und so auch mit Voice-Apps Geld verdienen. Da sind wir jedoch noch ganz klar am Anfang.


Tom Hewitson von labworks ist ein erfolgreicher und unabhängiger Voice-App Entwickler. Er entwickelt mit seinem Team auf eigene Rechnung Voice-Apps und will mit In-App-Verkäufen Geld verdienen. Dies erweist sich momentan noch als schwierig. So zeigt er in einem Talk auf, was er in zwei Jahren Voice-Erfahrung gelernt hat:

  • “We don’t give people enough reasons to use the voice.“
  • „It’s not as easy as it sounds.“
  • „There’s a good chance no one will see what you’ve done.“ 

… sind in meinen Augen die drei wichtigsten.


Fazit: Die All About Voice Konferenz ist eine sehr lehrreiche Konferenz. Die Szene ist überschaubar und dennoch sieht man bereits welche Fortschritte Voice bereits gemacht hat. Wer sich früh mit dem Thema auseinandergesetzt hat, verspürt nun einen klaren Vorteil. Man sieht, dass sich viele Firmen mit einer Voice-Strategie bereits jetzt Gedanken machen und mit ersten Voice Apps Erfahrungen sammeln. Denn auch bei dieser Technologie braucht es Erfahrung und ein wenig Vorlaufzeit, um zumindest in einer grösseren Firma etwas bewegen zu können. Grundlagen, wie strukturierte Daten liegen nicht von heute auf Morgen bereit. Voice User Interfaces sind definitiv gekommen, um zu bleiben. Der Mensch akzeptiert sie, weil sie vieles vereinfach und schneller machen. Vor allem aber, weil die Sprache unsere angeborene Kommunikationsschnittstelle ist.

Bei Interesse am Thema können Sie gerne unverbindlich mit mir Kontakt aufnehmen.