Alexa et le progrès des technologies de conversation automatisée (2017)
Voici une autre tendance lourde qu’on avait prédit pour 2017 et qui semble bien s’avérer : celle des assistants personnels. Loin des débuts de Siri d’Apple en 2011, la technologie derrière ce type de produit/service a en effet énormément progressé et le marché s’est grandement diversifié.
Voici Alexa…
Alexa, le service vocal de l’assistant personnel Echo d’Amazon, a pris beaucoup de galon dans les dernières années ; Amazon a en effet vendu environ 10 millions de systèmes Echo-Alexa. De prime abord, ce chiffre peut paraître modeste lorsque comparé à ceux de Siri ou de l’assistant Google, étant donné que ces derniers sont livrés par défaut avec des centaines de milliers de téléphones intelligents… Mais Amazon a de grandes ambitions pour Alexa : le géant affirme clairement souhaiter que le service devienne LE plus utilisé parmi les assistants vocaux. Et disons que l’entreprise a également les moyens et les ressources pour le réaliser. Comment ? Entre autres, à travers la plateforme de développement d’Alexa, Amazon Lex.
… et son frère Lex
En mode « aperçu » depuis la fin de 2016, Lex vient d’être rendu disponible à tous les développeurs qui voudraient intégrer la technologie de conversation automatisée (pour faire des « chatbots ») à leurs propres applications.
Le directeur technique (CTO) d’Amazon, Werner Vogels, a expliqué que l'outil Lex connaissait présentement « une accélération massive. Le truc cool d'avoir le service qui tourne sur le cloud, plutôt que dans votre centre de données ou encore sur votre propre ordinateur, c’est la possibilité d’améliorer Lex en continu, au travers l’expérience des millions de personnes qui s’en servent. »
Lex devient même un modèle d’affaires supplémentaire pour Amazon, qui compte facturer aux développeurs en fonction du nombre de messages vocaux ou textuels envoyés à la plateforme par les applications. La plus grande source de revenus pourrait toutefois plutôt provenir d’applications de « chatbots » reliées au commerce électronique, un phénomène relativement nouveau mais en forte croissance.
Un langage de plus en plus « naturel »
Un des autres avantages d’Alexa, c’est sa capacité à s’adapter de plus en plus selon le contexte des « conversations ». Les développeurs d’Amazon mettent en effet à profit les possibilités du langage normalisé SSML, ou Speech Synthesis Markup Language, et incluent de nouvelles possibilités de communication qui dépassent la simple utilisation du langage.
Dans un futur proche, Alexa pourra chuchoter, remplacer un mot faisant partie de son « script » par un autre, dire des gros mots et même « bipper » ceux-ci, modifier la cadence et le volume pendant une conversation afin de mettre l’accent sur une affirmation en particulier, effectuer des pauses et changer son intonation. Les geeks curieux peuvent même tester ces nouvelles fonctions dans un jeu quiz à bâtir.
Une dernière innovation pour donner « encore plus de personnalité » à Alexa, qui fait, semble-t-il, souvent des blagues et se met même à chanter de temps à autre : l’introduction de nouveaux « speechcons » pour des marchés autres que celui des États-Unis.
Les speechcons sont des expressions et des locutions spéciales qu’un assistant vocal sait comment prononcer d’une manière plus expressive, afin de rendre ses interactions avec les humains plus réalistes et surtout plus attachantes. Alexa en « connaît » déjà plusieurs en anglais, par exemple « Yay! », qui doit être prononcé avec un certain enthousiasme ainsi qu’une insistance sur la finale, ou encore « Abracadabra », dont l’accent tonique n’est pas nécessairement intuitif.
Alexa sera donc bientôt en mesure d’ajouter des expressions régionales pour ses utilisateurs britanniques, par exemple l’interjection « Blimey! ». Certains speechcons ont de plus été ajoutés, pour la première fois, dans une langue étrangère. Et ce n’est pas une langue asiatique qui a été sélectionnée, mais l’allemand, un langage particulièrement truffé d’expressions idiomatiques du genre « Na und? », qu’on pourrait traduire par « Et puis après? » et qu’il est très important de prononcer avec un ton moitié défiant, moitié dépité.
Que ce soit à travers Alexa ou un autre produit, il ne faudrait certainement pas sous-estimer l’importance des technologies vocales dans l’écosystème informatique des années à venir. Selon Gene Munster, analyste en chef chez Loup Ventures, « la voix jouera un rôle majeur dans l’interface des ordinateurs de demain… Et quiconque possèdera la voix sera également maître du commerce. »
Alexa, or the progress of automated conversation technology
Here’s yet another one of our predictions for 2017 that seems to be coming to fruition: the rise of personal assistants. Since Apple’s Siri in 2011, the technology powering this product/service has come a long way, and the market is now competitive.
Introducing Alexa…
Alexa, the voice service of the Amazon Echo personal assistant, has taken the world by storm, with Amazon selling some 10 million Echo-Alexa systems. At first glance, the figure may seem slight compared to the sales posted for Siri or the Google assistant, which come standard with hundreds of thousands of smartphones. But Amazon has big plans for Alexa, predicting its service will become THE most widely-used voice assistant. Needless to say, Amazon has the means and resources to back that up. And how will it ensure Alexa’s success? Thanks to its development platform, Amazon Lex.
… and big brother Lex
Amazon Lex, which had been in preview phase since late 2016, has just been made freely available to all developers so that they can build automated conversation technology, or chatbots, into their own applications.
“There's massive acceleration happening here”, said Amazon’ CTO, Werner Vogels. “The cool thing about having this running as a service in the cloud instead of in your own data center or on your own desktop is that we can make Lex better continuously by the millions of customers that are using it.”
Lex has turned into a new revenue stream for Amazon, which charges developers based on the number of voice or text requests their applications send to its platform to process. But a greater source of income could be chatbot e-commerce applications, a new but growing trend.
Towards more “natural” language
Another of Alexa’s advantages is its ability to evolve and adapt to conversation context. Amazon’s developers are making full use of a standardized markup language called Speech Synthesis Markup Language, or SSML, which provides for new communication capabilities that go beyond just using words.
In the very near future, Alexa will be able to whisper, replace words that are part of its “script”, swear or on the contrary “bleep” out swearwords, adapt the speed and volume of any part of a conversation to stress any particular part of speech, pause, and change intonation. Curious geeks can test this feature in a new quiz game.
And one final innovation that further “humanizes” Alexa, which already cracks jokes and sings, is the introduction of new “speechcons” for markets other than the U.S.
Speechcons are special words and phrases that voice assistants know to express in a more colourful way to make their interactions with humans more engaging and personal. Alexa already knows several in English, for example “Yay!”, spoken enthusiastically and with the stress on the final vowel, or “Abracadabra”, whose tonic stress is not intuitive.
Alexa will soon add regional expressions to its vocabulary, for example “Blimey!” for British users. And for the first time, new speechcons have been added in a foreign language, but not an Asian one! German is a language that is particularly rich in idiomatic expressions, such as “Na und?” (“Yes, and…?”), which must be pronounced half defiantly, half enviously.
Be it Alexa or another product, vocal technology will remain a major trend in the IT ecosystem in years to come: “Voice is a big part of the computer interface of the future,” said Gene Munster, an analyst at Loup Ventures. “Whoever owns voice will be the gateway of commerce.”