Vidéo: 17 - Les sciences cognitives de l'apprentissage (Novembre 2024)
Ce qui m'a le plus surpris lors de la conférence Microsoft Build de cette semaine, c’est l’accent mis sur les services cognitifs et conversationnels, alors que Microsoft dévoilait sa vision de la transformation future de ces services en applications et tentait de convaincre les développeurs d’adhérer à cette vision.. Les utilisateurs finaux n’auront que peu conscience de la réalité. Pour l’instant, les fonctionnalités les plus importantes seront les améliorations apportées à l’assistant personnel Cortana et les nouvelles fonctionnalités d’encrage de «l’édition anniversaire» de Windows 10, prévue pour cet été. Mais la volonté de s’assurer que Microsoft suit ses rivaux en matière d’apprentissage automatique, d’agents intelligents et d’applications de messagerie s’adresse davantage aux développeurs pour le moment, car elle dispose déjà d’applications de base, mais elle a besoin d’un écosystème pour les rendre plus impressionnantes.
Le nouveau thème le plus important présenté par le PDG, Satya Nadella, était "les conversations en tant que plate-forme", ce qui semble impliquer de prendre des plates-formes de conversation - de Cortana à Skype, en passant par des applications tierces - et de leur apporter une intelligence supplémentaire. L'idée est d'ajouter de la compréhension, des préférences et en particulier du contexte à de telles applications.
Il a déclaré qu'il y avait trois acteurs principaux dans de telles conversations: les personnes, les assistants numériques et les robots. De personne à personne, il a parlé d'applications comme Skype Translate, qui permettent d'améliorer les conversations dans plusieurs langues. Un assistant numérique, a-t-il dit, saura tout sur vous sur plusieurs appareils et pourra vous aider dans vos tâches quotidiennes, telles que la planification de rendez-vous. Les robots sont de nouvelles applications avec lesquelles vous pouvez converser en langage naturel, et il a parlé d'une vision dans laquelle vous pouvez appeler des robots dans une conversation.
Tout cela mène à une nouvelle plate-forme, a-t-il déclaré, où le langage humain devient l'interface utilisateur, les bots deviennent les nouvelles applications, et les assistants numériques sont comme des "méta-applications", telles que le navigateur, existant en partie pour appeler d'autres applications., avec toutes ces applications, y compris l'intelligence. Il a ajouté que le changement de plate-forme serait aussi important que l'interface graphique, le Web ou l'interface tactile sur mobile.
Nadella a expliqué que la vision n'était pas "homme contre machine, mais plutôt homme avec machines", avec des personnes fournissant l'empathie, les émotions et les jugements, et des machines fournissant une puissance de calcul. Mais il a ajouté qu'il était important d'adopter une "approche de principe" en matière d'apprentissage automatique et de l'utiliser pour améliorer les capacités et les expériences humaines, être digne de confiance (en termes de confidentialité, de sécurité et de conformité), d'inclusion et de respect.
Sur le dernier point, il a déclaré qu'il était important que de telles applications représentent "le meilleur de l'humanité, pas le pire", et a souligné Tay, la tentative ratée de Microsoft d'introduire un bot bot la semaine dernière, qui a dû être supprimée un jour plus tard. quand il a commencé à répéter des remarques offensantes. Nadella a admis que la société s'était trompée en disant "nous avons rapidement réalisé que ce n'était pas à la hauteur", mais a déclaré que la société continuerait d'incuber de telles technologies, notant que ses bots en Chine et au Japon n'avaient pas les mêmes problèmes..
Parmi les nouveaux détails, citons Cortana qui arrive dans Outlook. Ainsi, il peut mieux comprendre votre courrier, vos contacts et votre calendrier et effectuer des tâches telles que le report de rendez-vous - une idée géniale, voire tout à fait nouvelle -, et être en mesure de suggérer des actions à effectuer ultérieurement. en fonction de votre calendrier, de votre courrier ou des conversations que vous avez eues. Et une nouvelle version de Skype maintenant disponible ajoute le support pour Cortana et peut supporter les robots dans ses discussions vidéo, pour transcrire par exemple des appels vidéo courts et être accessible pour tous types de services. Microsoft a appelé cela en utilisant Skype en tant que "canevas de conversation". Cela aussi ne semble pas être une idée nouvelle - des choses telles que WeChat et Facebook Messenger ont été bots depuis longtemps - mais cela montre comment Microsoft tente de transformer cela en une plate-forme. Il montre également comment cela peut fonctionner sur plusieurs plates-formes: la démonstration commence sur un PC Windows et se termine sur Skype sur un téléphone Android.
Mais l'essentiel de l'actualité semble concerner les nouvelles offres destinées aux développeurs, avec ce que l'on appelle désormais la Suite Cortana Intelligence (anciennement Cortana Analytics Suite, un bon exemple des termes qui font chaud au cours d'une année donnée).
Il s’agit d’une exécution exécutée sur la plate-forme Azure, qui inclut un cadre de bot, des services cognitifs et un apprentissage automatique.
La structure de bot facilite la création d'un bot ou la connexion à d'autres services. Les développeurs peuvent créer ceux-ci dans node.js ou C #, et une démonstration impliquait la création d'un bot qui commande des pizzas à Domino. Ce que j’ai trouvé le plus intéressant ici est qu’il s’agit d’un framework ouvert, avec des bots pouvant fonctionner non seulement dans Cortana et Skype, mais aussi dans Slack, Telegram, de simples SMS et d’autres services. Bien entendu, certains des services alternatifs les plus intéressants ne figuraient pas sur cette liste, notamment Siri d’Apple, Alexa d’Amazon, Messenger de Facebook ou WhatsApp.
Une autre démo a montré comment certains outils à venir faciliteront l’ajout ou la modification de règles pour les bots et leur compréhension du langage naturel. Cela peut suggérer d'autres mots que les gens pourraient utiliser et qui ont des significations similaires, utiliser la compréhension du langage naturel basée sur l'apprentissage automatique pour améliorer le vocabulaire au fil du temps, ou transmettre des demandes à un assistant humain si le bot ne comprend pas quoi faire.
Enfin, la société a introduit un ensemble beaucoup plus vaste de services cognitifs, passant de 22 services distincts à 5 l'année dernière. Ces services couvrent un large éventail de scénarios, notamment la reconnaissance d'objet, la parole, les connaissances et la recherche. Un exemple concerne un robot de sous-titrage qui ajoute des sous-titres aux images, en combinant la reconnaissance d’objets et le langage naturel. Un autre outil appelé CRIS (Custom Recognition Intelligence Service) semblait bien mieux convertir les paroles en texte que les méthodes conventionnelles. Enfin, ils ont démontré en utilisant des outils d’analyse sur des flux Twitter, échantillonnant des images de profil afin de déterminer l’âge et le sexe d’une affiche.
Bien entendu, Microsoft a également annoncé la création de divers autres outils destinés aux développeurs. Il est donc évident que Windows doit être la plate-forme qu'ils utilisent pour développer des applications, quelle que soit leur plate-forme. Le plus surprenant de ces nouveaux outils - du moins jusqu'aux rumeurs la semaine dernière - est l’ajout du shell BASH sous Linux, mais d’autres outils incluent un convertisseur d’applications de bureau permettant de migrer les applications de bureau Win32 traditionnelles vers de nouvelles applications Universal; Un grand coup de pouce pour les outils de développement croisé Xamarin, suggérant aux développeurs de créer le noyau d’une application multiplate-forme et les modifications spécifiques à chaque environnement, y compris Android, iOS ainsi que Windows, le tout sur une plate-forme Windows.
En outre, Microsoft a présenté le "mode dev", un outil permettant de transformer une Xbox One en une machine de la plate-forme de développement actuellement disponible; et a déclaré que la première version de HoloLens était également disponible pour les développeurs à partir d'aujourd'hui.
Nadella a commencé la matinée en expliquant comment nous discutions davantage du rôle de la technologie dans notre société, car la technologie est devenue un courant dominant et intégré dans notre vie quotidienne, nos entreprises et nos économies. Il a dit qu'il y avait des questions à savoir si la technologie est le moteur de la croissance économique pour tous, ou si la croissance économique a stagné en dépit des dépenses consacrées à la technologie; si est-ce que cela crée des emplois ou les déplace? et si cela permet ou empêche des valeurs durables, telles que la vie privée.
"Je suis un optimiste", a-t-il déclaré, estimant que la technologie pouvait stimuler la croissance économique dans le monde entier, renforcer notre autonomie au quotidien et soutenir notre valeur durable. Pour ce faire, a-t-il déclaré, nous devons nous assurer que nous utilisons la technologie de manière à ce que cela corresponde à la déclaration de mission actuelle de Microsoft, qui consiste à "responsabiliser chaque personne et chaque organisation de la planète pour en faire plus." Ceci, a-t-il dit, doit commencer par les développeurs.
Il a conclu la conférence en montrant une vidéo montrant comment Saqib Shaikh, développeur aveugle chez Microsoft, a pu utiliser des techniques cognitives avec les lunettes intelligentes Pivothead pour obtenir des informations sur le monde qui l’entoure. Par exemple, entendre des gens jouer dans un parc et glisser ses lunettes pour entendre qu’il s’agissait d’une jeune fille en train de lancer un frisbee. Ceci est juste un projet de recherche maintenant, mais c'était assez inspirant, et Nadella a amené le développeur sur la scène.
Pour moi, le discours liminaire était un mouvement vers la création de nouvelles plateformes basées sur l'apprentissage automatique et sur des robots, ainsi que la reconnaissance du fait que, malgré le succès remporté par Windows, Microsoft est loin d'être dominant dans le cloud et a pratiquement perdu la bataille. devenir une importante plateforme de téléphonie mobile. (En effet, une seule démo de l'intégralité du discours a été réalisée sur Windows Phone, il s'agissait d'une démo sur Skype qui aurait pu être réalisée sur Android aussi facilement.) Il n'est donc pas surprenant que Microsoft se tourne vers la prochaine plate-forme, où, bien sûr, il fera face à la fois aux concurrents traditionnels et nouveaux.