Vidéo: Traduction vocale simultanée Skype (Novembre 2024)
Si vous suiviez la révolution informatique depuis la création du microprocesseur, vous sauriez qu'il existe un certain nombre de promesses non encore remplies.
L’un d’eux est le discours traduit à la volée, où vous dites quelque chose en anglais et qui est répété dans une autre langue, comme l’espagnol, presque en temps réel. Bien qu’il reste un travail en cours, Microsoft est maintenant un peu plus près avec Skype Translator, dont la première phase a été lancée cette semaine.
Si cela est proche du travail et n'est pas une blague, c'est le produit de la décennie. À l’heure actuelle, Skype Translator prend en charge les traductions espagnol vers anglais et anglais vers espagnol, mais d’autres langues suivront.
Le problème typique avec ce genre de choses est le niveau de difficulté scandaleux. Je n'ai pas encore vu de logiciel de traduction décent qui effectue des traductions texte à texte qui fonctionnent bien. La traduction vocale a un niveau de difficulté totalement différent, surtout en temps réel.
Microsoft a un film montrant deux enfants parlant espagnol et anglais qui donne l’impression que cela fonctionne bien. Mais j’ai vu un système similaire présenté par IBM il y a près de 20 ans et qui n’a jamais vu le jour. La version d'IBM a été développée dans les années 1990, à l'époque de la folie de la reconnaissance vocale dirigée par Lernout & Hauspie, une entreprise qui s'était lancée dans la faillite - avant de s'en prendre à un scandale de fraude en 2001. Avant cela, elle achetait toutes les technologies de la parole. société qu'il pourrait, y compris Dragon Systems, Berkeley Speech Technologies, Fonix, Dictaphone, etc. Microsoft détenait une participation de 8% dans L & H et certaines de ces technologies en ont fait un cadeau de départ.
Regardez les misérables traductions informatiques de texte à texte effectuées par Google et d'autres. Le texte n'empêche pas et ne peut éviter les erreurs les plus évidentes. Rien de tout cela n'aborde la complexité de la traduction de la parole, qui implique un traitement de signal lourd.
Je suis un collectionneur de vin et visite fréquemment les sites Web de vignobles français. Mon français est correct, alors j’utilise souvent la traduction pour accélérer la lecture du site. Nous sommes en 2014 et aucun des traducteurs ne peut comprendre que la traduction de Château Margaux soit Château Margaux, pas Château Margaux. Dans quelle mesure est-il difficile de ne pas traduire et de ne pas traduire un mot communément utilisé, utilisé dans un nom propre, tel que château, faisant généralement référence à une cave donnée, en mot château? Apparemment c'est impossible. Ils le font tous.
Est-il difficile d'écrire une exception dans le code qui indique au traducteur que c'est sur un site Web sur le vin de Bordeaux? Sur ce site, le mot château ne signifie pas château. Souvent, le traducteur essaiera de décoder le reste du nom du château, avec des résultats ridicules. Le mieux que vous puissiez généralement faire avec la traduction de texte est de vous faire une idée de ce que dit le site.
Demandez-vous: si le texte est si difficile, comment Microsoft gérera-t-il la parole?
C'est presque impossible, même dans la même langue. Prenez le service téléphonique Google Voice. Il a une fonction de prise de parole de texte. Je n'ai jamais reçu de message vocal qui se rapproche même de ce que la personne a réellement dit. Pas une fois.
Je vous avouerai que dans une pièce calme, lorsque vous parlez distinctement et clairement, la reconnaissance vocale fonctionne bien. Je l'utilise pour les messages texte sur mon téléphone Android. Mais dans une vraie conversation, personne ne parle comme ça. J'admire Microsoft pour avoir dévoilé ceci. Mais cela ne fonctionnera pas comme annoncé.
Cela dit, il y a au moins de quoi jouer avec. Cela pourrait même déclencher une nouvelle génération de recherche. Donc, je ne me plaindrai pas trop.
Tout le monde veut ça. Revenons au travail là-dessus.