Couverture de HERM_082

Article de revue

Les machines apprennent les langues

Pages 81 à 82

1Dans le domaine des technologies de l’information et de la communication, le traitement automatique des langues a connu des progrès déterminants ces dernières années, que ce soit pour la langue parlée, la langue écrite ou la langue des signes. Ces progrès ont été permis par l’avancée de recherches initialisées il y a plus de 50 ans. Les approches à base de connaissance, où l’on essayait de décrire et de modéliser les connaissances linguistiques, ont longtemps dominé le champ scientifique avant que ne s’imposent les méthodes par apprentissage, statistique ou neuronal, qui ont conduit à l’existence actuelle de systèmes dont la qualité est suffisante pour qu’ils soient utilisables à grande échelle dans des applications que l’on pressentait au début des années 1980. Les méthodes d’apprentissage supervisé ont été appliquées dès les années 1970 en reconnaissance vocale. Elles consistent à alimenter la machine avec d’une part des signaux de parole et d’autre part les mots auxquels ils correspondent. La machine, telle une boîte noire, apprend à effectuer cette mise en correspondance. Elle peut alors reconnaître les mots prononcés malgré les différences liées au locuteur ou aux conditions de prises de son, à la condition qu’ils aient été appris. La qualité de la reconnaissance sera donc liée à l’ampleur des données qui auront été utilisées pendant la phase d’apprentissage et au soin que l’on aura pris à enregistrer un grand vocabulaire, différentes voix, d’hommes, de femmes ou d’enfants, différents accents ou différentes ambiances acoustiques.

2La nécessité cruciale de disposer de données d’apprentissage en nombre, qui a fait dire qu’il n’y a pas de meilleures données que plus de données, a entraîné la mise en place de centres spécialisés dans la production et la distribution de données. La modélisation des entités à reconnaître a été améliorée tout d’abord par une représentation statistique à la fin des années 1970. Les approches par réseaux de neurones apparues dans les années 1980 n’ont tout d’abord pas permis d’obtenir une meilleure qualité et sont donc restées au second plan. Les progrès de la puissance des ordinateurs autorisant l’utilisation de réseaux de neurones dits « profonds » plus complexes et la disponibilité de très grandes masses de données ont permis au début des années 2010 d’améliorer les résultats et de produire des systèmes qui répondent aux besoins d’applications grand public. Cette même approche a été utilisée dans d’autres domaines du traitement de la parole, comme la reconnaissance du locuteur ou la synthèse vocale, et a été étendue à d’autres modalités de communication : traduction automatique (ici, la machine apprend à mettre en correspondance des textes avec leur traduction réalisée par un traducteur dans une autre langue) ou reconnaissance d’images (elle apprend à mettre en correspondance des images constituées d’un ensemble de pixels avec le nom d’une personne, par exemple, ou des séquences vidéo avec le nom de l’action correspondante). Progrès de la recherche, puissance des ordinateurs, augmentation de la taille des données auront donc été des facteurs déterminants.

3La recherche européenne se situe au meilleur niveau, comme l’attestent les résultats des campagnes d’évaluation internationales régulièrement organisées. Cependant, l’absence des industriels européens sur la scène internationale où prédominent les industriels américains – Google, Apple, Facebook, Amazon, Microsoft (GAFAM) – et depuis peu leur équivalent asiatique – Baidu, Alibaba, Tencent et Xiaomi (BATX) – est très préoccupante dans un marché mondial où les frontières s’effacent. Ces industriels déploient actuellement des produits d’interaction vocale dans les foyers, comme Google Home, Apple HomePod, Amazon Alexa ou MS Cortana, selon une stratégie d’une grande efficacité : cela leur permet de moissonner de très grandes quantités de données, avec de grandes variantes de locuteurs, de langues, d’accents, de dialectes, d’ambiance sonore, de dialogues, d’applications, et ainsi d’améliorer la qualité de leur système, ce faisant d’augmenter le nombre d’utilisateurs et de moissonner encore plus de données. Cela établit un lien direct entre la recherche et les données, même si la qualité n’est pas encore parfaite, ce dont se contentent les applications actuelles. L’enjeu est de taille car l’interaction avec la machine est le point d’entrée du commerce en ligne – réservation de billets de transports ou de spectacle, commande de produits, écoutes musicales, etc. – mais aussi de l’accès à l’information et au savoir.

4Si la qualité des systèmes autorise leur utilisation pour certaines applications, le problème est encore loin d’être résolu dans son intégralité. Certes, la reconnaissance vocale fonctionne convenablement dans des ambiances peu bruitées et pour des locuteurs parlant avec soin, et la synthèse vocale a atteint une qualité parfois proche de la voix humaine, mais aucun système n’est encore capable de mener un véritable dialogue comme le ferait un humain. De même, un système de traduction automatique offre parfois des résultats voisins de ceux d’un traducteur professionnel, mais produit aussi des traductions qui déclenchent l’hilarité. Il est donc essentiel de pouvoir évaluer la qualité des systèmes pour mesurer les progrès accomplis et vérifier qu’ils répondent aux besoins de l’application que l’on vise : s’il est acceptable d’avoir une traduction approximative, mais immédiate et gratuite, d’un message dont on veut avoir une idée du sujet, on ne pourra s’en contenter pour traduire un roman, par exemple.

5Une autre limite concerne les langues qui sont traitées. Sur les 7 000 langues parlées dans le monde, seules 1 à 2 % (une centaine de langues) sont équipées de technologies pour les traiter avec une qualité suffisante. Parmi les langues européennes, seule la langue anglaise est relativement bien dotée de technologies et de ressources pour les produire. Beaucoup de langues sont sousdotées, certaines étant considérées en danger d’extinction numérique. Les technologies de la langue peuvent soit accentuer ce phénomène – en entraînant par leur absence une fracture numérique, car s’il faut passer de sa langue maternelle à une autre langue pour utiliser son téléphone ou son GPS, cela réduit son utilisation et accélère sa disparition – soit le corriger – écrire un article scientifique dans sa langue maternelle en pouvant être lu par d’autres chercheurs qui ne la parlent pas, grâce à une traduction automatique de qualité, éviterait que 96 % des articles scientifiques référencés dans les grandes bases de données scientifiques soient actuellement en anglais. Comment faire pour couvrir toutes les langues ? Cela représente un énorme effort. Les industriels du domaine sont prêts à l’accomplir pour les langues qui présentent un intérêt commercial, mais sans doute pas pour celles parlées par une faible population. L’enjeu est donc politique, culturel, mais aussi scientifique.

6L’enjeu des recherches est à présent de traiter le sens ; pouvoir réellement comprendre afin de conduire un dialogue, en particulier avec un assistant personnel ou un robot. Les possibilités qu’offrent les approches neuronales rendent envisageable le développement de systèmes d’apprentissage non supervisé multimodal d’une langue, utilisant différentes modalités de communication (langue, vision, geste), capables d’émotion, d’action et d’interaction. Et ces progrès devraient donner aux linguistes les données et les outils leur permettant de résoudre l’arcane de la structure et du fonctionnement des langues.


Date de mise en ligne : 03/12/2018

https://doi.org/10.3917/herm.082.0081

Domaines

Sciences Humaines et Sociales

Sciences, techniques et médecine

Droit et Administration

bb.footer.alt.logo.cairn

Cairn.info, plateforme de référence pour les publications scientifiques francophones, vise à favoriser la découverte d’une recherche de qualité tout en cultivant l’indépendance et la diversité des acteurs de l’écosystème du savoir.

Retrouvez Cairn.info sur

Avec le soutien de

18.97.14.83

Accès institutions

Rechercher

Toutes les institutions