Résumé de section

    • 1. Définition

    • Bulb

      Le traitement automatique du langage naturel [TALN] est un domaine multidisciplinaire impliquant la linguistique, l'informatique et l'intelligence artificielle. Il vise à créer des outils capables d’interpréter et de synthétiser du texte pour diverses applications. 

    • 2. Le TAL(N) au quotidien

    • Sans même nous en rendre compte, nous, grand public, bénéficions au quotidien des avancées en TAL. Ces dernières ont permis le développement d'une myriade d'applications que nous utilisons dans notre vie privée et/ou professionnelle.

      Pour en savoir plus sur quelques applications issues des recherches et développements en TAL, consultez l'infographie interactive ci-dessous :

    • Les applications présentées ci-dessus existent déjà, et la plupart d'entre nous les utilisent quotidiennement. Cependant, les progrès en TAL ne cessent de croître, la puissance de calcul des machines également, et de nouvelles applications sont en cours de développement.

    • Traduction instantanéeapprentissage d'une langue étrangère grâce à la réalité augmentée, communication par la pensée... Pour en savoir plus sur les technologies du langage de demain, vous pouvez visionner ces courtes vidéos (en anglais), de moins de 3 minutes chacune, réalisées par le réseau de coopération européenne LITHME (Language In The Human-Machine Era)

    • 3. Outils informatiques de TAL

    • Pour développer des applications, il faut d'abord développer des outils informatiques, c'est-à-dire des programmes spécialisés sur une tâche particulière. Ces programmes spécialisés sont les pièces détachées du développement numérique. Ils permettent de construire des applications. Mieux ces outils fonctionnent, plus il est aisé de développer des applications.

      Consultez l'infographie interactive ci-dessous pour en savoir plus sur ces outils : 

    • Les informaticiennes et les informaticiens qui développent ces outils n'ont pas nécessairement besoin de parler la langue pour laquelle ils les développent. L'expertise linguistique est surtout déployée en amont, lors de la première étape du développement TAL : la production de ressources, c'est-à-dire de corpus numériques. Il peut s'agir de textes mais aussi de lexiques, de dictionnaires, d'enregistrements, etc.

    • 4. Les 3 étapes du développement TAL

    • Le développement TAL est construit en trois étapes :

    • Schéma des trois étapes de développement TAL : production de ressources, développement d'outils, développement d'applications

    • Les ressources, qui sont les données langagières produites par la communauté parlante et que l’on peut capturer sous forme numérique, sont à la base du développement TAL. Sans ressources, il n'est pas possible de développer des outils informatiques et encore moins des applications. Cette première étape, cruciale, de constitution de ressources ne demande pas de connaissances profondes en informatique mais des connaissances dans la langue. 


    • Les langues minorisées sont bien souvent sous-représentées et sous-utilisées sur le web. Elles souffrent ainsi d'un manque cruel de ressources pour alimenter des développements d'outils et d'applications. Pour pallier à ce manque, il faut collecter et produire des corpus.