Text and data mining

Le text and data mining (ou fouille de textes et de données) désigne un ensemble des traitements automatisés consistant à extraire et à analyser des informations (textes, données, sons, images…) contenus dans des corpus numériques importants, afin d’en dégager de nouvelles connaissances. Le TDM représente un enjeu majeur d’innovation et de positionnement concurrentiel pour la recherche.

La croissance exponentielle des données numériques complique en effet lourdement la tâche des chercheurs dans leurs recherches et dans leur veille informationnelle. Il leur est humainement difficile, d’exploiter et d’analyser manuellement, des volumétries informatives importantes dans l’ensemble de la production scientifique.

Le TDM est pris en compte dans la loi pour une République numérique avec l’ajout d’une nouvelle exception au droit d’auteur dans l’article 18bis.

» Accueil du glossaire