Synopsis
Chaque mois, plus de 250 000 internautes améliorent les projets Wikimedia. Cette gigantesque œuvre de diffusion des connaissances met à disposition du plus grand nombre des millions d'articles encyclopédiques via Wikipedia, des millions de définitions lexicographiques via Wiktionnaire, des dizaines de millions de médias via Wikimedia Commons, des milliers d'ouvrages anciens via Wikisource et une très grande base de données factuelles via Wikidata. Ces contenus sont proposés en anglais, français, espagnol mais également dans des langues moins présentes sur Internet. Enfin, tous ces contenus sont librement réutilisables. Ces trois caractéristiques – un corpus très riche, multilingue et librement réutilisable – font de ces données ouvertes un matériau de premier choix pour les chercheurs.
Ce cours est une introduction aux outils pour la recherche en lien avec les projets Wikimedia. Dans un premier temps, nous ferons brièvement un tour d'horizon de ce qu'il est possible de faire en matière de visualisation à partir des données issues des projets Wikimedia. Dans le chapitre 2, nous présenterons les principales sources de données ouvertes. Le chapitre 3 est consacré aux différentes possibilités permettant de récupérer ces données. Nous veillerons à présenter des outils ne nécessitant pas de compétences informatiques poussées. Le chapitre 4 aborde les outils pour importer des données et contenus sur les projets Wikimedia. Le chapitre 5 récapitule les outils présentés. Et nous conclurons par un chapitre de présentation des lieux d'entraide.
Le cours a été pensé et conçu pour être suivi de façon linéaire et progressive ou de manière fragmentée et en fonction de vos besoins. Il est constitué de plusieurs chapitres gérés dans Moodle sous forme de livres. La table des matières sur la droite vous permettra de naviguer entre les différentes parties du cours. Vous pourrez également tester vos connaissances à l'aide d’exercices ludiques et variés.
Ce cours fait partie d'un ensemble de formations en ligne « Wikimedia et la Science Ouverte » conçues dans le cadre des résidences Wikimedia au sein de l'Urfist de Bordeaux, l'Urfist de Bretagne et Pays de la Loire et l'Urfist Occitanie. Il s'agit d'une version enrichie de l'intervention faite par Delphine Montagne (UMR TREE) et Pierre-Yves Beaudouin lors du wébinaire Tuto@Mate organisé le 12 juin 2023 par le réseau métier Méthodes Analyses Terrains Enquêtes en SHS (Mate-shs). Le cours a été étoffé lors de la résidence Wikimédia à l'Urfist méditerranée et suite à une formation à l'Urfist de Lyon avec Delphine Montagne.
Objectifs pédagogiques
-
Identifier les données ouvertes des projets Wikimedia ;
-
Identifier les principaux outils d'import et d'export des données Wikimedia ;
-
Découverte de l'interface des outils ;
-
Trouver l'information en cas de problème et identifier les lieux d'entraide utiles.
Forum
Mise en ligne : février 2024
Durée : 30 heures
Licence : CC BY-SA 4.0
Public : enseignants-chercheurs, doctorants, professionnels de l'information
Prérequis : aucun
Modalité : autoformation à distance
Auteur : Pierre-Yves Beaudouin
Contact : pierre-yves.beaudouin@univ-cotedazur.fr
Mises à jour :
- janvier 2025 : consultation des médias, moteur de recherche, mix'n'match
- mars 2025 : donnés ouvertes (introduction et sources de données), export XML, Python, import de fichiers,