3. Outils d'interrogation de base de données
3.1. Quarry (SQL)
Documentation | Outil |
---|
Quarry (quarry.wmcloud.org) est un outil de Wikimedia Foundation permettant d'exécuter des requêtes SQL sur des répliques des wikis. Le SQL (Structured Query Language) est un langage informatique permettant de communiquer avec une base de données. La réplication des données est généralement instantanée. Il est également possible d'accéder aux Wiki Replicas via Toolforge et Cloud VPS.
Pour ne pas surcharger le serveur, Quarry est doté d'un temps d’exécution limité, empêchant certaines requêtes de s’exécuter. Cela touche particulièrement les gros wikis, comme la Wikipédia francophone ou Wikidata. Cet outil demeure difficile à utiliser sans connaître le langage SQL, mais la possibilité de visualiser les requêtes des autres utilisateurs simplifie un peu l’outil. Il est également possible de demander de l'aide sur la Wikipédia anglophone pour rédiger une requête : Wikipedia:QUARRY.
Exemples
Il est possible de faire des requêtes SQL pour analyser les contributions et répondre à ce genre d’interrogations :
- Quelle est la page la plus modifiée de la Wikisource en suédois ?
- Liste des 30 comptes les plus actifs sur la Wikipedia francophone (depuis 90 jours)
- Liste des 100 traducteurs les plus actifs sur la Wikipedia francophone (via l'outil Content Translation)
- D'autres requêtes concernant l'outil de traduction du contenu
- Quelle est la durée moyenne entre deux éditions de l'article “Insomnie” entre 21 h et 7 h ?
- Liste des articles renvoyant vers persee.fr
- Pages du site insee.fr les plus mentionnées
- Sites web les plus mentionnés sur les articles des communes françaises
- Nombre d’articles supprimés par jour sur la Wikipédia en français