Résumé de section

    • Recommandations

    • Au moment de choisir un entrepôt dans lequel déposer ses données de recherche, il est recommandé de privilégier dans cet ordre :

      • un entrepôt disciplinaire,
      • un entrepôt institutionnel,
      • l'entrepôt national Recherche Data Gouv,
      • un autre entrepôt pluridisciplinaire.

      Il faut veiller à choisir en priorité des entrepôts en libre accès et qui présentent des garanties en matière d'indexation, de signalement et de conservation des contenus.

      Si vous déposez vos données de recherche dans un entrepôt disciplinaire (ici, en linguistique), vous pourrez vous appuyer sur des standards et des vocabulaires contrôlés adaptés aux données de votre discipline. Ceci facilitera grandement la préparation, la documentation et le dépôt des données. 

    • Critères de choix

    • Pour choisir l'entrepôt qui convient le mieux à vos besoins et à votre situation à un instant t, vous pouvez vous référer à des critères
      Par exemple, les fiches d'identité d'entrepôts proposées dans ce cours sont construites sur la base d'une vingtaine de critères : 

      • Le dépôt ou l'accès aux données est-il payant
      • L'entrepôt a-t-il reçu une certification ?
      • Existe-t-il une restriction sur les types de formats de fichiers acceptés ?
      • L'entrepôt attribue-t-il automatiquement un identifiant pérenne aux données ? 
      • La mention d'une licence est-elle obligatoire ?
      • ...

    • Dans le fichier pdf ci-dessus, vous retrouverez la liste complète des critères retenus pour les fiches de ce cours, ainsi que les icônes associées.

    • Vous trouverez quelques idées de critères supplémentaires dans ces deux ressources :

    • Il est possible que des entrepôts vous soient recommandés : dans votre communauté disciplinaire, par votre institution, par un financeur... Dans tous les cas, le choix final de l'entrepôt revient au chercheur.

    • Entrepôts de données en linguistique

    • ORTOLANG (Outils et Ressources pour un Traitement Optimisé de la LANGue)
    • ORTOLANG est un entrepôt de données reconnu et de confiance pour les ressources et outils sur la langue écrite et orale. Sa plateforme est hébergée en France par la TGIR Huma-Num

      Toutes les ressources déposées sur ORTOLANG sont moissonnées par le Virtual Language Observatory de CLARIN.

      Pour plus d'informations sur cet entrepôt, explorez la fiche ci-dessous :

    • CoCoOn (Collection de Corpus Oraux numériques)
    • CoCoOn est un entrepôt de données reconnu et de confiance pour les corpus oraux. Sa plateforme est hébergée en France par la TGIR Huma-Num

      Il est régulièrement moissonné par des catalogues ou moteurs de recherche tels que :

      Pour plus d'informations sur cet entrepôt, explorez la fiche ci-dessous :

    • Autres entrepôts en linguistique
    • CLARIN (Common Language Resources and Technology Infrastructure) est une infrastructure européenne créée en 2012 dédiée au partage de ressources et d’outils autour du langage. Elle s’organise comme une fédération de centres offrant des données, des services et des compétences, dont des entrepôts :

    • Vous pouvez également consulter cet annuaire et ce catalogue, plus généralistes, qui recensent davantage d'entrepôts et effectuer une recherche par discipline :


    • Un chercheur en linguistique a le choix entre de nombreux entrepôts de données. Une liste de critères facilitera le choix d'un entrepôt correspondant le mieux à vos besoins. L'étape suivante est la préparation des données pour le dépôt