Introduction to Digital Humanities

J’ai suivi ces dernières semaines le MOOC de Harvard, Introduction to Digital Humanities, sur la plateforme EDX. C’est un très bon cours pour découvrir le sujet et en comprendre les multiples facettes. Le cours n’est malheureusement plus accessible, tout a été retiré après huit semaines environ (l’accès aux archives est disponible moyennant 99$). Il sera probablement repris, d’où ce billet.

Le MOOC est structuré en cinq axes. Après un rappel sur l’histoire de la discipline, le premier axe est constitué de plusieurs présentations de projets en humanités numériques, avec des retours d’expériences de chercheurs et de bibliothécaires. Des projets de musées sont également présentés.

Le second axe porte sur les outils auxquels les chercheurs ont eu recours. Démonstrations d’encodage de texte en TEI et utilisation de Gephi sont à l’honneur dans cette partie du cours. Rien de neuf si vous travaillez en BU et que vous faites de la veille régulièrement, vous avez comme moi déjà entendu parler de ces outils, même sans les avoir testés. Ce qui m’a sans doute le plus intéressée est le retour d’expérience d’une historienne qui a travaillé sur des cartes historiques de l’empire russe. La chercheuse a travaillé à reprendre de nombreuses cartes historiques, afin de fournir des outils d’analyse sur la démographie et bien d’autres données à l’époque de l’empire russe. Elle explique sa démarche et son apprentissage des outils de GIS (Geographic Information Systems) et c’est assez passionnant.

Le troisième axe du cours est beaucoup plus technique. Il est consacré aux données, à leurs types, à leur structuration et à la façon de générer des données. Contrairement aux modules précédents, presqu’exclusivement constitués de vidéos, ce chapitre est plus aride, avec des définitions et des bouts de code. Vous n’ignorerez plus rien des API et de l’OCR si vous le suivez correctement. Plusieurs vidéos sont consacrées à la question des licences et du copyright, avec une assez longue présentation des Creative commons.

Dans l’axe quatre, on apprend à, soyons fous, installer une machine virtuelle sur laquelle installer Ubuntu, puis à apprivoiser sur celle-ci les lignes de commande de base. Si vous utilisez pandoc pour convertir vos fichiers, vous aurez déjà testé certaines des commandes et ne serez pas surpris. Les vidéos qui permettent ensuite d’exploiter des données, comme par exemple rechercher des occurrences dans un poème, sont loin d’être toutes accessibles. Dans la version gratuite du cours, on dispose des fonctionnalisés de base, mais on ne peut guère en découvrir davantage sans s’acquitter de 99$ (peut-être faudrait-il parler de MOC, non de MOOC ?).

Dans le dernier axe, vous apprendrez à utiliser l’outil Voyant qui est assez fascinant à tester. Je vous laisse copier-coller du texte en .txt et vous amuser. Personnellement, j’ai testé avec un fichier .txt d’Ulysse de Joyce récupéré sur le site du Projet Gutenberg.

***

Un très bon cours pour découvrir les humanités numériques, même si le temps imparti est, de mon point de vue, assez juste pour explorer toutes les pistes données au fil des vidéos et autres ressources. Le nombre de projets présentés à explorer une fois le cours achevé est conséquent, ce qui permet de continuer l’apprentissage.

A noter qu’Harvard a mis en ligne, toujours sur EDX, une série de cours sur la visualisation de données, le langage R et bien d’autres.

2 Commentaires

  1. Je suis super heureuse de retrouver ton blog ! Et ça me repose la question des compétences informatiques des bibliothécaires, que je m’étais déjà posée pendant ma mission de création d’un style Zotero en stage et plus largement pendant la formation ENSSIB, je pense qu’au moins pour certains profils, on ne peut pas y couper ! (ce qui ne m’embête absolument pas !)

Les commentaires sont fermés.