Objectifs

Contexte

Les partitions musicales anciennes constituent des biens patrimoniaux précieux, intensivement étudiés par les chercheurs musicologues. Ces données sont initialement disponibles sous forme de documents d’archive (voir Figure 1). L’apparition de formats XML comme MusicXML et MEI (ce dernier étant particulièrement adapté comme support pour des études scientifiques) a permis la transcription de certains de ces corpus dans des formats standardisés. Ces travaux ont permis de faciliter la publication électronique de ces documents constituant ainsi de nouveaux jeux de données ouvertes. Ils ont également offert la possibilité d’effectuer des opérations de recherche et d’analyse automatisée au sein des corpus. Par exemple, le portail Neuma initialement créé lors du projet ANR du même nom, publie plusieurs corpus de partitions musicales au format XML (voir Figure 2). D’autres sources de partitions anciennes existent, telles que les bases de l’IReMus, le portail PHILIDOR du Centre de Musique Baroque de Versailles, les ressources en ligne du Centre d’Études Supérieures de la Renaissance ou encore le portail KernScores de l’Université de Stanford.

Toutes ces ressources constituent un volume important de données, mais une de leurs caractéristiques essentielle à l’heure actuelle est leur hétérogénéité. Elles ont été saisies par des outils différents (depuis un encodage purement manuel et une génération via des logiciels de gravure sophistiqués), dans des formats qui ont beaucoup évolué (de HumDrum à MEI en passant par MusicXML), avec des motivations diverses (de la simple saisie d’un incipit à l‘encodage minutieux de la source et de ses variantes). Une évaluation préalable de la qualité de ces sources et de leur adéquation à un usage spécifique s’avère donc cruciale, aussi bien pour les utilisateurs consommateurs de données confrontés à une hétérogénéité qui vient perturber leur démarche (d’analyse, de recherche), que pour les producteurs de données actuellement dépourvus d’outils pour évaluer la qualité de leurs contributions.

Verrous scientifiques

Malheureusement, la notion de qualité d’une partition musicale numérisée est une notion complexe pour laquelle aucune proposition n’existe dans la littérature. Un premier verrou scientifique pluridisciplinaire à lever consiste donc en la définition de dimensions et métriques qualité permettant de définir la qualité d’une collection de partitions musicales numérisées.

Se pose ensuite naturellement le problème du calcul des métriques qualité pour diverses sources disponibles, en particulier en garantissant un passage à l’échelle de l’évaluation qualité étant donnés les volumes conséquents entrant en jeu.

Les autres verrous concernent la prise en compte des indicateurs qualité en fonction de l’exploitation des données. Nous nous intéresserons particulièrement à la publication et à la recherche. Pour la publication, l’un des problèmes d’un producteur de données est le choix des données et métadonnées (en particulier qualité) à exposer. Les méthodologies existantes en support au processus de publication des données sont rudimentaires et n’apportent pas encore de réponse satisfaisante à ce problème. Un autre verrou pluridisciplinaire à lever relève donc de la définition de méthodologies et d’outils (semi)automatiques d’aide à la publication de données, guidés par la qualité de celles-ci.

Du point de vue du consommateur de données, il est nécessaire de pouvoir choisir les données à exploiter en fonction de l’utilisation qui doit en être faite. Cela passe par la prise en compte de préférences qualité utilisateur au sein des algorithmes d’exploration des données mis en œuvre par les musicologues, ce qui constitue un autre verrou scientifique multidisciplinaire. Il s’agit ici de savoir représenter les préférences (profil) qualité de chaque utilisateur puis d’utiliser ces préférences afin de produire un modèle d’accès personnalisé aux données (recommandation, choix de sources, filtrage et classement des réponses). Ce problème est encore peu étudié dans le cadre des données ouvertes et l’est encore moins dans le cadre des données musicales.

fig1

Figure 1 – Forme initiale d’une partition musicale ancienne (extrait)

fig2

Figure 2- Encodage XML d’une partition (extrait)

Les méthodes développées lors du projet ont vocation à être mises en œuvre pour expérimentation sur la plateforme Neuma actuellement maintenue par le CNAM Paris.

Les commentaires sont clos.