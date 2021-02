La directive européenne 2019/790 sur le droit d'auteur et les droits voisins dans le marché unique numérique abordait la question de la fouille de textes et de données, remarquant en effet que « les nouvelles technologies permettent une analyse informatique automatisée d'informations sous forme numérique, telles que du texte, des sons, des images ou des données ». Eh, oui.

« Cette fouille de textes et de données rend possible le traitement de grandes quantités d'informations en vue d'acquérir de nouvelles connaissances et de découvrir de nouvelles tendances. Les technologies de fouille de textes et de données sont très répandues dans l'ensemble de l'économie numérique ; toutefois, il est largement reconnu que la fouille de textes et de données peut être en particulier profitable à la communauté des chercheurs, et ainsi soutenir l'innovation », poursuivait la directive.

Dans le domaine de la culture, notamment, la recherche pourrait bénéficier de ces fouilles, y compris en allant examiner des contenus protégés par le droit d'auteur, comme des oeuvres littéraires, aussi bien que des articles scientifiques sous droit.

Communiquer avec la machine

La directive prévoit ainsi, « pour les reproductions et les extractions effectuées par des organismes de recherche et des institutions du patrimoine culturel », une exception au droit d'auteur, tant qu'ils ont accès aux oeuvres et autres objets protégés de manière licite.

Hors recherche scientifique, une exception s'applique également aux oeuvres et objets accessibles de manière licite, « à condition que l'utilisation des œuvres et autres objets protégés visés audit paragraphe n'ait pas été expressément réservée par leurs titulaires de droits de manière appropriée, notamment par des procédés lisibles par machine pour les contenus mis à la disposition du public en ligne ».

Pour se préparer à l'application des mesures de la directive, qui doit être effective mi-2021 dans les pays européens, l'édition développe ce fameux « procédé lisible par machine ». Le W3C, organisme de standardisation du web, travaille sur cette technologie, avec un groupe de travail dirigé par l'EDRLab, le laboratoire européen du livre numérique, et l'AIE, l'Association des éditeurs italiens.

L'objectif étant, selon le groupe, de parvenir rapidement à une solution simple et compréhensible par la machine, qui permettrait de savoir si un contenu peut être librement fouillé ou non, et, sinon, quelles licences sont disponibles, et auprès de quel titulaire...

