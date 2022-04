Le premier éditeur de livres du Royaume-Uni s’est appuyé sur une nouvelle plateforme, alimentée par Snowflake, pour centraliser et créer une source unique pour ses données. Snowflake est une start-up d'hébergement de données dans le cloud, créée en 2012 et basée à San Mateo. Elle permet aux entreprises de stocker et d'analyser des données à l'aide de matériels et de logiciels décentralisés.

PRH UK l'a donc choisie pour mettre en place une source unique de données, et améliorer la gouvernance. Le service a fourni trois couches distinctes : une archive historique qui contient les données brutes, une base data vault pour l'intégration et la normalisation. Enfin, une dernière couche dite de présentation, où les données sont extractibles pour le fonctionnement quotidien de l'entreprise.

Le directeur des données de PRH, Pete Williams, s'est réjoui de cette nouvelle technologie : « Nous n'avions jamais imaginé que cette architecture pourrait nous permettre d’avancer aussi rapidement. Nous avons eu notre plateforme de données centralisée construite en trois mois, et quand je regarde certaines des choses que nous faisions avant et le temps qu'il nous a fallu pour les faire, c'est tout simplement incroyable la rapidité avec laquelle nous avons gagné en maturité de données. »

Aujourd'hui, Penguin Random House voit ses données automatisées, libérant l'équipe chargée des datas. « Nous pensons avoir déjà économisé environ 300 heures par an dans la création d'un simple rapport de vente basé sur les données Amazon et nous pensons que plus de 800 utilisateurs vont en bénéficier. Nous avons débloqué de nouvelles capacités et calculons des économies préliminaires d'environ 5000 heures par an. »

Une manière, pour le groupe, d'améliorer la confiance dans les données proposées et recueillies - la source étant désormais unique et fiable. Le traitement des données est en effet un sujet majeur dans le monde de l'édition : le probable rachat par l'éditeur scientifique Elsevier du fournisseur de logiciels Interfolio, lui-même propriétaire du controversé ResearchFish, a fait grand bruit sur Twitter.

Le logiciel avait en effet été utilisé pour de la cyberintimidation, et le traitement des données avait été détourné.

Crédits : Chris Liverani / Unsplash