La Commission européenne publie le rapport final d’une étude de deux ans sur l’exploration de données menée par Science-Metrix

Publié le 27 septembre 2017

La Commission européenne vient tout juste de publier le rapport final d’une étude de deux ans menée par Science-Metrix sur l’utilisation de techniques d’exploration de données pour orienter les politiques. L’un des principaux objectifs de l’étude était de développer et de mettre en application un cadre méthodologique pour mener des projets d’exploration de données liés aux enjeux clés des politiques sur la recherche et l’innovation. Les constats et recommandations formulés à l’issue de l’étude devraient permettre à la Direction générale de la recherche et de l’innovation de la Commission d’optimiser son utilisation d’approches en exploration de données. L’étude n’a pas seulement mené au développement d’un outil pratique pour concevoir et mettre en œuvre des projets d’exploration de données, elle a également généré des résultats insoupçonnés.

Parallèlement à la publication de ce rapport, nous publions une série de blogues afin de partager les leçons apprises et stimuler la discussion sur ce sujet d’actualité (voir les détails ci-dessous). Pour donner un premier aperçu des résultats du projet, mentionnons que les études de cas ont permis d’analyser certaines hypothèses sous-tendant les politiques actuelles de recherche et d’innovation, notamment l’hypothèse selon laquelle la recherche multidisciplinaire et multisectorielle tendrait à favoriser l’innovation, et l’idée que l’innovation stimule nécessairement la compétitivité économique et l'emploi. Les études ont montré que ces hypothèses auraient besoin d’être mieux validées quantitativement. Ceci a mené à la formulation d’une première recommandation sur l'importance de toujours tester la reproductibilité des résultats des études de cas liées aux politiques de recherche et d’innovation.  

Considérant la relative nouveauté de l'exploration de données et des projets utilisant cette approche, la deuxième recommandation soulève le fait que les projets ayant soi-disant « échoué » devraient être considérés comme des expériences d’apprentissage, desquelles certaines connaissances peuvent être tirées. La troisième recommandation appelle à adopter l’approche en deux phases du cadre méthodologique afin d’aider à atténuer les risques d'échec des projets. Enfin, la quatrième recommandation porte sur la création et le maintien d'une communauté de pratique inclusive pour l'exploration de données dans le domaine des politiques liées à la recherche et l’innovation.

Concrètement, l'étude a consisté tout d'abord à documenter l’utilisation, les meilleures pratiques, les avantages et les limites de l'exploration de données et des mégadonnées dans les secteurs privé et public. Un cadre méthodologique a ensuite été développé pour guider la conception et la mise en œuvre des projets d'exploration de données et de mégadonnées dans le contexte des politiques de recherche et d’innovation. Un atelier d'experts a été mené afin de valider le cadre méthodologique et y apporter des améliorations, avant de tester sa performance à travers la réalisation de six études de cas. Après de nouvelles améliorations itératives, l'équipe a présenté les résultats des études de cas, proposé quatre recommandations générales et présenté le cadre méthodologique lors d’un deuxième atelier d'experts.

Le rapport final ainsi que le rapport d'application sur les six études de cas représentent une somme de travail considérable. En complément à ces travaux, nous publions une série d’articles de blogues sur le site ScienceMetrics.org. Cette série relatera la chronologie de l'étude et discutera des limites et des problèmes rencontrés. Chaque billet traitera d'une conclusion clé ou d'une considération pratique liée à l'élaboration et à l'application du cadre méthodologique d'exploration de données. Cette série d’articles constituera une ressource précieuse pour les personnes qui travaillent dans ce domaine. Les principaux auteurs de l’étude, David Campbell, Chantale Tippett et Brooke Struck, vont chacun présenter différents volets du projet, et vous invitent à leur faire part de vos commentaires et de participer à des discussions depuis la section « commentaires » du blog.

Pour lire le premier article de la série, visitez ScienceMetrics.org

Consultez le rapport final du projet ici

Data Mining. Knowledge and technology flows in priority domains within the private sector and between the public and private sectors. (2017). Prepared by Science-Metrix for the European Commission. ISBN978-92-79-68029-8; DOI 10.2777/089

 

Image: Fotolia