Depuis quelques années, nous assistons à un déluge de données numériques. Relevés scientifiques ou traces de l’activité des individus, des entreprises, des administrations tant sur Internet que sur les applications mobiles, elles prennent la forme d’images, de sons, de textes ou encore de mesures physiques. Que faire de cette déferlante de données ? Comment stocker, analyser, valoriser efficacement ce nouveau gisement d’informations ? Véritable nouvelle matière première du XXIe siècle, ce sont les algorithmes qui en permettent l’exploitation. Si la performance de ceux-ci a fait un bond ces dernières années, leur traitement automatique est devenu un enjeu industriel, sociétal et politique majeur, en particulier dans le domaine des algorithmes d’apprentissage.

“Leur impact sur notre société implique que leur compréhension est un enjeu qui va bien au-delà des seules préoccupations de la science fondamentale”

Au fondement de l’intelligence artificielle, ces derniers ouvrent des perspectives prometteuses dans bien des domaines. Reconnaître un élément contenu dans une image, calculer l’énergie quantique des molécules, traduire des textes, reconnaître une voix, de la musique ou encore prédire des comportements humains : autant de capacités utiles dans de nombreux champs d’application. En médecine par exemple, l’intelligence artificielle pourrait offrir des technologies de diagnostic plus performantes pouvant détecter des maladies, telles que des cancers ou Alzheimer, bien plus tôt qu’aujourd’hui. Si les résultats des algorithmes d’apprentissage sont spectaculaires, les raisons en restent incomprises. Pourtant, l’ampleur annoncée de leur impact sur notre société implique que leur compréhension est un enjeu qui va bien au-delà des seules préoccupations de la science fondamentale.
C’est l’objectif de la création de la chaire Sciences des données confiée au Professeur Stéphane Mallat et dont l’enseignement a débuté le 11 janvier dernier.

Algorithmes, quèsaco ?

“Beaucoup d’exemples de notre quotidien relèvent des algorithmes”

Un algorithme est la description très précise et simplifiée de la manière dont on peut procéder pour résoudre un problème ou effectuer une tâche. Une recette de cuisine, décrivant avec précision chaque étape de la concoction d’un plat, est donc un algorithme ! En sciences des données, les algorithmes décrivent les méthodes de traitement de l’information : recherche, comparaison, analyse, classement, extraction… Beaucoup d’exemples de notre quotidien relèvent ainsi des algorithmes : l’identification d’un utilisateur sur une photo par Facebook, un jeu d’échecs en ligne, la traduction de textes, ou, bientôt, les voitures autonomes.

Un algorithme d’apprentissage prend en entrée des données, par exemple une image, et estime une réponse à une question, par exemple trouver le nom de l’animal représenté sur l’image. Cette capacité à répondre est obtenue grâce à une phase d’apprentissage durant laquelle plusieurs exemples d’images et d’animaux sont soumis au programme. Mais les algorithmes d’apprentissage ne sont pas entièrement déterminés à l’avance : il faut garantir que le résultat se généralise pour qu’ils soient capables de prédire la bonne réponse sur des données qu’ils n’ont jamais vues. La complexité de ce problème vient du très grand nombre de variables dans chaque donnée, dont l’interaction produit un nombre gigantesque de possibilités. C’est la malédiction de la dimensionnalité. Pour faire face à cette malédiction, il est nécessaire d’avoir des informations a priori, des régularités utilisées par l’algorithme pour relier le résultat d’une donnée inconnue avec des exemples connus. L’enjeu fondamental aujourd’hui est donc d’identifier, de comprendre et de traduire ces régularités, enjeu qui fait appel à de nombreuses branches des mathématiques, dont les statistiques, les probabilités, l’analyse et la géométrie.

Les mathématiques appliquées, un langage universel

Comme le souligne l’intitulé de la chaire, il n’y a pas une science des données mais bien des sciences des données. Ce domaine est en effet une véritable « auberge espagnole » où cohabitent des approches et des cultures scientifiques différentes qui s’enrichissent mutuellement : statistiques, informatique, intelligence artificielle, traitement du signal, théorie de l’information mais aussi toutes les sciences « traditionnelles » qui modélisent et analysent de grandes masses de données, telles que la physique, la biologie, l’économie ou encore les sciences sociales. Dans cette discipline à plusieurs visages, les mathématiques appliquées que développe le Pr Mallat dans son cours ont pour vocation d’apporter une vision et un langage commun au-delà des spécificités de chaque domaine, tout en s’intéressant à la composante expérimentale des sciences des données. En proposant un aller-retour entre mathématiques pures et applications, notamment en se confrontant à de véritables problématiques rencontrées par des start-ups, des hôpitaux ou encore des laboratoires scientifiques, le professeur entend effacer progressivement les frontières entre théorie et expérimentations pour permettre l’émergence de nouvelles idées et stimuler la créativité de la discipline. La particularité des concepts issus de cette approche tient dans les correspondances alors mises en évidence entre des domaines aussi différents que la reconnaissance d’images, la neurophysiologie, la chimie quantique, la cosmologie ou l’économie. Révéler ces correspondances, comprendre et formaliser ces liens, est aussi l’ambition des mathématiques appliquées.

“Ce domaine est une véritable “auberge espagnole” où cohabitent des approches et des cultures scientifiques différentes qui s’enrichissent mutuellement”

Une discipline au-delà des seuls cercles scientifiques

Avec la création de cette chaire, outre l’approfondissement de sa discipline, le Pr Mallat s’est donné pour objectif de mieux faire comprendre les avancées des algorithmes, des mathématiques de l’apprentissage et de l’intelligence artificielle à un plus large public. L’impact futur de ces technologies tant sur l’industrie et la médecine que sur certains aspects de notre organisation économique et sociale appelle à réfléchir au-delà des cercles scientifiques : il est essentiel d’en diffuser la connaissance auprès du plus grand nombre.

Flavie Dubois-Mazeyrie

 

Pour aller plus loin :

Retrouvez la leçon inaugurale et les cours du Pr Mallat sur le site du Collège de France : https://www.college-de-france.fr/site/stephane-mallat/inaugural-lecture-2018-01-11-18h00.htm