Aller le contenu

Le Machine Learning: tour d’horizon

1. Qu’est-ce que le Machine Learning?

L’apprentissage automatique (en anglais machine learning, littéralement « l’apprentissage machine ») ou apprentissage statistique, champ d’étude de l’intelligence artificielle, concerne la conception, l’analyse, le développement et l’implémentation de méthodes permettant à une machine (au sens large) d’évoluer par un processus systématique, et ainsi de remplir des tâches difficiles ou problématiques par des moyens algorithmiques plus classiques.

(src: Wikipedia. https://fr.wikipedia.org/wiki/Apprentissage_automatique)

De manière très simplifiée, un algorithme de Machine Learning (ML) fonctionne par identification de patterns (schémas) dans les données, puis les utilise pour « prédire » le futur, reproduire des comportements, découvrir/apprendre des comportements optimaux… Ces modèles ont, en outre, une capacité d’auto-apprentissage et d’amélioration continue, qui leur permet d’être de plus en plus performants à mesure qu’ils découvrent de nouvelles données.

Il existe plusieurs classes d’usage du ML, parmis lesquelles: Prédiction, Classification, Clustering, Recommandation, Apprentissage par renforcement…

Exemples

Parfois sans le savoir, nous sommes confrontés tous les jours à ce type d’algorithmes:

  • Détection de fraude bancaire
  • Prédiction de comportement client (achat, passage à la concurrence, etc…)
  • Recommandation de maintenances préventives
  • Prédiction du cours d’une action
  • Détection de SPAM
  • Reconnaissance d’images et du langage naturel
  • Recommandations personnalisées sur les sites marchands
  • etc…

2. Le processus d’apprentissage

La manière dont un algorithme de ML apprend, n’est finalement pas très différente de celle dont nous apprenons à lire…!

Pour commencer, nous identifions des schémas dans des données existantes, c’est à dire les textes sur lesquels se basent notre apprentissage (« L » et « E » font « LE », etc…) puis apprenons à reconnaître ces même schémas lorsque nous les rencontrons de nouveau dans des textes inconnus. Nous déclenchons alors un processus cognitif associé, une action, un comportement (lecture à haute voix, analyse sémantique et exécution d’une action dans le cas d’un mode d’emploi, etc…).

Un modèle de Machine Learning opère de manière très similaire, mais sur des données pouvant être bien plus complexes, et revêt un intérêt tout particulier lorsque ces dernières ne sont pas humainement exploitables (complexité, volume, …)

3. Pré-requis et raisons de la montée en puissance du Machine Learning

technology-3092486_1280

Le Machine Learning, pour pouvoir être appliqué efficacement, nécessite quelques pré-requis, que les progrès technologiques de ces dernières années permettent de remplir de manière de plus en plus satisfaisante. C’est la raison pour monde gonflable interieurlaquelle, si cette discipline existe depuis des dizaines d’années, nous en entendons de plus en plus parler, et pouvons désormais l’appliquer à quasiment tous les champs de notre quotidien personnel… et professionnel!

3.1 Une immense quantité de données

Pour mémoire, un octet, c’est la quantité de mémoire nécessaire pour stocker une lettre de l’alphabet, et, avec un teraoctet (To), l’intégralité du contenu de la Bibliothèque Nationale de France peut-être numérisé… Tous les jours, nous créons 2 500 000 000 000 000 000 octets de données (2,5 quintillions), soit 10 millions de Blu-Rays… Pour appréhender l’évolution de la donnée produite par l’humanité (1 petaoctet), nous pouvons noter que nous produisions, en 1992, 100 Go de donnée par jour, contre 50 000 Go / sec aujourd’hui…

Tout cela est vertigineux… et valide largement ce premier pré-requis!

3.2 Puissance de calcul et stockage

En 1998, 1 Go de mémoire coûtait 228$ (à ce prix là, votre disque dur actuel de 250 Go coûterait 57000$… à bon entendeur…). Ce même gigaoctet, en 2017, ne valait plus que 0,03$… Si vous devez ne retenir qu’un seul chiffre, pourquoi pas celui-ci: en 60 ans, le prix du stockage a été divisé par 520 millions… rien que ça… Allez, un dernier fait pour la route, parce que ça ne mange pas de riz (vous allez comprendre…), et que ça fait toujours plaisir: nous produisons depuis 2005 plus de transistors que de grains de riz… Uncle Ben’s n’a qu’à bien se tenir!

Et voici qui valide sans équivoque notre second pré-requis!

3.3 Des algorithmes performants

Forts de ces évolutions technologiques (… et financières …) majeures, nombre d’acteurs ont mis les bouchées doubles, parmi lesquels nos GAFAM bien aimés, et nous disposons à ce jour d’une boîte à outils complète et relativement facile d’utilisation pour implémenter nos petits algorithmes de ML… Pour ne citer qu’eux, TensorFlow, IBM Watson, AML, Azure ML, Google Cloud ML, ….

et de 3 pré-requis! 3!

Conclusion

Voilà pour ce premier tour d’horizon sur un buzz-word qui a bien le vent en poupe. Un nouvel article suivra très prochainement, dans lequel je démystifierai des termes comme apprentissage supervisé / non supervisé, régression, classification, clustering, deep learning, reinforcement learning…. alors… stay tuned!

 

Crédit image: Freepik

Soyez le premier à commenter

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *