Les types de Machine Learning à savoir – Comprendre rapidement

Dans cet article, on vous explique avec des exemples concrets la différence entre algorithme supervisé et non-supervisé.

Comme vu dans le premier cours sur les bases du Machine Learning, ce-dernier est basé sur des algorithmes, aussi appelé modèles.

Cependant chaque modèle ne s’applique pas n’importe comment.

Le contexte jouera sur le type d’algorithme qu’on utilisera.

Ce contexte, on le distingue en 3 catégories principales :

  • Supervisés
  • Non-supervisés
  • Renforcement

Et c’est ce que nous allons voir dans cet article !

Machine Learning Supervisé

Les problèmes dits supervisés sont des problèmes ou l’homme apporte un soutient a l’algorithme utilisé, et donc le supervise dans le sens ou les données en entrée sont labellisées.

Mais que veut donc dire labellisé? Il s’agit de données préalablement identifiées qui vont être utilisées lors de l’application du programme. L’Homme a donc un impact direct sur la labellisation des données et donc par conséquent sur le résultat.

Prenons pour exemple cette banque d’image contenant des chiens et chats, chaque image est « labellisée », c’est-a-dire que l’on sait ce qu’elle représente.

Données Labellisées

L’algorithme supervisé va alors travailler en sachant que la première image en haut a gauche est un chien, que la suivante est un chat etc…

Lorsque l’on testera notre modèle sur une nouvelle image, l’algorithme essayera alors de deviner s’il s’agit d’un chat ou d’un chien.

Différents algorithmes permettent d’entraîner ce genre de modèle supervisés, ils sont classifiés en deux catégories. En voici une liste non-exhaustive:

  • Régression (Régression linéaire, régression de poisson…)
  • Classification (Régression logistique, réseau de neurone, arbre de décision…)

Machine Learning Non-Supervisé

Les problèmes dits non-supervisés, a l’inverse des problèmes dits supervisés sont des problèmes ou l’homme n’apporte aucun soutient a l’algorithme utilisé. Les données en entrée sont donc non-labellisées.

Les données non-labellisées sont-elles donc simplement des données non identifiées? C’est exact! Il s’agit en effet de données non identifiées qui vont être utilisées lors de l’application du programme. L’utilisateur possède ces données mais ne peut comprendre exactement ce a quoi elles correspondent.

Pas encore tout a fait clair? Pas de soucis, l’exemple qui suit va surement vous aider a mieux cerner ce concept.


CRÉER TON APPLICATION IA !


Reçois tes 5 JOURS De Formation GRATUITE Pour Apprendre À Créer Ton APPLICATION d’INTELLIGENCE ARTIFICIELLE !


Tous les fondamentaux de la création d’Application IA : les approches, les outils et techniques, les librairies et framework, et bien d'autres !

Découvres étape par étape la création d’application de Deep Learning (tu apprendras même à trouver des idées d’appli !).

En bonus, tu recevras notre Guide Ultime du Deep Learning !


Dans cet exemple cette banque d’image, contrairement au dernier exemple, les images ne sont pas « labellisées ». L’algorithme ne sait pas ce qu’elles représentent et c’est la son avantage.

Données Non-Labellisées

En effet, en regardant ces images, il parait évident que les 2 catégories sont les éléphants et les rhinocéros.

Contrairement à nous, l’algorithme ne va pas se restreindre a cela.

En effet grâce aux similitudes d’images différentes il va créer ses propres catégories.

Ainsi un algorithme simple trouvera sans doute 2 catégories tout comme vous et moi.

Cependant un algorithme plus performant séparera les images en 4 catégories: l’éléphant d’Asie, l’éléphant d’Afrique, le rhinocéros noir et enfin le rhinocéros blanc.

C’est la que les algorithmes non-supervisés démontre leur avantage.

Voici une fois de plus une courte liste d’algorithmes non-supervisés, eux aussi divisés en 2 catégories:

  • Clustering (k-mean clustering, hierarchical clustering…)
  • Dimensionality Reduction (Variance thresholds, genetic algorithms…)

Les problèmes de ML dits de renforcement

Cette dernière catégorie diffère quelque peu, en effet il ne s’agit plus de prédire mais de renforcer.

Ici, l’algorithme fonctionne sur la base d’un agent (programme, robot…) qui doit effectuer une tache. En fonction de sa performance, il reçoit des punitions ou récompenses. Cet agent n’a nullement besoin de l’homme pour fonctionner, et il apprend et s’améliore grâce à l’algorithme de renforcement.

Contrairement aux problèmes supervisés et non-supervisés où l’on implémente les données uniquement au début, cet algorithme s’adapte en fonction d’une arrivée constante de données.

Cette catégorie du machine learning est en constant développement et mériterait un article à part entière. Un des exemples qui vous parlera peut-être est l’intelligence artificielle appliquée aux jeux d’échecs !

Un article à venir sera dédié aux problèmes dits de renforcement afin de mieux comprendre ce qui se cache derrière ce système de récompense.

À bientôt sur Inside Machine Learning ! 😉

sources :


CRÉER TON APPLICATION IA !


Reçois tes 5 JOURS De Formation GRATUITE Pour Apprendre À Créer Ton APPLICATION d’INTELLIGENCE ARTIFICIELLE !


Tous les fondamentaux de la création d’Application IA : les approches, les outils et techniques, les librairies et framework, et bien d'autres !

Découvres étape par étape la création d’application de Deep Learning (tu apprendras même à trouver des idées d’appli !).

En bonus, tu recevras notre Guide Ultime du Deep Learning !


Alexis Maissant
Alexis Maissant

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée.