Ces 5 erreurs ruinent ton algo de Machine Learning

Quelles sont les 5 erreurs fréquentes qui ruinent les modèles de Machine Learning ? C’est ce qu’on voit ensemble dans cet article !

5 erreurs en Machine Learning

Ne pas analyser ses Données

Une erreur qu’on voit souvent chez les débutants.

Les algos de Machine Learning peuvent sembler si puissant qu’on peut en oublier que, parfois, une simple analyse de données suffirait à résoudre notre problème.

Il faut donc toujours prendre le temps d’étudier ses données.

Chez Inside Machine Learning, on vous conseille d’utiliser le package matplotlib.

Cette libraire permet de tracer facilement des graphs.

Avec ça vous pourrez avoir des résultats visuels et efficaces pour vos analyses de données !

L’Overfitting

L’erreur classique en Machine Learning : l’overfitting !

Celle-ci, vous la connaissez sûrement.

Elle consiste à entraîner tellement son modèle de Machine Learning qu’il en devient inefficace !

Comment est-ce possible ?

Eh bien, lors de l’entraînement, votre modèle se perfectionne uniquement en regardant les données que vous lui avez fourni. Cela peut l’amener à trouver des solutions qui fonctionnent seulement sur ces données et pas sur d’autres.

On dit que le modèle n’arrive plus à généraliser.

Pour éviter cette erreur, veiller à évaluer votre modèle à la fois sur des données d’entraînement mais aussi sur des données de validation !

Quand vous voyez que les résultats du modèle augmente sur les données d’entraînement mais diminue sur les données de validation, c’est sûrement mauvais signe !

Pour les plus curieux, on a écrit un article où l’on voit un exemple concret pour contrer l’overfitting, c’est par ici ! 💡

Manque de données

Une autre erreur fréquente en Machine Learning est le manque de données.

Celui-ci, c’est la hantise des Data Scientists !

Avoir passer tout un projet à réaliser un modèle de Machine Learning… pour se rendre compte à la fin qu’il n’y a pas assez de données.

En réalité, c’est plus un oubli qu’une erreur. Mais il reste fréquent de voir ce problème subvenir lors d’un projet conséquent !

Pour prévenir le manque de données, déterminez à l’avance vos besoins.

Mais surtout, mesurez la complexité de la tâche que vous voulez résoudre.

Au fait, si ton objectif est d'apprendre le Deep Learning - j’ai préparé pour toi le Plan d’action pour Maîtriser les Réseaux de neurones.

7 jours de conseils gratuits d’un ingénieur spécialisé en Intelligence Artificielle pour apprendre à maîtriser les réseaux de neurones à partir de zéro :

  • Planifie ton apprentissage
  • Structure tes projets
  • Développe tes algorithmes d’Intelligence Artificielle

J’ai basé ce programme sur des faits scientifiques, des approches éprouvées par des chercheurs mais également mes propres techniques que j'ai conçues au fil de mes expériences dans le domaine du Deep Learning.

Pour y accéder, clique ici :

RECEVOIR MON PLAN D'ACTION

RECEVOIR MON PLAN D'ACTION

À présent, on peut revenir à ce que je mentionnais précédemment.

Plus elle sera difficile, plus le nombre de données nécessaire sera important.

Photo by Alex Iby on Unsplash

Réseaux de neurones trop profond

Ici, on rentre dans des erreurs plus techniques.

En Deep Learning, le système de couches de neurones est vraiment intéressant et en rajouter quelques-unes dans un modèle peut parfois faire des miracles !

Avec le model GPT-3 développé par Open.AI, on parle de 96 couches de neurones !

Ce modèle peut résoudre des dizaines de tâches comme faire un résumé de livre ou bien même engager une conversation avec vous.

Mais pour des problèmes plus simples, un grand nombre de couches est souvent inutile… voire contraignant.

En effet, il engendre un temps d’entraînement particulièrement long et mène régulièrement à de l’overfitting (une erreur que vous connaissez déjà !)

Cependant si votre tâche nécessite réellement un grand nombre de couches alors on vous conseille de vous munir d’un bon GPU… ou bien d’une bonne dose de calme et de patience.

Et n’oubliez pas, parfois le modèle de Machine Learning que vous souhaitez faire existe déjà sur internet. Alors avant de vous lancer dans de longues heures de travail, n’hésitez pas à regarder avant si quelqu’un n’a pas déjà réalisé ce que vous voulez faire ! 😉

Utiliser la mauvaise fonction d’activation

La dernière erreur que l’on voit ensemble reposent sur le choix de la fonction d’activation.

C’est un concept qui n’est pas forcément simple à appréhender pour les débutants en Machine Learning.

Pourtant, il est fondamental pour construire un bon modèle de prédiction.

C’est pourquoi on a écrit un article spécialement dédier aux fonctions d’activation, avec en bonus un tableau récapitulatif pour savoir laquelle choisir selon le problème à résoudre.

C’est tout pour cet article, on espère qu’il vous aura plus.

Plus d’astuces en Machine Learning vous attendent dans cette section !

Un dernier mot, si tu veux aller plus loin et apprendre le Deep Learning - j’ai préparé pour toi le Plan d’action pour Maîtriser les Réseaux de neurones.

7 jours de conseils gratuits d’un ingénieur spécialisé en Intelligence Artificielle pour apprendre à maîtriser les réseaux de neurones à partir de zéro :

  • Planifie ton apprentissage
  • Structure tes projets
  • Développe tes algorithmes d’Intelligence Artificielle

J’ai basé ce programme sur des faits scientifiques, des approches éprouvées par des chercheurs mais également mes propres techniques que j'ai conçues au fil de mes expériences dans le domaine du Deep Learning.

Pour y accéder, clique ici :

RECEVOIR MON PLAN D'ACTION

RECEVOIR MON PLAN D'ACTION

Tom Keldenich
Tom Keldenich

Ingénieur spécialisé en Intelligence Artificielle et passionné de données !

Fondateur du site Inside Machine Learning

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *

This page will not stay online forever

Enter your email to receive for free

The PANE method for Deep Learning

* indicates required

 

You will receive one email per day for 7 days – then you will receive my newsletter.
Your information will never be given to third parties.

You can unsubscribe in 1 click from any of my emails.



Entre ton email pour recevoir gratuitement
la méthode PARÉ pour faire du Deep Learning


Tu recevras un email par jour pendant 7 jours - puis tu recevras ma newsletter.
Tes informations ne seront jamais cédées à des tiers.

Tu peux te désinscrire en 1 clic depuis n'importe lequel de mes emails.