Quelles sont les 5 erreurs fréquentes qui ruinent les modèles de Machine Learning ? C’est ce qu’on voit ensemble dans cet article !
5 erreurs en Machine Learning
Ne pas analyser ses Données
Une erreur qu’on voit souvent chez les débutants.
Les algos de Machine Learning peuvent sembler si puissant qu’on peut en oublier que, parfois, une simple analyse de données suffirait à résoudre notre problème.
Il faut donc toujours prendre le temps d’étudier ses données.
Chez Inside Machine Learning, on vous conseille d’utiliser le package matplotlib.
Cette libraire permet de tracer facilement des graphs.
Avec ça vous pourrez avoir des résultats visuels et efficaces pour vos analyses de données !
L’Overfitting
L’erreur classique en Machine Learning : l’overfitting !
Celle-ci, vous la connaissez sûrement.
Elle consiste à entraîner tellement son modèle de Machine Learning qu’il en devient inefficace !
Comment est-ce possible ?
Eh bien, lors de l’entraînement, votre modèle se perfectionne uniquement en regardant les données que vous lui avez fourni. Cela peut l’amener à trouver des solutions qui fonctionnent seulement sur ces données et pas sur d’autres.
On dit que le modèle n’arrive plus à généraliser.
Pour éviter cette erreur, veiller à évaluer votre modèle à la fois sur des données d’entraînement mais aussi sur des données de validation !
Quand vous voyez que les résultats du modèle augmente sur les données d’entraînement mais diminue sur les données de validation, c’est sûrement mauvais signe !
Pour les plus curieux, on a écrit un article où l’on voit un exemple concret pour contrer l’overfitting, c’est par ici ! 💡
Manque de données
Une autre erreur fréquente en Machine Learning est le manque de données.
Celui-ci, c’est la hantise des Data Scientists !
Avoir passer tout un projet à réaliser un modèle de Machine Learning… pour se rendre compte à la fin qu’il n’y a pas assez de données.
En réalité, c’est plus un oubli qu’une erreur. Mais il reste fréquent de voir ce problème subvenir lors d’un projet conséquent !
Pour prévenir le manque de données, déterminez à l’avance vos besoins.
Mais surtout, mesurez la complexité de la tâche que vous voulez résoudre.
Au fait, si ton objectif est d'apprendre le Deep Learning - j’ai préparé pour toi le Plan d’action pour Maîtriser les Réseaux de neurones.
7 jours de conseils gratuits d’un ingénieur spécialisé en Intelligence Artificielle pour apprendre à maîtriser les réseaux de neurones à partir de zéro :
- Planifie ton apprentissage
- Structure tes projets
- Développe tes algorithmes d’Intelligence Artificielle
J’ai basé ce programme sur des faits scientifiques, des approches éprouvées par des chercheurs mais également mes propres techniques que j'ai conçues au fil de mes expériences dans le domaine du Deep Learning.
Pour y accéder, clique ici :
À présent, on peut revenir à ce que je mentionnais précédemment.
Plus elle sera difficile, plus le nombre de données nécessaire sera important.
Réseaux de neurones trop profond
Ici, on rentre dans des erreurs plus techniques.
En Deep Learning, le système de couches de neurones est vraiment intéressant et en rajouter quelques-unes dans un modèle peut parfois faire des miracles !
Avec le model GPT-3 développé par Open.AI, on parle de 96 couches de neurones !
Ce modèle peut résoudre des dizaines de tâches comme faire un résumé de livre ou bien même engager une conversation avec vous.
Mais pour des problèmes plus simples, un grand nombre de couches est souvent inutile… voire contraignant.
En effet, il engendre un temps d’entraînement particulièrement long et mène régulièrement à de l’overfitting (une erreur que vous connaissez déjà !)
Cependant si votre tâche nécessite réellement un grand nombre de couches alors on vous conseille de vous munir d’un bon GPU… ou bien d’une bonne dose de calme et de patience.
Et n’oubliez pas, parfois le modèle de Machine Learning que vous souhaitez faire existe déjà sur internet. Alors avant de vous lancer dans de longues heures de travail, n’hésitez pas à regarder avant si quelqu’un n’a pas déjà réalisé ce que vous voulez faire ! 😉
Utiliser la mauvaise fonction d’activation
La dernière erreur que l’on voit ensemble reposent sur le choix de la fonction d’activation.
C’est un concept qui n’est pas forcément simple à appréhender pour les débutants en Machine Learning.
Pourtant, il est fondamental pour construire un bon modèle de prédiction.
C’est pourquoi on a écrit un article spécialement dédier aux fonctions d’activation, avec en bonus un tableau récapitulatif pour savoir laquelle choisir selon le problème à résoudre.
C’est tout pour cet article, on espère qu’il vous aura plus.
Plus d’astuces en Machine Learning vous attendent dans cette section !
Un dernier mot, si tu veux aller plus loin et apprendre le Deep Learning - j’ai préparé pour toi le Plan d’action pour Maîtriser les Réseaux de neurones.
7 jours de conseils gratuits d’un ingénieur spécialisé en Intelligence Artificielle pour apprendre à maîtriser les réseaux de neurones à partir de zéro :
- Planifie ton apprentissage
- Structure tes projets
- Développe tes algorithmes d’Intelligence Artificielle
J’ai basé ce programme sur des faits scientifiques, des approches éprouvées par des chercheurs mais également mes propres techniques que j'ai conçues au fil de mes expériences dans le domaine du Deep Learning.
Pour y accéder, clique ici :