Quelles sont les 5 erreurs fréquentes qui ruinent les modèles de Machine Learning ? C’est ce qu’on voit ensemble dans cet article !
5 erreurs en Machine Learning
Ne pas analyser ses Données
Une erreur qu’on voit souvent chez les débutants.
Les algos de Machine Learning peuvent sembler si puissant qu’on peut en oublier que, parfois, une simple analyse de données suffirait à résoudre notre problème.
Il faut donc toujours prendre le temps d’étudier ses données.
Chez Inside Machine Learning, on vous conseille d’utiliser le package matplotlib.
Cette libraire permet de tracer facilement des graphs.
Avec ça vous pourrez avoir des résultats visuels et efficaces pour vos analyses de données !
L’Overfitting
L’erreur classique en Machine Learning : l’overfitting !
Celle-ci, vous la connaissez sûrement.
Elle consiste à entraîner tellement son modèle de Machine Learning qu’il en devient inefficace !
Comment est-ce possible ?
Eh bien, lors de l’entraînement, votre modèle se perfectionne uniquement en regardant les données que vous lui avez fourni. Cela peut l’amener à trouver des solutions qui fonctionnent seulement sur ces données et pas sur d’autres.
On dit que le modèle n’arrive plus à généraliser.
Pour éviter cette erreur, veiller à évaluer votre modèle à la fois sur des données d’entraînement mais aussi sur des données de validation !
Quand vous voyez que les résultats du modèle augmente sur les données d’entraînement mais diminue sur les données de validation, c’est sûrement mauvais signe !
Pour les plus curieux, on a écrit un article où l’on voit un exemple concret pour contrer l’overfitting, c’est par ici ! 💡
Manque de données
Une autre erreur fréquente en Machine Learning est le manque de données.
Celui-ci, c’est la hantise des Data Scientists !
Avoir passer tout un projet à réaliser un modèle de Machine Learning… pour se rendre compte à la fin qu’il n’y a pas assez de données.
En réalité, c’est plus un oubli qu’une erreur. Mais il reste fréquent de voir ce problème subvenir lors d’un projet conséquent !
Pour prévenir le manque de données, déterminez à l’avance vos besoins.
Mais surtout, mesurez la complexité de la tâche que vous voulez résoudre.
Plus elle sera difficile, plus le nombre de données nécessaire sera important.
LA MÉTHODE PARÉ POUR FAIRE DU DEEP LEARNING !
Reçois tes 7 JOURS De Formation GRATUITE Pour Apprendre À Créer TA PREMIÈRE INTELLIGENCE ARTIFICIELLE !
Pendant les 7 prochains jours je vais te montrer comment utiliser les Réseaux de neurones.
Tu vas comprendre ce qu'est le Deep Learning avec des exemples concrets qui vont te rester dans la tête.
ATTENTION, cette série d’email ne s’adresse pas à tout le monde. Si tu es du genre à aimer les cours théoriques et scolaires tu peux passer ta route.
Mais si tu souhaite apprendre la méthode PARÉ pour faire du Deep Learning, clique ici :

Réseaux de neurones trop profond
Ici, on rentre dans des erreurs plus techniques.
En Deep Learning, le système de couches de neurones est vraiment intéressant et en rajouter quelques-unes dans un modèle peut parfois faire des miracles !
Avec le model GPT-3 développé par Open.AI, on parle de 96 couches de neurones !
Ce modèle peut résoudre des dizaines de tâches comme faire un résumé de livre ou bien même engager une conversation avec vous.
Mais pour des problèmes plus simples, un grand nombre de couches est souvent inutile… voire contraignant.
En effet, il engendre un temps d’entraînement particulièrement long et mène régulièrement à de l’overfitting (une erreur que vous connaissez déjà !)
Cependant si votre tâche nécessite réellement un grand nombre de couches alors on vous conseille de vous munir d’un bon GPU… ou bien d’une bonne dose de calme et de patience.
Et n’oubliez pas, parfois le modèle de Machine Learning que vous souhaitez faire existe déjà sur internet. Alors avant de vous lancer dans de longues heures de travail, n’hésitez pas à regarder avant si quelqu’un n’a pas déjà réalisé ce que vous voulez faire ! 😉
Utiliser la mauvaise fonction d’activation
La dernière erreur que l’on voit ensemble reposent sur le choix de la fonction d’activation.
C’est un concept qui n’est pas forcément simple à appréhender pour les débutants en Machine Learning.
Pourtant, il est fondamental pour construire un bon modèle de prédiction.
C’est pourquoi on a écrit un article spécialement dédier aux fonctions d’activation, avec en bonus un tableau récapitulatif pour savoir laquelle choisir selon le problème à résoudre.
C’est tout pour cet article, on espère qu’il vous aura plus.
Plus d’astuces en Machine Learning vous attendent dans cette section !
LA MÉTHODE PARÉ POUR FAIRE DU DEEP LEARNING !
Reçois tes 7 JOURS De Formation GRATUITE Pour Apprendre À Créer TA PREMIÈRE INTELLIGENCE ARTIFICIELLE !
Pendant les 7 prochains jours je vais te montrer comment utiliser les Réseaux de neurones.
Tu vas comprendre ce qu'est le Deep Learning avec des exemples concrets qui vont te rester dans la tête.
ATTENTION, cette série d’email ne s’adresse pas à tout le monde. Si tu es du genre à aimer les cours théoriques et scolaires tu peux passer ta route.
Mais si tu souhaite apprendre la méthode PARÉ pour faire du Deep Learning, clique ici :