Ces 5 erreurs ruinent ton algo de Machine Learning

Quelles sont les 5 erreurs fréquentes qui ruinent les modèles de Machine Learning ? C’est ce qu’on voit ensemble dans cet article !

5 erreurs en Machine Learning

Ne pas analyser ses Données

Une erreur qu’on voit souvent chez les débutants.

Les algos de Machine Learning peuvent sembler si puissant qu’on peut en oublier que, parfois, une simple analyse de données suffirait à résoudre notre problème.

Il faut donc toujours prendre le temps d’étudier ses données.

Chez Inside Machine Learning, on vous conseille d’utiliser le package matplotlib.

Cette libraire permet de tracer facilement des graphs.

Avec ça vous pourrez avoir des résultats visuels et efficaces pour vos analyses de données !

L’Overfitting

L’erreur classique en Machine Learning : l’overfitting !

Celle-ci, vous la connaissez sûrement.

Elle consiste à entraîner tellement son modèle de Machine Learning qu’il en devient inefficace !

Comment est-ce possible ?

Eh bien, lors de l’entraînement, votre modèle se perfectionne uniquement en regardant les données que vous lui avez fourni. Cela peut l’amener à trouver des solutions qui fonctionnent seulement sur ces données et pas sur d’autres.

On dit que le modèle n’arrive plus à généraliser.

Pour éviter cette erreur, veiller à évaluer votre modèle à la fois sur des données d’entraînement mais aussi sur des données de validation !

Quand vous voyez que les résultats du modèle augmente sur les données d’entraînement mais diminue sur les données de validation, c’est sûrement mauvais signe !

Pour les plus curieux, on a écrit un article où l’on voit un exemple concret pour contrer l’overfitting, c’est par ici ! 💡

Manque de données

Une autre erreur fréquente en Machine Learning est le manque de données.

Celui-ci, c’est la hantise des Data Scientists !

Avoir passer tout un projet à réaliser un modèle de Machine Learning… pour se rendre compte à la fin qu’il n’y a pas assez de données.

En réalité, c’est plus un oubli qu’une erreur. Mais il reste fréquent de voir ce problème subvenir lors d’un projet conséquent !

Pour prévenir le manque de données, déterminez à l’avance vos besoins.

Mais surtout, mesurez la complexité de la tâche que vous voulez résoudre.

Plus elle sera difficile, plus le nombre de données nécessaire sera important.

LA MÉTHODE PARÉ POUR FAIRE DU DEEP LEARNING !

Reçois tes 7 JOURS De Formation GRATUITE Pour Apprendre À Créer TA PREMIÈRE INTELLIGENCE ARTIFICIELLE !

Pendant les 7 prochains jours je vais te montrer comment utiliser les Réseaux de neurones.

Tu vas comprendre ce qu'est le Deep Learning avec des exemples concrets qui vont te rester dans la tête.

ATTENTION, cette série d’email ne s’adresse pas à tout le monde. Si tu es du genre à aimer les cours théoriques et scolaires tu peux passer ta route.

Mais si tu souhaite apprendre la méthode PARÉ pour faire du Deep Learning, clique ici :

Photo by Alex Iby on Unsplash

Réseaux de neurones trop profond

Ici, on rentre dans des erreurs plus techniques.

En Deep Learning, le système de couches de neurones est vraiment intéressant et en rajouter quelques-unes dans un modèle peut parfois faire des miracles !

Avec le model GPT-3 développé par Open.AI, on parle de 96 couches de neurones !

Ce modèle peut résoudre des dizaines de tâches comme faire un résumé de livre ou bien même engager une conversation avec vous.

Mais pour des problèmes plus simples, un grand nombre de couches est souvent inutile… voire contraignant.

En effet, il engendre un temps d’entraînement particulièrement long et mène régulièrement à de l’overfitting (une erreur que vous connaissez déjà !)

Cependant si votre tâche nécessite réellement un grand nombre de couches alors on vous conseille de vous munir d’un bon GPU… ou bien d’une bonne dose de calme et de patience.

Et n’oubliez pas, parfois le modèle de Machine Learning que vous souhaitez faire existe déjà sur internet. Alors avant de vous lancer dans de longues heures de travail, n’hésitez pas à regarder avant si quelqu’un n’a pas déjà réalisé ce que vous voulez faire ! 😉

Utiliser la mauvaise fonction d’activation

La dernière erreur que l’on voit ensemble reposent sur le choix de la fonction d’activation.

C’est un concept qui n’est pas forcément simple à appréhender pour les débutants en Machine Learning.

Pourtant, il est fondamental pour construire un bon modèle de prédiction.

C’est pourquoi on a écrit un article spécialement dédier aux fonctions d’activation, avec en bonus un tableau récapitulatif pour savoir laquelle choisir selon le problème à résoudre.

C’est tout pour cet article, on espère qu’il vous aura plus.

Plus d’astuces en Machine Learning vous attendent dans cette section !

LA MÉTHODE PARÉ POUR FAIRE DU DEEP LEARNING !

Reçois tes 7 JOURS De Formation GRATUITE Pour Apprendre À Créer TA PREMIÈRE INTELLIGENCE ARTIFICIELLE !

Pendant les 7 prochains jours je vais te montrer comment utiliser les Réseaux de neurones.

Tu vas comprendre ce qu'est le Deep Learning avec des exemples concrets qui vont te rester dans la tête.

ATTENTION, cette série d’email ne s’adresse pas à tout le monde. Si tu es du genre à aimer les cours théoriques et scolaires tu peux passer ta route.

Mais si tu souhaite apprendre la méthode PARÉ pour faire du Deep Learning, clique ici :

Tom Keldenich
Tom Keldenich

Data Engineer & passionné d'Intelligence Artificielle !

Fondateur du site Inside Machine Learning

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *

This page will not stay online forever

Enter your email to receive for free

The PANE method for Deep Learning

* indicates required

 

You will receive one email per day for 7 days – then you will receive my newsletter.
Your information will never be given to third parties.

You can unsubscribe in 1 click from any of my emails.

Cette page ne restera pas en ligne éternellement


Entre ton email pour recevoir gratuitement
la méthode PARÉ pour faire du Deep Learning


Tu recevras un email par jour pendant 7 jours - puis tu recevras ma newsletter.
Tes informations ne seront jamais cédées à des tiers.

Tu peux te désinscrire en 1 clic depuis n'importe lequel de mes emails.