Ces 5 erreurs ruinent ton algo de Machine Learning

Quelles sont les 5 erreurs fréquentes qui ruinent les modèles de Machine Learning ? C’est ce qu’on voit ensemble dans cet article !

5 erreurs en Machine Learning

Ne pas analyser ses Données

Une erreur qu’on voit souvent chez les débutants.

Les algos de Machine Learning peuvent sembler si puissant qu’on peut en oublier que, parfois, une simple analyse de données suffirait à résoudre notre problème.

Il faut donc toujours prendre le temps d’étudier ses données.

Chez Inside Machine Learning, on vous conseille d’utiliser le package matplotlib.

Cette libraire permet de tracer facilement des graphs.

Avec ça vous pourrez avoir des résultats visuels et efficaces pour vos analyses de données !

L’Overfitting

L’erreur classique en Machine Learning : l’overfitting !

Celle-ci, vous la connaissez sûrement.

Elle consiste à entraîner tellement son modèle de Machine Learning qu’il en devient inefficace !

Comment est-ce possible ?

Eh bien, lors de l’entraînement, votre modèle se perfectionne uniquement en regardant les données que vous lui avez fourni. Cela peut l’amener à trouver des solutions qui fonctionnent seulement sur ces données et pas sur d’autres.

On dit que le modèle n’arrive plus à généraliser.

Pour éviter cette erreur, veiller à évaluer votre modèle à la fois sur des données d’entraînement mais aussi sur des données de validation !

Quand vous voyez que les résultats du modèle augmente sur les données d’entraînement mais diminue sur les données de validation, c’est sûrement mauvais signe !

Pour les plus curieux, on a écrit un article où l’on voit un exemple concret pour contrer l’overfitting, c’est par ici ! 💡

Manque de données

Une autre erreur fréquente en Machine Learning est le manque de données.

Celui-ci, c’est la hantise des Data Scientists !

Avoir passer tout un projet à réaliser un modèle de Machine Learning… pour se rendre compte à la fin qu’il n’y a pas assez de données.

En réalité, c’est plus un oubli qu’une erreur. Mais il reste fréquent de voir ce problème subvenir lors d’un projet conséquent !

Pour prévenir le manque de données, déterminez à l’avance vos besoins.

Mais surtout, mesurez la complexité de la tâche que vous voulez résoudre.

Plus elle sera difficile, plus le nombre de données nécessaire sera important.


CRÉER TON APPLICATION IA !


Reçois tes 5 JOURS De Formation GRATUITE Pour Apprendre À Créer Ton APPLICATION d’INTELLIGENCE ARTIFICIELLE !


Tous les fondamentaux de la création d’Application IA : les approches, les outils et techniques, les librairies et framework, et bien d'autres !

Découvres étape par étape la création d’application de Deep Learning (tu apprendras même à trouver des idées d’appli !).

En bonus, tu recevras notre Guide Ultime du Deep Learning !


Photo by Alex Iby on Unsplash

Réseaux de neurones trop profond

Ici, on rentre dans des erreurs plus techniques.

En Deep Learning, le système de couches de neurones est vraiment intéressant et en rajouter quelques-unes dans un modèle peut parfois faire des miracles !

Avec le model GPT-3 développé par Open.AI, on parle de 96 couches de neurones !

Ce modèle peut résoudre des dizaines de tâches comme faire un résumé de livre ou bien même engager une conversation avec vous.

Mais pour des problèmes plus simples, un grand nombre de couches est souvent inutile… voire contraignant.

En effet, il engendre un temps d’entraînement particulièrement long et mène régulièrement à de l’overfitting (une erreur que vous connaissez déjà !)

Cependant si votre tâche nécessite réellement un grand nombre de couches alors on vous conseille de vous munir d’un bon GPU… ou bien d’une bonne dose de calme et de patience.

Et n’oubliez pas, parfois le modèle de Machine Learning que vous souhaitez faire existe déjà sur internet. Alors avant de vous lancer dans de longues heures de travail, n’hésitez pas à regarder avant si quelqu’un n’a pas déjà réalisé ce que vous voulez faire ! 😉

Utiliser la mauvaise fonction d’activation

La dernière erreur que l’on voit ensemble reposent sur le choix de la fonction d’activation.

C’est un concept qui n’est pas forcément simple à appréhender pour les débutants en Machine Learning.

Pourtant, il est fondamental pour construire un bon modèle de prédiction.

C’est pourquoi on a écrit un article spécialement dédier aux fonctions d’activation, avec en bonus un tableau récapitulatif pour savoir laquelle choisir selon le problème à résoudre.

C’est tout pour cet article, on espère qu’il vous aura plus.

Plus d’astuces en Machine Learning vous attendent dans cette section !


CRÉER TON APPLICATION IA !


Reçois tes 5 JOURS De Formation GRATUITE Pour Apprendre À Créer Ton APPLICATION d’INTELLIGENCE ARTIFICIELLE !


Tous les fondamentaux de la création d’Application IA : les approches, les outils et techniques, les librairies et framework, et bien d'autres !

Découvres étape par étape la création d’application de Deep Learning (tu apprendras même à trouver des idées d’appli !).

En bonus, tu recevras notre Guide Ultime du Deep Learning !


Tom Keldenich
Tom Keldenich

Data Engineer & passionné d'Intelligence Artificielle !

Fondateur du site Inside Machine Learning

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée.