Ces librairies vont vous épargner la plus grosse partie du travail en Machine Learning et cela… sans diminuer la qualité de votre modèle !
En Machine Learning de nombreuses études, comme celle réalisée par Forbes, ont démontré que ce n’est pas la création du modèle qui prend le plus de temps.
Au contraire, c’est l’analyse, la préparation et le nettoyage des données qui accapare la plus grande place dans le travail d’un Ingénieur en Machine Learning.
Ces étapes font toutes parties de ce qu’on appelle le Preprocessing.
Et si je vous disais que des solutions existent pour éviter ce travail fastidieux ?
On voit ça tout de suite avec ces 3 librairies Python d’AutoML : le Machine Learning Automatique !
TPOT
La première libraire qu’on vous présente est TPOT (prononcé en anglais « tea pot »).
Les développeurs derrière TPOT ont pensé cette librairie comme un Assistant pour la Data Science. Elle permet d’optimisez vos pipelines de Machine Learning en ce basant sur des algorithmes Génétiques (un type d’algorithme utilisé actuellement par les chercheurs en Machine Learning).
Vous n’aurez aucun mal à vous familiariser avec TPOT vu qu’elle est basée sur Sckit-Learn, la librairie numéro 1 pour faire du Machine Learning classique.
Avec cette librairie vous n’avez plus qu’a charger votre dataset et laisser l’algorithme de TPOT s’occuper du reste !
AutoGluon
AutoGluon est la deuxième librairie que l’on souhaite vous présenter. Les développeurs de ce package propose d’atteindre 4 objectifs :
Au fait, si ton objectif est d'apprendre le Deep Learning - j’ai préparé pour toi le Plan d’action pour Maîtriser les Réseaux de neurones.
7 jours de conseils gratuits d’un ingénieur spécialisé en Intelligence Artificielle pour apprendre à maîtriser les réseaux de neurones à partir de zéro :
- Planifie ton apprentissage
- Structure tes projets
- Développe tes algorithmes d’Intelligence Artificielle
J’ai basé ce programme sur des faits scientifiques, des approches éprouvées par des chercheurs mais également mes propres techniques que j'ai conçues au fil de mes expériences dans le domaine du Deep Learning.
Pour y accéder, clique ici :
À présent, on peut revenir à ce que je mentionnais précédemment.
- Implémenter des modèles de ML et DL capable de traites des données brutes
- Permettre a tous les Data Scientists d’utiliser les algorithmes à la pointe de la recherche
- Optimiser automatiquement les hyperparamètres de votre modèle pour qu’il s’adapte facilement à la structure de vos données
- Personnalisez vos modèle et vos pipelines à votre manière pour exploiter le meilleur d’AutoGluon
En plus de cela, des tutoriels pour utiliser facilement leur librairie sont disponible directement sur leur site. AutoGluon est peu connu mais très prometteur !
Auto-Keras
La dernière librairie qu’on souhaitait vous présenter et que vous connaissez peut-être déjà s’appelle Auto-Keras.
D’après François Chollet, c’est LA librairie sur laquelle vont se concentrer les développeurs de Keras dans les prochaines années. Effectivement, il considère que l’AutoML va prendre une place majeure dans les années qui arrivent. Il s’est fixé un objectif :
En tant qu’Ingénieur, notre but est d’accélérer l’émergence du futur. (As a Tool Maker, we are trying to make the future happened faster.)
François Chollet, Keras: The Next Five Years, 2020
C’est une librairie que nous avons déjà présenté dans ce tutoriel
AutoKeras m’a permis notamment d’avoir une précision de 83% dans une compétition Kaggle. Et cela en seulement 4 lignes de code pour construire mon modèle de Machine Learning.
À savoir
Les librairies d’AutoML ne vont pas vous permettre d’apprendre la Data Science en un jour.
Cependant c’est une solution qui, dans bien des cas, est plus efficace qu’un algorithme de Machine Learning classique.
Effectivement, les librairies d’AutoML vont vous faire économiser toute la durée de preprocessing des données tout en gardant une haute qualité de résultat.
C’est pour cela que chez Inside Machine Learning on pense que l’AutoML est une technique essentielle à connaître pour les futurs Ingénieur en Intelligence Artificielle.
Un dernier mot, si tu veux aller plus loin et apprendre le Deep Learning - j’ai préparé pour toi le Plan d’action pour Maîtriser les Réseaux de neurones.
7 jours de conseils gratuits d’un ingénieur spécialisé en Intelligence Artificielle pour apprendre à maîtriser les réseaux de neurones à partir de zéro :
- Planifie ton apprentissage
- Structure tes projets
- Développe tes algorithmes d’Intelligence Artificielle
J’ai basé ce programme sur des faits scientifiques, des approches éprouvées par des chercheurs mais également mes propres techniques que j'ai conçues au fil de mes expériences dans le domaine du Deep Learning.
Pour y accéder, clique ici :