Ces librairies de Machine Learning vous épargne 80 % du travail

Ces librairies vont vous épargner la plus grosse partie du travail en Machine Learning et cela… sans diminuer la qualité de votre modèle !

En Machine Learning de nombreuses études, comme celle réalisée par Forbes, ont démontré que ce n’est pas la création du modèle qui prend le plus de temps.

Au contraire, c’est l’analyse, la préparation et le nettoyage des données qui accapare la plus grande place dans le travail d’un Ingénieur en Machine Learning.

Ces étapes font toutes parties de ce qu’on appelle le Preprocessing.

Et si je vous disais que des solutions existent pour éviter ce travail fastidieux ?

On voit ça tout de suite avec ces 3 librairies Python d’AutoML : le Machine Learning Automatique !

TPOT

La première libraire qu’on vous présente est TPOT (prononcé en anglais « tea pot »).

Les développeurs derrière TPOT ont pensé cette librairie comme un Assistant pour la Data Science. Elle permet d’optimisez vos pipelines de Machine Learning en ce basant sur des algorithmes Génétiques (un type d’algorithme utilisé actuellement par les chercheurs en Machine Learning).

Vous n’aurez aucun mal à vous familiariser avec TPOT vu qu’elle est basée sur Sckit-Learn, la librairie numéro 1 pour faire du Machine Learning classique.

Avec cette librairie vous n’avez plus qu’a charger votre dataset et laisser l’algorithme de TPOT s’occuper du reste !

AutoGluon

AutoGluon est la deuxième librairie que l’on souhaite vous présenter. Les développeurs de ce package propose d’atteindre 4 objectifs :

Au fait, si ton objectif est d'apprendre le Deep Learning - j’ai préparé pour toi le Plan d’action pour Maîtriser les Réseaux de neurones.

7 jours de conseils gratuits d’un ingénieur spécialisé en Intelligence Artificielle pour apprendre à maîtriser les réseaux de neurones à partir de zéro :

  • Planifie ton apprentissage
  • Structure tes projets
  • Développe tes algorithmes d’Intelligence Artificielle

J’ai basé ce programme sur des faits scientifiques, des approches éprouvées par des chercheurs mais également mes propres techniques que j'ai conçues au fil de mes expériences dans le domaine du Deep Learning.

Pour y accéder, clique ici :

RECEVOIR MON PLAN D'ACTION

RECEVOIR MON PLAN D'ACTION

À présent, on peut revenir à ce que je mentionnais précédemment.

  • Implémenter des modèles de ML et DL capable de traites des données brutes
  • Permettre a tous les Data Scientists d’utiliser les algorithmes à la pointe de la recherche
  • Optimiser automatiquement les hyperparamètres de votre modèle pour qu’il s’adapte facilement à la structure de vos données
  • Personnalisez vos modèle et vos pipelines à votre manière pour exploiter le meilleur d’AutoGluon

En plus de cela, des tutoriels pour utiliser facilement leur librairie sont disponible directement sur leur site. AutoGluon est peu connu mais très prometteur !

Photo by SpaceX on Unsplash

Auto-Keras

La dernière librairie qu’on souhaitait vous présenter et que vous connaissez peut-être déjà s’appelle Auto-Keras.

D’après François Chollet, c’est LA librairie sur laquelle vont se concentrer les développeurs de Keras dans les prochaines années. Effectivement, il considère que l’AutoML va prendre une place majeure dans les années qui arrivent. Il s’est fixé un objectif :

En tant qu’Ingénieur, notre but est d’accélérer l’émergence du futur. (As a Tool Maker, we are trying to make the future happened faster.)

François Chollet, Keras: The Next Five Years, 2020

C’est une librairie que nous avons déjà présenté dans ce tutoriel

AutoKeras m’a permis notamment d’avoir une précision de 83% dans une compétition Kaggle. Et cela en seulement 4 lignes de code pour construire mon modèle de Machine Learning.

À savoir

Les librairies d’AutoML ne vont pas vous permettre d’apprendre la Data Science en un jour.

Cependant c’est une solution qui, dans bien des cas, est plus efficace qu’un algorithme de Machine Learning classique.

Effectivement, les librairies d’AutoML vont vous faire économiser toute la durée de preprocessing des données tout en gardant une haute qualité de résultat.

C’est pour cela que chez Inside Machine Learning on pense que l’AutoML est une technique essentielle à connaître pour les futurs Ingénieur en Intelligence Artificielle.

Un dernier mot, si tu veux aller plus loin et apprendre le Deep Learning - j’ai préparé pour toi le Plan d’action pour Maîtriser les Réseaux de neurones.

7 jours de conseils gratuits d’un ingénieur spécialisé en Intelligence Artificielle pour apprendre à maîtriser les réseaux de neurones à partir de zéro :

  • Planifie ton apprentissage
  • Structure tes projets
  • Développe tes algorithmes d’Intelligence Artificielle

J’ai basé ce programme sur des faits scientifiques, des approches éprouvées par des chercheurs mais également mes propres techniques que j'ai conçues au fil de mes expériences dans le domaine du Deep Learning.

Pour y accéder, clique ici :

RECEVOIR MON PLAN D'ACTION

RECEVOIR MON PLAN D'ACTION

Tom Keldenich
Tom Keldenich

Ingénieur spécialisé en Intelligence Artificielle et passionné de données !

Fondateur du site Inside Machine Learning

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *

This page will not stay online forever

Enter your email to receive for free

The PANE method for Deep Learning

* indicates required

 

You will receive one email per day for 7 days – then you will receive my newsletter.
Your information will never be given to third parties.

You can unsubscribe in 1 click from any of my emails.



Entre ton email pour recevoir gratuitement
la méthode PARÉ pour faire du Deep Learning


Tu recevras un email par jour pendant 7 jours - puis tu recevras ma newsletter.
Tes informations ne seront jamais cédées à des tiers.

Tu peux te désinscrire en 1 clic depuis n'importe lequel de mes emails.