Quelle est la différence entre une classe et un label ? – Tout ce que vous devez savoir maintenant

Dans cet article on va voir un moyen mnémotechnique efficace pour toujours se rappeler ce qu’est une classe et un label en classification.

En Machine Learning différents types d’approches existent pour résoudre un problème.

Parmi eux, les problèmes de classification forment une large partie du spectre.

Malheureusement certains concept de la classification sont confondus ou mal compris pour certaines personnes.

Voyons maintenant comment se souvenir de ces différents concepts :

  • Classe et Label
  • Classification binaire
  • Classification multiclasse – multilabel

Qu’est-ce qu’une classe ?

Prenons un exemple.

Nous devons prédire la météo à Paris pour tous les jours de la semaine.

Données

Ici nous voulons seulement prédire s’il fera beau.

Pour cet exemple, on a trois options : soleil, pluie, neige.

Chaque jour doit être classer (ou classifier) dans chacune de ces options.

C’est donc un problème de classification.

À noter que, si nous devions prédire la température en °C, ce ne serait plus un problème de classification mais de régression.

Ces trois options (soleil, pluie, neige) sont en fait nos classes.

Ce sont les trois dans lesquels nous devons classer nos données (les jours de la semaine).

Données classifiées

Mnémotechnique : Une classe est une catégorie dans laquelle classer (classifier) nos données.

Une classification binaire c’est une classification avec seulement deux classes.

Une classification multiclasse c’est une classification avec plus de deux classes.

Qu’est-ce qu’un label ?

Poursuivons notre exemple.

Maintenant nous ne devons plus uniquement prédire la météo pour Paris mais aussi pour Miami et Moscou.

Au fait, si ton objectif est d'apprendre le Deep Learning - j’ai préparé pour toi le Plan d’action pour Maîtriser les Réseaux de neurones.

7 jours de conseils gratuits d’un ingénieur spécialisé en Intelligence Artificielle pour apprendre à maîtriser les réseaux de neurones à partir de zéro :

  • Planifie ton apprentissage
  • Structure tes projets
  • Développe tes algorithmes d’Intelligence Artificielle

J’ai basé ce programme sur des faits scientifiques, des approches éprouvées par des chercheurs mais également mes propres techniques que j'ai conçues au fil de mes expériences dans le domaine du Deep Learning.

Pour y accéder, clique ici :

RECEVOIR MON PLAN D'ACTION

RECEVOIR MON PLAN

À présent, on peut revenir à ce que je mentionnais précédemment.

Données labellisées

Ici nous voulons toujours prédire s’il fera beau.

MAIS pour un même jour, nous avons 3 localisations différentes. Et donc 3 résultats possibles.

Ces villes sont en fait nos labels.

Ces labels permettent de différencier nos jours de la semaine selon la ville.

Le problème de classification est toujours le même mais il faudra répéter l’opération pour chacun des labels.

Données labellisées et classifiées

Mnémotechnique : Un label est une catégorie qui permet de différencier (labelliser) nos données.

Une classification multiclasse multilabel est une classification avec plus de deux classes et plus d’un label.

À noter que différents labels pour des données n’implique pas nécessairement les mêmes classes.

On peut imaginer qu’à New York on ait 3 classes (soleil, pluie, neige) quand à Londres seulement 2 (pluie, nuageux).

Classe, label et après ?

En Deep Learning il faut adapter son réseau de neurones à chacun de ces types de classification.

Effectivement, pour un problème de classification binaire, la couche de sortie ne sera pas la même que dans un problème de classification multiclasse.

Une couche de sortie implique une fonction d’activation différentes !

Dans cet article, on présente le type de fonction d’activation à utiliser dans chacune des classifications. Un tableau vous attends en fin d’article avec le résumé de ces connaissances.

source :

Un dernier mot, si tu veux aller plus loin et apprendre le Deep Learning - j’ai préparé pour toi le Plan d’action pour Maîtriser les Réseaux de neurones.

7 jours de conseils gratuits d’un ingénieur spécialisé en Intelligence Artificielle pour apprendre à maîtriser les réseaux de neurones à partir de zéro :

  • Planifie ton apprentissage
  • Structure tes projets
  • Développe tes algorithmes d’Intelligence Artificielle

J’ai basé ce programme sur des faits scientifiques, des approches éprouvées par des chercheurs mais également mes propres techniques que j'ai conçues au fil de mes expériences dans le domaine du Deep Learning.

Pour y accéder, clique ici :

RECEVOIR MON PLAN D'ACTION

RECEVOIR MON PLAN

Tom Keldenich
Tom Keldenich

Ingénieur spécialisé en Intelligence Artificielle et passionné de données !

Fondateur du site Inside Machine Learning

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *

This page will not stay online forever

Enter your email to receive for free

The PANE method for Deep Learning

* indicates required

 

You will receive one email per day for 7 days – then you will receive my newsletter.
Your information will never be given to third parties.

You can unsubscribe in 1 click from any of my emails.



Entre ton email pour recevoir gratuitement
la méthode PARÉ pour faire du Deep Learning


Tu recevras un email par jour pendant 7 jours - puis tu recevras ma newsletter.
Tes informations ne seront jamais cédées à des tiers.

Tu peux te désinscrire en 1 clic depuis n'importe lequel de mes emails.