Ouvrir et Enregistrer un CSV facilement avec Pandas

Comment ouvrir et enregistrer facilement un CSV avec la librairie Pandas ? Ici vous trouverez les lignes de code les plus utilisée en Data.

Pour ce tutoriel, on utilisera le fichier happiness.csv qui se situe sur ce lien GitHub.

Mais le préalable essentiel est d’importer Pandas :

import pandas as pd

Et on peut commencer !

Ouvrir un csv

Méthode classique

La méthode classique est simplement d’utiliser la fonction read_csv() en indiquant le chemin du fichier csv :

df = pd.read_csv('chemin/happiness.csv')

Méthode des colonnes

Si on veut extraire seulement une partie du csv, on peut l’indiquer à pandas directement dans la fonction read_csv(), avec l’attribut usecols comme ci-dessous :

df = pd.read_csv('chemin/happiness.csv', usecols=['Gender','Mean','N='])

Méthode du séparateur

Et finalement une méthode vitale quand on a des csv enregistrés avec différent séparateur comme : ‘.’, ‘;’ ou d’autres.

Dans cet exemple, notre csv utilise la virgule ‘,’ comme séparateur :

df = pd.read_csv('chemin/happiness.csv', sep = ',')

On sait maintenant comment ouvrir un csv, passons à comment en créer un !

LA MÉTHODE PARÉ POUR FAIRE DU DEEP LEARNING !

Reçois tes 7 JOURS De Formation GRATUITE Pour Apprendre À Créer TA PREMIÈRE INTELLIGENCE ARTIFICIELLE !

Pendant les 7 prochains jours je vais te montrer comment utiliser les Réseaux de neurones.

Tu vas comprendre ce qu'est le Deep Learning avec des exemples concrets qui vont te rester dans la tête.

ATTENTION, cette série d’email ne s’adresse pas à tout le monde. Si tu es du genre à aimer les cours théoriques et scolaires tu peux passer ta route.

Mais si tu souhaite apprendre la méthode PARÉ pour faire du Deep Learning, clique ici :

Photo by Zoe Nicolaou on Unsplash

Enregistrer un csv

Méthode classique

Pour enregistrer un csv depuis un dataframe il suffit d’utiliser la fonction to_csv() en indiquant le chemin et le nom de fichier souhaité :

df.to_csv('chemin/new_happiness.csv')

Méthode conseillée

La méthode qu’on conseille chez Inside Machine Learning est d’utiliser l’attribut index est de lui donner la valeur False :

df.to_csv('chemin/new_happiness.csv', index=False)

En fait, si on ne le fait pas, la valeur par défaut est True. Cela veut dire qu’on importera dans le csv les colonnes et les valeurs de chaque ligne, mais aussi la colonne index en plus d’avoir l’index de base dans chaque csv.

En bref index=False permet d’éviter d’avoir deux colonnes indiquant l’index de chaque ligne dans notre csv final !

Méthode compressée

Pour terminer, une autre méthode existe pour les DataFrame volumineux : la méthode compressée.

Il suffit d’ajouter d’indiquer l’attribut compression dans la fonction et d’écrire notre fichier en .zip et non en .csv :

df.to_csv('chemin/new_happiness.zip', index=False, compression='zip')

À savoir que plusieurs formats sont disponible. Les voici détaillés : ‘infer’, ‘gzip’, ‘bz2’, ‘zip’, ‘xz’.

C’est tout pour ce tutoriel. On espère qu’il vous sera utile 😉

Le happiness.csv vous intéresse ? On une utilise dessus une technique pour booster son Machine Learning dans cet article… à lire !

sources :

LA MÉTHODE PARÉ POUR FAIRE DU DEEP LEARNING !

Reçois tes 7 JOURS De Formation GRATUITE Pour Apprendre À Créer TA PREMIÈRE INTELLIGENCE ARTIFICIELLE !

Pendant les 7 prochains jours je vais te montrer comment utiliser les Réseaux de neurones.

Tu vas comprendre ce qu'est le Deep Learning avec des exemples concrets qui vont te rester dans la tête.

ATTENTION, cette série d’email ne s’adresse pas à tout le monde. Si tu es du genre à aimer les cours théoriques et scolaires tu peux passer ta route.

Mais si tu souhaite apprendre la méthode PARÉ pour faire du Deep Learning, clique ici :

Tom Keldenich
Tom Keldenich

Data Engineer & passionné d'Intelligence Artificielle !

Fondateur du site Inside Machine Learning

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Enter your email to receive for free

The PANE method for Deep Learning

* indicates required

 

You will receive one email per day for 7 days – then you will receive my newsletter.
Your information will never be given to third parties.

You can unsubscribe in 1 click from any of my emails.

Entre ton email pour recevoir gratuitement
la méthode PARÉ pour faire du Deep Learning


Tu recevras un email par jour pendant 7 jours - puis tu recevras ma newsletter.
Tes informations ne seront jamais cédées à des tiers.

Tu peux te désinscrire en 1 clic depuis n'importe lequel de mes emails.