Index de l'article

Données, Pandas et quelques graphiques

Première approche des graphiques, nous aurons donc besoin en plus de la bibliothèque matplotlib.

Pour aller encore plus loin, voici de quoi passer l'horizon ;)

Lien pointant vers un site présentant les commandes de bases pour matplotlib
http://www.python-simple.com/python-matplotlib/matplotlib-intro.php

Lien pointant vers la documentation officielle pandas.org:
https://matplotlib.org/stable/contents.html

Tester puis comprendre

#ceci est un script
import pandas as pd
url="https://www.ipa-troulet.fr/cours/attachments/article/577/nat2019_simplifie.csv"
donnees = pd.read_csv(url, sep=";",encoding="utf-8")
#
print("les données sources")
print(donnees)

#
print(" Mon choix = INDY")
df=donnees.loc[donnees['preusuel']=="INDY",:]
print(df)

#
print("Je suppr les XXXX de annais")
df.drop( df[df['annais']=="XXXX"].index, inplace=True)
print(df)
print("Je suppr les colonnes sexe et preusuel")
del df['sexe'],df['preusuel']
print(df)

#
import matplotlib.pyplot as plt
df = df.set_index('annais')
df.plot(kind='bar',  title='effectif du prénom')
plt.show()

 

Explication de texte du script

Les dernières lignes représentent graphiquement toutes les données numériques du dataframe, c'est pour cela que je supprime toutes les données pour ne garder que deux index: annais et nombre.

Evidement les prints ne sont là que pour comprendre...

 

Pièce(s) jointe(s)
Download this file (nat2019.csv)nat2019.csv[ ]11599 kB
Download this file (nat2019_simplifie.csv)nat2019_simplifie.csv[ ]2 kB