# Introduction à Pandas
Pandas est une bibliothèque Python populaire pour **l’analyse de données**. Elle vous permet de manipuler, d’analyser et de visualiser efficacement des ensembles de données.

Les deux objets principaux dans Pandas sont :

- ***DataFrame*** : Une table avec des lignes et colonnes.
- ***Series*** : Une liste ordonnée de données (une seule colonne d’un DataFrame).

### 1. Importer Pandas
Commencez par importer la bibliothèque avec :

In [6]:
import pandas as pd

### 2. Créer des données avec Pandas

#### 2.1 DataFrame
Un DataFrame est une table avec des colonnes et des lignes.

Créer un **DataFrame simple** :

In [10]:
df = pd.DataFrame({'Yes': [50, 21], 'No': [131, 2]})
print(df)

   Yes   No
0   50  131
1   21    2


Créer un **DataFrame avec des étiquettes de ligne personnalisées** :

In [13]:
df = pd.DataFrame({'Bob': ['I liked it.', 'It was awful.'], 
                   'Sue': ['Pretty good.', 'Bland.']},
                  index=['Product A', 'Product B'])
print(df)

                     Bob           Sue
Product A    I liked it.  Pretty good.
Product B  It was awful.        Bland.


**2.2 Series**

Une Series est une séquence ordonnée de données.

Créer une **Series simple** :

In [18]:
s = pd.Series([1, 2, 3, 4, 5])
print(s)

0    1
1    2
2    3
3    4
4    5
dtype: int64


Créer une **Series avec un index personnalisé** :

In [21]:
s = pd.Series([30, 35, 40], index=['2015 Sales', '2016 Sales', '2017 Sales'], name='Product A')
print(s)

2015 Sales    30
2016 Sales    35
2017 Sales    40
Name: Product A, dtype: int64


### 3. Lire des fichiers de données
La méthode la plus courante consiste à lire des fichiers CSV.

**Lire un fichier CSV dans un DataFrame** :

In [26]:
wine_reviews = pd.read_csv('winemag_data_130k_v2.csv')
print(wine_reviews.head())

   Unnamed: 0   country                                        description  \
0           0     Italy  Aromas include tropical fruit, broom, brimston...   
1           1  Portugal  This is ripe and fruity, a wine that is smooth...   
2           2        US  Tart and snappy, the flavors of lime flesh and...   
3           3        US  Pineapple rind, lemon pith and orange blossom ...   
4           4        US  Much like the regular bottling from 2012, this...   

                          designation  points  price           province  \
0                        Vulkà Bianco      87    NaN  Sicily & Sardinia   
1                            Avidagos      87   15.0              Douro   
2                                 NaN      87   14.0             Oregon   
3                Reserve Late Harvest      87   13.0           Michigan   
4  Vintner's Reserve Wild Child Block      87   65.0             Oregon   

              region_1           region_2         taster_name  \
0              

In [28]:
# Spécifier une colonne comme index :

wine_reviews = pd.read_csv('winemag_data_130k_v2.csv', index_col=0)
print(wine_reviews.head())

    country                                        description  \
0     Italy  Aromas include tropical fruit, broom, brimston...   
1  Portugal  This is ripe and fruity, a wine that is smooth...   
2        US  Tart and snappy, the flavors of lime flesh and...   
3        US  Pineapple rind, lemon pith and orange blossom ...   
4        US  Much like the regular bottling from 2012, this...   

                          designation  points  price           province  \
0                        Vulkà Bianco      87    NaN  Sicily & Sardinia   
1                            Avidagos      87   15.0              Douro   
2                                 NaN      87   14.0             Oregon   
3                Reserve Late Harvest      87   13.0           Michigan   
4  Vintner's Reserve Wild Child Block      87   65.0             Oregon   

              region_1           region_2         taster_name  \
0                 Etna                NaN       Kerin O’Keefe   
1                  NaN

In [30]:
# Comprendre la taille des données :

print(wine_reviews.shape)  # Renvoie (lignes, colonnes)

(129971, 13)


### 4. Sauvegarder des données
Après avoir manipulé vos données, vous pouvez les sauvegarder dans un fichier.

Sauvegarder un DataFrame dans un fichier CSV :

In [33]:
wine_reviews.to_csv('output.csv', index=False)