# Les donnés de l'American National Election Survey 2020 (ANES 2020)

Jusqu'à présent, vous avez utilisé les "notebooks" pour rédiger vos travaux...

Mais, ces "notebooks" sont extrêmeent puissants. Ils sont reliés à un super-ordinateur permettant d'effectuer des calculs de haute performance!

![](https://www.ctvnews.ca/polopoly_fs/1.4899418.1587069197!/httpImage/image.png_gen/derivatives/landscape_960/image.png)

In [None]:
# Chargement de la librarie d'analyse
import pandas as pd

# Importations des données
data_url = "https://raw.githubusercontent.com/datamisc/ts-2020/main/data.csv"
anes_data  = pd.read_csv(data_url, compression='gzip')
anes_data


In [None]:
# Sélection de variables
my_vars = [
    "V201032",  # vote
    "V201033",  # intentions
    "V201507x", # age
    "V201200",  # ideologie
]

df = anes_data[my_vars]
df.columns = ["vote", "intentions", "age", "ideologie"]
df

In [None]:
# Regardons à la participation
tmp = df.loc[df['vote'].between(1,2),['vote']].replace(
    {1:"Oui", 2:"Non"}
).value_counts(
    normalize=True,
).sort_index()

print(tmp)
tmp.plot(
    kind='bar', 
    title="Participation",
    figsize=(10,8),
    xlabel="Intention d'aller voter",
    alpha=.3,
    rot=0
);

In [None]:
# Un peu de ménage
mask = (df['age'] >= 18) & (df['ideologie'].between(1, 7)) & (df['intentions'].between(1,2))
df = df[mask]

In [None]:
# Regardons à la distribution de l'âge des répondants
df['age'].plot(
    kind='hist', 
    bins=30, 
    title="Distribution de l'âge",
    figsize=(10,8),
    alpha=.3,
);


In [None]:
# Est-ce que l'électorat américain est idéologiquement polarisé?
df['ideologie'].replace(
    {1:"1. Ext. Lib.", 2:"2. Lib.", 3:"3. Sl. Lib.", 4:"4. Moderate", 5: "5. Sl. Con.", 6: "6. Con", 7: "7. Ext. Con."}
).value_counts(
    normalize=True
).sort_index().plot(
    kind='bar', 
    rot=45,
    title="Distribution de l'idéologie",
    figsize=(10,8),
    alpha=.3,
);


In [None]:
# Regardons aux intentions de vote
tmp = df['intentions'].replace(
    {1:"J.Biden", 2:"D.Trump"}
).value_counts(
    normalize=True
).sort_index()

print(tmp)
tmp.plot(
    kind='bar', 
    title="Distribution des intentions de vote",
    figsize=(10,8),
    alpha=.3,
);
