# Le comportement des extravertis VS le comportement des introvertis

## Introduction:

Dans cet étude, nous allons faire de la probabilité sur le dataset. L'étude va tenir sur la présentation de l'échantillon, les types de variables, les variables aléaotoires, application des règles de calculs de probabilités et les loi de probabilité. 
 
Bien sûr à chaque étape, nous allons faire de l'interpretation et de commentaire.

Notre objectif principal est de se familiariser avec le langage python dans le domaine de probabilité mais aussi d'appliquer toutes les théories qu'on a vu pour l'utiliser dans le monde réel.

Sur ce passons au première étape

### 1) Présentation du dataset:

Notre donnée ou dataset est basée sur une étude qui porte sur le comportement des extravertis et des introvertis. Le but de l'étude est de savoir plus le quotidient de ces deux types de personnalités, leur mode de vie et ainsi ses intéractions sociaux.

Les variables dans le dataset sont:
- Temps passé seul (**Time_spent_Alone**) : Heures passées seul chaque jour (0 à 11).
- Peur de la scène (**Stage_fear**) : Présence du trac (Oui/Non).
- Présence d’événements sociaux (**Social_event_attendance**) : Fréquence des événements sociaux (0 à 10).
- Sorties(**Going_outside**) : Fréquence des sorties (0 à 7).
- Épuisé après les activités sociales(**Drained_after_socializing**) : Sentiment d’épuisement après les activités sociales (Oui/Non).
- Taille du cercle d’amis(**Friends_circle_size**) : Nombre d’amis proches (0 à 15).
- Fréquence des publications(**Post_frequency**) : Fréquence des publications sur les réseaux sociaux (0 à 10).
- Personnalité (**Personality**) : Variable cible (Extroverti/Introverti).

Le dataset contient en total *2900* lignes

Tout d'abord, voyons à quoi ressemble l' en-tête de l'ensemble de donnée:


In [30]:
#On va utiliser pandas pour lire le csv
import pandas as pd
from scipy.stats import binom, norm, uniform

def probabilite(x,n):
    return round((x/n) * 100, 2)

In [2]:
echantillon = pd.read_csv("dataset.csv")
echantillon.head()

Unnamed: 0,Time_spent_Alone,Stage_fear,Social_event_attendance,Going_outside,Drained_after_socializing,Friends_circle_size,Post_frequency,Personality
0,4.0,No,4.0,6.0,No,13.0,5.0,Extrovert
1,9.0,Yes,0.0,0.0,Yes,0.0,3.0,Introvert
2,9.0,Yes,1.0,2.0,Yes,5.0,2.0,Introvert
3,0.0,No,6.0,7.0,No,14.0,8.0,Extrovert
4,3.0,No,9.0,4.0,No,8.0,5.0,Extrovert


### 2) Question d'étude:

Maintenant nous allons poser toutes les questions intéréssants que nous allons répondre aux cours de cet étude:

Selon l' échantillon, quelle est la probabilité: 
- a) d'être un extraverti et d' être introverti
- b) d'avoir peur de la scène pour les deux cas
- c) d' être épuisé après les activités socials pour les deux cas
- d) d'être introverti et de passer moins de 5h seul
- e) d'être extraverti et de passer plus de 5h seul
- f) d'être introvertit et d 'avoir au maximum que deux amis
- g) d'être extravertit et d' avoir au minumum dix amis


En tenant compte que l'éspérance du **Going_outside** est la moyenne que les deux personnalités sors de chez lui pendant une journée:
- h) Quelle est la probabilité qu'un introvertit ne sort presque jamais de chez lui (going_outside <=1) pendant une semaine et qu'un extrovertit n'est presque jamais chez lui pendant une semaine(going_outside >=6).


Est-ce que je suis probablement un introvertit ou un extravertit si:
- i) je reste seul pendant 3h par jour, je n' ai pas peur de la scène, je sors 2 événements sociaux par mois, je sors 2 à 3 fois par jours(fréquence = 2 ou 3), je ne suis pas épuisé après un activité social, j'ai 5 meilleurs amis et je n'aime pas les réseaux sociaux donc je ne publie rien

Je me considère comme un extravertit et je demandais si je suis comme les autres ou pas:
 - j) je reste moins de 4h seul, j'ai un peu peur de monté sur scène par contre j'aime beaucoup les événements sociaux (j'y assiste 6 fois par semaine). Je sors souvent avec mes 3 meilleurs amis disant de fréquence de 4. Ça me dérange pas les activités  sociaux et je fais quelque publication de ma routine avec une fréquence de 3.

### 3) Réponse

#### a) Quelle est la probabilité d'être un extraverti et d' être un introverti?

In [50]:
compte_categorie = echantillon['Personality'].value_counts()
nb_lignes = 2900
nb_introvertit = compte_categorie['Introvert']
nb_extravertit = compte_categorie['Extrovert']
p_introvertit = probabilite(compte_categorie['Introvert'], nb_lignes)
p_extravertit = probabilite(compte_categorie['Extrovert'], nb_lignes)
print("La probabilité d' être un introverti est: ", p_introvertit , "%" )
print("La probabilité d' être un extraverti est: ", p_extravertit , "%" )

La probabilité d' être un introverti est:  48.59 %
La probabilité d' être un extraverti est:  51.41 %


#### b) Quelle est la probabilité d'avoir peur de la scène pour les deux cas?

In [40]:
# D'abord calculons la probabilité d'avoir peur de la scène pour une personne sans se baser de sa personalité

avoir_peur = echantillon ['Stage_fear'].value_counts()
p_avoir_peur = probabilite(avoir_peur['Yes'], avoir_peur['Yes'] + avoir_peur['No'])
print("La probabilité d'avoir peur de la scène pour une personne est: ", p_avoir_peur, " %. Et donc son inverse est", 100 - p_avoir_peur, "%")

#Maintenant calculons la probabilité d'avoir peur pour chaque personalité en utilisant un tableau de contigence

tableau = pd.crosstab(echantillon['Stage_fear'], echantillon['Personality'])
print (tableau)
p_avoir_peur_extravertit = probabilite(tableau['Extrovert']['Yes'] , (tableau['Extrovert']['No'] + tableau['Extrovert']['Yes']))
p_avoir_peur_introvertit = probabilite(tableau['Introvert']['Yes'] , (tableau['Introvert']['No'] + tableau['Introvert']['Yes']))
print("La probabilité d'avoir peur de la scène pour une personne extravertit est: ", p_avoir_peur_extravertit , "%")
print("La probabilité d'avoir peur de la scène pour une personne introvertit est: ", p_avoir_peur_introvertit, "%")








La probabilité d'avoir peur de la scène pour une personne est:  49.88  %. Et donc son inverse est 50.12 %
Personality  Extrovert  Introvert
Stage_fear                       
No                1338         79
Yes                111       1299
La probabilité d'avoir peur de la scène pour une personne extravertit est:  7.66 %
La probabilité d'avoir peur de la scène pour une personne introvertit est:  94.27 %


#### c) Quelle est la probabilité d' être épuisé après les activités socials pour les deux cas

In [39]:
tableau = pd.crosstab(echantillon['Drained_after_socializing'], echantillon['Personality'])
print(tableau)
p_etre_epuise_extravertit = probabilite(tableau['Extrovert']['Yes'] , (tableau['Extrovert']['No'] + tableau['Extrovert']['Yes']))
p_etre_epuise_introvertit = probabilite(tableau['Introvert']['Yes'] , (tableau['Introvert']['No'] + tableau['Introvert']['Yes']))
print("La probabilité d'être épuisé après les activités socials pour une personne extravertit est: ", p_etre_epuise_extravertit , "%")
print("La probabilité d'être épuisé après les activités socials pour une personne introvertit est: ", p_etre_epuise_introvertit, "%")

Personality                Extrovert  Introvert
Drained_after_socializing                      
No                              1362         79
Yes                              111       1296
La probabilité d'être épuisé après les activités socials pour une personne extravertit est:  7.54 %
La probabilité d'être épuisé après les activités socials pour une personne introvertit est:  94.25 %


#### d) Quelle est la probabilité d'être introverti et de passer moins de 5h seul

In [59]:
# D'abord selectionons seulement les personnes qui passe moins de 5h seul

filtre = echantillon[echantillon['Time_spent_Alone'] < 5]

# Ensuite faisons un compte selon la personalité

compte = filtre['Personality'].value_counts()
print(compte)

# Calculons la probabilit de passer moins de 5h seul sachant qu'on est introvertit

p_moins_introvertit = probabilite(compte['Introvert'], nb_introvertit)

# Enfin calculons la probabilité d' être introverti et de passer moins de 5h seul

p_moins_5_introvertit = round((p_introvertit/100) * (p_moins_introvertit/100) * 100 , 2)


print("La probabilit d' être introverti et de passer moins de 5h seul est: ", p_moins_5_introvertit, " %")

Personality
Extrovert    1354
Introvert     241
Name: count, dtype: int64
241 1409
La probabilit d' être introverti et de passer moins de 5h seul est:  8.31  %


#### e) Quelle est la probabilité d'être extraverti et de passer plus de 5h seul

In [61]:
# Selectionons seulement les personnes qui passe plus de 5h seul

filtre = echantillon[echantillon['Time_spent_Alone'] > 5]

# Ensuite faisons un compte selon la personalité

compte = filtre['Personality'].value_counts()
print(compte)

# Calculons la probabilit de passer plus de 5h seul sachant qu'on est extravertit

p_plus_extravertit = probabilite(compte['Extrovert'], nb_extravertit)

# Calculons la probabilité d' être extravertit et de passer plus de 5h seul

p_plus_5_extravertit = round((p_extravertit/100) * (p_plus_extravertit/100) * 100 , 2)


print("La probabilit d' être extravertit et de passer plus de 5h seul est: ", p_plus_5_extravertit, " %")

Personality
Introvert    962
Extrovert    100
Name: count, dtype: int64
La probabilit d' être extravertit et de passer plus de 5h seul est:  3.45  %


#### f) Quelle est la probabilité d'être introvertit et d 'avoir au maximum que deux amis

In [63]:
# Selectionons seulement les personnes qui ont au maximum deux amis

filtre = echantillon[echantillon['Friends_circle_size'] <= 2]

# Ensuite faisons un compte selon la personalité

compte = filtre['Personality'].value_counts()
print(compte)

# Calculons la probabilité d'avoir au maximum deux amis sachant qu'on est introvertit

p_max_introvertit = probabilite(compte['Introvert'], nb_introvertit)

# Enfin calculons la probabilité d' être introverti et d'avoir au maximum deux amis

p_max_2_introvertit = round((p_introvertit/100) * (p_max_introvertit/100) * 100 , 2)


print("La probabilit d' être introverti et d' avoir au maximum deux amis est: ", p_max_2_introvertit, " %")

Personality
Introvert    600
Extrovert     61
Name: count, dtype: int64
La probabilit d' être introverti et d' avoir au maximum deux amis est:  20.69  %


#### g) Quelle est la probabilité d'être extravertit et d' avoir au minumum dix amis

In [65]:
# Selectionons seulement les personnes qui ont au minimum dix amis

filtre = echantillon[echantillon['Friends_circle_size'] >= 10]

# Ensuite faisons un compte selon la personalité

compte = filtre['Personality'].value_counts()
print(compte)

# Calculons la probabilité d'avoir au minimum dix amis sachant qu'on est extravertit

p_min_extravertit = probabilite(compte['Extrovert'], nb_extravertit)

# Enfin calculons la probabilité d' être extravertit et d'avoir au minimum dix amis

p_min_10_extravertit = round((p_extravertit/100) * (p_min_extravertit/100) * 100 , 2)


print("La probabilit d' être extravertit et d' avoir au minimum dix amis est: ", p_min_10_extravertit, " %")

Personality
Extrovert    697
Introvert     57
Name: count, dtype: int64
La probabilit d' être extravertit et d' avoir au minimum dix amis est:  24.03  %
