In [4]:
%reload_ext sql

In [5]:
%sql postgresql://user:mdp@localhost/postgres

In [6]:
%%sql
DROP TABLE IF EXISTS PASSENGER;
DROP TABLE IF EXISTS TICKET;

CREATE TABLE TICKET(
    PassengerId integer,
    Ticket varchar(20),
    Fare float,
    Cabin varchar(20),
    Embarked varchar(10),
    PRIMARY KEY(PassengerId)
);

CREATE TABLE PASSENGER(
    PassengerId integer, 
    Survived integer,
    Pclass integer,
    Name varchar(100), 
    Sex varchar(10), 
    Age float, 
    SibSp integer,
    Parch integer,
    PRIMARY KEY(Name)
);

 * postgresql://whooper:***@localhost/postgres


InternalError: (psycopg2.errors.DependentObjectsStillExist) cannot drop table passenger because other objects depend on it
DETAIL:  view male depends on table passenger
view female depends on table passenger
view "décédé" depends on table passenger
view vivant depends on table passenger
HINT:  Use DROP ... CASCADE to drop the dependent objects too.

[SQL: DROP TABLE IF EXISTS PASSENGER;]
(Background on this error at: http://sqlalche.me/e/14/2j85)

In [7]:
%%sql
COPY PASSENGER FROM '/Users/whooper/Downloads/BDD_PASSENGER.csv' DELIMITER ';' CSV HEADER;
COPY TICKET FROM '/Users/whooper/Downloads/BDD_TICKET.csv' DELIMITER ';' CSV HEADER;

 * postgresql://whooper:***@localhost/postgres


IntegrityError: (psycopg2.errors.UniqueViolation) duplicate key value violates unique constraint "passenger_pkey"
DETAIL:  Key (name)=(Braund, Mr. Owen Harris) already exists.
CONTEXT:  COPY passenger, line 2

[SQL: COPY PASSENGER FROM '/Users/whooper/Downloads/BDD_PASSENGER.csv' DELIMITER ';' CSV HEADER;]
(Background on this error at: http://sqlalche.me/e/14/gkpj)

In [8]:
%%sql
SELECT * FROM PASSENGER;

 * postgresql://whooper:***@localhost/postgres
891 rows affected.


passengerid,survived,pclass,name,sex,age,sibsp,parch
1,0,3,"Braund, Mr. Owen Harris",male,22.0,1,0
2,1,1,"Cumings, Mrs. John Bradley (Florence Briggs Thayer)",female,38.0,1,0
3,1,3,"Heikkinen, Miss. Laina",female,26.0,0,0
4,1,1,"Futrelle, Mrs. Jacques Heath (Lily May Peel)",female,35.0,1,0
5,0,3,"Allen, Mr. William Henry",male,35.0,0,0
6,0,3,"Moran, Mr. James",male,,0,0
7,0,1,"McCarthy, Mr. Timothy J",male,54.0,0,0
8,0,3,"Palsson, Master. Gosta Leonard",male,2.0,3,1
9,1,3,"Johnson, Mrs. Oscar W (Elisabeth Vilhelmina Berg)",female,27.0,0,2
10,1,2,"Nasser, Mrs. Nicholas (Adele Achem)",female,14.0,1,0


![image.png](attachment:image.png)

# Mini rapport :

**Phase 2 :**

Sur le fichier titanic_train.csv, nous pouvons voir qu’il y a une table de degré 12, et de cardinalité 891, dont les attributs sont :

- Le numéro du passagers
- S’il a survécu ou non
- La classe
- Le nom
- Le sexe
- L’âge
- S’il a des frères et soeurs ou conjoint à bord
- S’il a des parents ou enfants à bord
- La référencement
- Le prix du ticket
- Le numéro de la cabine
- La ville où il a embarqué


Pour la table **PASSENGER**, nous avons :

    - Degré 8 d'attributs :
        - PassengerId
        - Survived
        - Pclass
        - Name
        - Sex
        - Age
        - SisSp
        - Parch
    - Cardinalité 890
    - Clé primaire : Name
    - Clé secondaire : PassengerId
    
Pour la table **TICKET**, nous avons :

    - Degré 5 d'attributs :
        - PassengerId
        - Ticket
        - Fare
        - Cabin
        - Embarked
    - Cardinalité 890
    - Clé primaire : PassengerId
    - Elle n'a pas de clé secondaire
    
Pour les **attributs** :

    Les type Int :
        - PassengerId
        - Pclasse
        - Survived
        - SisSp
        - Parch
    Les types Varchar :
        - Name
        - Sex
    Les types Float :
        - Age
        - Fare

# Mini rapport :

**Phase 3 :**

*Combien de classes de passagers différentes y avait-il à bord du Titanic ?*

Pour faire ça, nous avons avons utilisé la fonction `count()` pour compter le nombre d'occurence de l'attribut, et on a utilisé `distinct`pour éviter des redondances dans les résultats (qu'il n'y ai pas de doublons)

In [9]:
%%sql
SELECT count(distinct Pclass) FROM PASSENGER;

 * postgresql://whooper:***@localhost/postgres
1 rows affected.


count
3


*Combien de passagers y avait-il dans chaque classe?*

Pour trouver ça, nous avons fait comme la requêtes précedentes, mais nous avons mit `Pclass, count(Pclass)` pour sélectionné toutes les classes, et leurs valeurs respectifs. Nous avons rajouté un `as` pour renommé la colonne, et on a mit un `group by Pclass` pour réarranger la table résultat de telle sorte que ce soit trier par groupe de valeur (ceux de Pclass)

In [10]:
%%sql
SELECT Pclass, count(Pclass) as Nombre_de_passager FROM PASSENGER group by Pclass ORDER BY Pclass;

 * postgresql://whooper:***@localhost/postgres
3 rows affected.


pclass,nombre_de_passager
1,216
2,184
3,491


*Combien de femmes et d'hommes y avait-il dans chaque classe?*

Pour cette requêtes, nous allons dabord mettre `DROP VIEW IF EXISTS` pour éviter les erreurs, comme utiliser une autre table, ou autres. Ensuite, nous avons créer une vue avec `CREATE VIEW` pour pouvoir faire des versions simplifiées de tables et donc facilité l'accès. On a créer une vue `male`, puis `female` Pour les compter par classes (comme pour la requêtes d'avant). On les a joint avec une jointure classique. 

In [11]:
%%sql
DROP VIEW IF EXISTS male;
DROP VIEW IF EXISTS female;
CREATE VIEW male as SELECT Pclass, count(Pclass) from PASSENGER where Sex='male' group by Pclass;
CREATE VIEW female as SELECT Pclass, count(Pclass) from PASSENGER where Sex='female' group by Pclass;
SELECT male.Pclass, female.count as Femme, male.count as Homme FROM male, female where male.Pclass = female.Pclass ORDER BY Pclass;

 * postgresql://whooper:***@localhost/postgres
Done.
Done.
Done.
Done.
3 rows affected.


pclass,femme,homme
1,94,122
2,76,108
3,144,347


*Comptez le nombre et le pourcentage de survivants et de passagers morts.*

Nous avons d'abord compté les nombre de passager suivant si ils avait survie, ou si ils était mort avec `count(*)`. Ensuite, nous avons utilisé `round(count(*)*100/(SELECT count(passengerid) FROM PASSENGER))` on a utiliser `round()` pour arrondir les résultats, puis on a fait le calcul pour avoir le pourcentage. On a ensuite mit `UNION SELECT` pour mettre bout-à-bout la requête précedente, et la suivante (à svoir la même, mais pour les survivants. 

In [12]:
%%sql
SELECT survived, count(*) as nombre_de_passagers, round(count(*)*100/(SELECT count(passengerid) FROM PASSENGER)) as pourcentage FROM PASSENGER where passenger.survived='0' group by survived 
UNION SELECT survived, count(*) as nombre_de_passagers, round(count(*)*100/(SELECT count(passengerid) FROM PASSENGER)) as pourcentage FROM PASSENGER where passenger.survived='1' group by survived;

 * postgresql://whooper:***@localhost/postgres
2 rows affected.


survived,nombre_de_passagers,pourcentage
0,549,61.0
1,342,38.0


*Visualiser la répartition des passagers survivants et morts par classe*

Nous avons refait des vues pour pouvoir plus facilement classés les passagers. Nous avons juste fait des `count()`.  On les as ensuites joint avec une jointure classique avec leurs numéros de classes. 

In [13]:
%%sql
DROP VIEW IF EXISTS décédé;
DROP VIEW IF EXISTS vivant;
CREATE VIEW décédé as SELECT Pclass, count(Pclass) from PASSENGER where survived=0 group by Pclass;
CREATE VIEW vivant as SELECT Pclass, count(Pclass) from PASSENGER where survived=1 group by Pclass;
SELECT décédé.Pclass, vivant.count as vivant, décédé.count as décédé FROM décédé, vivant where décédé.Pclass = vivant.Pclass ORDER BY Pclass;

 * postgresql://whooper:***@localhost/postgres
Done.
Done.
Done.
Done.
3 rows affected.


pclass,vivant,décédé
1,136,80
2,87,97
3,119,372


*Visualiser la répartition des passagers survivants et des passagers décédés selon le sexe*

On a fait la même chose qu'à la requête précedentes, mais nous avons remplacé `Pclass` par `Sex`.

In [14]:
%%sql
DROP VIEW IF EXISTS décédé;
DROP VIEW IF EXISTS vivant;
CREATE VIEW décédé as SELECT Sex, count(Sex) from PASSENGER where survived=0 group by Sex;
CREATE VIEW vivant as SELECT Sex, count(Sex) from PASSENGER where survived=1 group by Sex;
SELECT décédé.Sex, vivant.count as vivant, décédé.count as décédé FROM décédé, vivant where décédé.Sex = vivant.Sex;

 * postgresql://whooper:***@localhost/postgres
Done.
Done.
Done.
Done.
2 rows affected.


sex,vivant,décédé
female,233,81
male,109,468
