# Extraction et nettoyage des données Wikidata

#### Source

https://query.wikidata.org/

#### Données intéressantes

* P27 : humains
* P21 : sexe
* P19 : lieu de naissance
* P625 : coordonnées
* P569 : date de naissance
* P20 : lieu de mort
* P2358 : Praenomen
* P2359 : Nomen
* P2365 : Cognomen
* P5025 : Gens
* P22 : père
* P25 : mère
* P18 : image
* P106 : occupation
* P802 : étudiant
* P1066 : étudiant de
* P172 : groupe ethnique
* P800 : oeuvres notables
* P136 : genre
* P737 : influencé par
* P2348 : période historique
* P39 : position
* P140 : religion
* P411 : canonisation
* P509 : cause de la mort
* P1196 : manière de la mort (pareil??)
* P157 : tué par
* P162 : honneurs reçus
* P410 : rang militaire
* P607 : conflit
* P102 : parti politique
* P451 : liaison amoureuse

#### Requête SPARQL

```sql
SELECT ?itemLabel ?sex ?birthplaceLabel ?birthdate ?coord ?deathplaceLabel ?praenomenLabel ?gensLabel ?cognomenLabel ?fatherLabel ?motherLabel
WHERE 
{
  ?item wdt:P27 wd:Q1747689 .
  OPTIONAL {?item wdt:P21 ?sex.}
  OPTIONAL {?item wdt:P19 ?birthplace.
  ?birthplace wdt:P625 ?coord. }
  OPTIONAL {?item wdt:P569 ?birthdate.}
  OPTIONAL {?item wdt:P20 ?deathplace.}
  OPTIONAL {?item wdt:P2358 ?praenomen.}
  OPTIONAL {?item wdt:P5025 ?gens.}
  OPTIONAL {?item wdt:P2365 ?cognomen.}
  OPTIONAL {?item wdt:P22 ?father.}
  OPTIONAL {?item wdt:P25 ?mother.}

  SERVICE wikibase:label { bd:serviceParam wikibase:language "[AUTO_LANGUAGE],en". }
}
```

#### Organisation tables

* id
* Nom
* Praenomen
* Nomen
* Cognomen
* Date de naissance
* Lieu de naissance
* Coord lieu de naissance
* Date de mort
* Lieu de mort
* Coord lieu de mort
* Gens
* id Père
* id Mère
* id Conjoint
* id Enfant
* Occupation
* Position
* id Oeuvres

Table personnes,
Table oeuvres,
Table géographique ?

Problème : on ne peut pas télécharger trop de données d'un coup.
Donc je vais télécharger en plusieurs coups.

### Requête pour la table Bio :

```sql
SELECT ?itemLabel ?praenomenLabel ?nomenLabel ?cognomenLabel ?gensLabel ?sexeLabel ?date_naissance ?lieu_naissanceLabel ?date_mort ?lieu_mortLabel ?pereLabel ?mereLabel
WHERE 
{
  ?item wdt:P27 wd:Q1747689 .
  OPTIONAL {?item wdt:P2358 ?praenomen.}
  OPTIONAL {?item wdt:P2359 ?nomen.}
  OPTIONAL {?item wdt:P2365 ?cognomen.}
  OPTIONAL {?item wdt:P5025 ?gens.}
  OPTIONAL {?item wdt:P21 ?sexe.}
  OPTIONAL {?item wdt:P569 ?date_naissance.}
  OPTIONAL {?item wdt:P19 ?lieu_naissance.}
  OPTIONAL {?item wdt:P570 ?date_mort.}
  OPTIONAL {?item wdt:P20 ?lieu_mort.}
  OPTIONAL {?item wdt:P22 ?pere.}
  OPTIONAL {?item wdt:P25 ?mere.}

  SERVICE wikibase:label { bd:serviceParam wikibase:language "[AUTO_LANGUAGE],en". }
}
```

### Requête pour la table Occupations

```sql
SELECT ?itemLabel ?occupationLabel
WHERE 
{
  ?item wdt:P27 wd:Q1747689 .
  OPTIONAL {?item wdt:P106 ?occupation.}

  SERVICE wikibase:label { bd:serviceParam wikibase:language "[AUTO_LANGUAGE],en". }
}
```

### Requête pour la table Positions

```sql
SELECT ?itemLabel ?positionLabel
WHERE 
{
  ?item wdt:P27 wd:Q1747689 .
  OPTIONAL {?item wdt:P39 ?position.}

  SERVICE wikibase:label { bd:serviceParam wikibase:language "[AUTO_LANGUAGE],en". }
}
```

### Requête pour la table Oeuvres

```sql
SELECT ?oeuvreLabel ?auteurLabel ?titre ?genreLabel
WHERE 
{
  ?auteur wdt:P31 wd:Q5.
  ?auteur wdt:P27 wd:Q1747689.
  ?auteur wdt:P106 wd:Q36180.
  ?auteur wdt:P800 ?oeuvre.
  OPTIONAL {?oeuvre wdt:P1476 ?titre}
  OPTIONAL {?oeuvre wdt:P136 ?genre}

  
  SERVICE wikibase:label { bd:serviceParam wikibase:language "[AUTO_LANGUAGE],en". }
}
```

### Requête pour la table Unions

```sql
SELECT ?itemLabel ?epouseLabel
WHERE 
{
  ?item wdt:P27 wd:Q1747689 .
  ?item wdt:P21 wd:Q6581097 .
  ?item wdt:P26 ?epouse.

  SERVICE wikibase:label { bd:serviceParam wikibase:language "[AUTO_LANGUAGE],en". }
}
```