# La structure des données (datas)

On trouve énormément de **données** sur internet. 

Une partie de ces données sont **publiques**.

*Exemple*: le site `data.gouv.fr`; ses données sont **librement réutilisables**.

On appelle cela l'**open data**.

## Données au Format CSV (*Comma-separated values*)

Le format **CSV** est très courant sur internet.

Wikipédia sur le format CSV:

> ... format informatique ouvert représentant des données **tabulaires** sous forme de
valeurs séparées par des *virgules*...

> ...Un fichier CSV est un fichier **texte** ..., par opposition aux formats dits «
binaires »...

*Exemple* de contenu d'un fichier CSV :

```
nom,prenom,date_naissance
Durand,Jean-Pierre,23/05/1985
Dupont,Christophe,15/12/1967
Terta,Henry,12/06/1978       
```

**Première ligne**: `nom`, `prenom` et `date_naissance` sont appelés des **descripteurs**.

*Lignes suivantes*: Les **valeurs** associées à ces descripteurs.

*Chaque ligne* - sauf la première - représente un "**objet**".

Le «*tout*» est appelé **collection**.

Dans un tableur, on obtient:

<div class="centrer">

![](https://pixees.fr/informatiquelycee/n_site/img/snt_donnee_1.png)

</div>

d'où le terme "**données tabulaires**" (en tableau)

## Données au Format JSON   (*JavaScript Object Notation*)

Autre format de données «texte» très courant sur le "web". 

Le JSON fonctionne avec un système de paire **clé:valeur**.

Un "objet" est encadré par des accolades `{...}`

```json
{cle_1 : val_1, cle_2 : val_2, cle_3 : val_3}
        
```

souvent, pour une question de lisibilité, on écrira :

```json
{
    cle_1 : val_1,
    cle_2 : val_2,
    cle_3 : val_3
}
        
```

Un fichier au format JSON peut regrouper un grand nombre d'objets :

```json
[{
"nom" : "Durand",
"prenom" : "Jean-Pierre",
"date_naissance" : "23/05/1985"
},
{
"nom" : "Dupont",
"prenom" : "Christophe",
"date_naissance" : "15/12/1967"
},
{
"nom" : "Terta",
"prenom" : "Henry",
"date_naissance" : "12/06/1978"
}]
        
```

Observez que ce qu'on appelle «**clé**» a été appelé plus tôt «**descripteur**» 

Les crochets `[...]` indiquent qu'on a plusieurs «objets»: une **collection**

La "valeur" d'une paire "clé/valeur" peut être une liste :

```json
{
"nom" : "Durand",
"prenom" : "Jean-Pierre",
"date_naissance" : "23/05/1985"
"sport" : ["tennis", "football", "pétanque"]
}
        
```

ou même un autre objet :

```json
{
"nom" : "Durand",
"prenom" : "Jean-Pierre",
"date_naissance" : "23/05/1985",
"adresse" : {
    "num":6,
    "rue":"impasse du rossignol",
    "ville":"Nogent-le-Rotrou",
    "cp":"28400"
    }
}         
```

Il est possible d'obtenir des structures de données très complètes avec le format JSON.

De nombreux sites web proposent des services basés sur des **API** (*Application Programming Interface*). 

Ces sites sont capables de fournir des données aux formats JSON sur "simple demande".

Souvent, ces "demandes" sont effectuées par l'intermédiaire d'une **url**.

*Exemple*: Avec une simple url, le site "*open weather*" renvoie des informations **météo** sous forme de données JSON.

**base de l'url**: le service

``` 
http://api.openweathermap.org/data/2.5/weather...
        
```

... puis les **paramètres**. Que veut-on savoir au juste ?


``` 
...?q=tours,fr&lang=fr&units=metric&APPID=XXXXXXXXXXXXX
        
```

`APPID` correspond à l'«API key»

[url complète](http://api.openweathermap.org/data/2.5/weather?q=tours,fr&lang=fr&units=metric&APPID=19db842339eb2de5ac8d890e39bf727b)

```
http://api.openweathermap.org/data/2.5/weather?q=tours,fr&lang=fr&units=metric&APPID=19db842339eb2de5ac8d890e39bf727b
```

## Format GEOJSON

geoJSON est un format qui permet d'encoder des données à "**caractère géographique**". 

Wikipédia:

> ... format ouvert d'encodage d'ensemble de données géospatiales ...

> ... Il permet de décrire des données de type point, ligne, polygone ... 

*Exemple* avec le site *earthquake.usgs.gov* qui recense les [tremblements de terre du monde entier](https://earthquake.usgs.gov/fdsnws/event/1/query?format=geojson&starttime=2019-07-31&endtime=2019-08-01)

``` 
https://earthquake.usgs.gov/fdsnws/event/1/query?format=geojson&starttime=2019-07-31&endtime=2019-08-01
        
```