# ITINERAIRE DE VACANCE - EXPLORATION DES DONNÉES

## 0. Import des modules

In [1]:
import pandas as pd
import json
from pprint import pprint

## 1. Import des données
### 1.1 JSON
#### 1.1.1 Index

In [2]:
objects_path = '../Data/JSON/objects/'

In [3]:
index_path = '../Data/JSON/index.json'

In [4]:
with open(index_path) as json_data:
    index = json.load(json_data)

L'index contient plusieurs informations:
* `file`: chemin d'accès vers les objets json
* `label`: nom du Point Of Interrest
* `lastUpdateDatatourisme`: dernière mise à jour du POI sur Datatourisme

In [5]:
pprint(index[:2])

[{'file': '0/00/13-000fac17-cff9-3918-a3d6-8edc919c8533.json',
  'label': 'Calvi Jet Locations',
  'lastUpdateDatatourisme': '2023-02-22T06:42:37.696Z'},
 {'file': '0/01/13-016f3145-67f8-33c3-9293-109b420a9104.json',
  'label': 'Promenades du Golfe',
  'lastUpdateDatatourisme': '2023-04-02T05:48:09.233Z'}]


#### 1.1.2 Exploration d'un objet json

In [6]:
jsonObject_path = objects_path + index[0]['file']

In [7]:
with open(jsonObject_path) as json_data:
    jsonObject = json.load(json_data)

Nous avons 15 clés dans notre objet json:
* `@id`: Lien vers le POI.
* `dc:identifier`: Identifiant unique
* `@type`: La classification de POI. Par exemple : festival, musée, chambre d’hôtes...
* `rdfs:comment`: Commentaire du POI
* `rdfs:label`: Nom du Point Of Interrest
* `hasBeenCreatedBy`: L'agent qui a créé ce POI dans le système d'information :
    * `@id`: Lien vers l'agent sur DATAtourisme
    * `dc:identifier`: Identifiant unique
    * `schema:email`: E-mail de l'agent
    * `schema:legalName`: Nom officiel de l'agent
    * `@type`: Type de l'agent
    * `foaf:homepage`: Lien vers le site de l'agent
* `hasBeenPublishedBy`: L'agent qui a publié ce POI dans le système d'information:
    * `@id`: Lien vers l'agent sur DATAtourisme
    * `schema:legalName`: Nom officiel de l'agent
    * `@type`: Type de l'agent
    * `foaf:homepage`: Lien vers le site de l'agent
* `hasContact`: L'agent à contacter pour affaires générales relatives à ce POI:
    * `@id`: Lien vers l'agent sur DATAtourisme
    * `schema:email`: E-mail de l'agent
    * `schema:telephone`: Telephone de l'agent
    * `@type`: Type de l'agent
    * `foaf:homepage`: Lien vers le site de l'agent
* `hasDescription`: Description textuelle courte ou longue du POI pouvant être associée à une audience. Par exemple, un POI peut avoir une description dédiée aux écoles et une autre dédiée au grand public. Si une description n'a aucune audience renseignée, on suppose qu'elle est dédiée à tous les publics:
    * `@id`: Lien vers la description
    * `@type`: Type(s) de la descripton
    * `hasTranslatedProperty`: Informations de traductions:
        * `@id`: Lien vers les informations de la traduction de la description
        * `dc:contributor`: Traducteur (api.deepl.com/v2/translate)
        * `rdf:language`: Langue de la traduction
        * `rdf:predicate`: Type de la description
    * `shortDescription`: Dictionnaire des descriptions traduit en plusieurs langues:
        * `fr`: En fr
        * `de`: ...
* `hasTheme`: Liste des thèmes:
    * `@id`: Identifiant du thème au format kb:[theme en anglais sans espace]
    * `@type`: Type du thème
    * `rdfs:label`: Thème en différente langue:
        * `fr`: fr
        * `de`: ...
* `hasTranslatedProperty`: liste d'informations de traductions sur le commentaire:
    * `@id`: Lien vers les informations de la traduction du commentaire
    * `dc:contributor`: Traducteur (api.deepl.com/v2/translate)
    * `rdf:language`: Langue de la traduction
    * `rdf:predicate`: Table de jointure entre @id et comment
* `isLocatedAt`: Informations sur l'emplacement géographique du POI:
    * `@id`: Lien vers les informations sur l'emplacement
    * `schema:address`: Informations sur l'adresse postale
        * `@id`: Lien vers les informations de l'adresse postale
        * `schema:addressLocality`: Ville
        * `schema:postalCode`: Code postale
        * `schema:streetAddress`: Adresse postale (certaines données ne sont pas propres)
        * `@type`: Type de l'adresse
        * `hasAddressCity`: Informations complémentaires sur l'adresse postale
            * `@id`:
            * `@type`:
            * `rdfs:label`:
            * `insee`:
            * `isPartOfDepartment`:
    * `schema:geo`:
    * `schema:openingHoursSpecification`:
    * `@type`:
* `label`: nom du Point Of Interrest
* `label`: nom du Point Of Interrest
* `label`: nom du Point Of Interrest

In [16]:
jsonObject['isLocatedAt'][0].keys()

dict_keys(['@id', 'schema:address', 'schema:geo', 'schema:openingHoursSpecification', '@type'])

In [23]:
jsonObject['isLocatedAt'][0]['schema:address'][0].keys()

dict_keys(['@id', 'schema:addressLocality', 'schema:postalCode', 'schema:streetAddress', '@type', 'hasAddressCity'])

In [29]:
jsonObject['isLocatedAt'][0]['schema:address'][0]['hasAddressCity'].keys()

dict_keys(['@id', '@type', 'rdfs:label', 'insee', 'isPartOfDepartment'])

In [28]:
jsonObject['isLocatedAt'][0]['schema:address'][0]['hasAddressCity']

{'@id': 'kb:2B050',
 '@type': ['City'],
 'rdfs:label': {'en': ['Calvi'], 'fr': ['Calvi']},
 'insee': '2B050',
 'isPartOfDepartment': {'@id': 'kb:France942B',
  '@type': ['Department'],
  'rdfs:label': {'en': ['Haute-Corse'], 'fr': ['Haute-Corse']},
  'insee': '2B',
  'isPartOfRegion': {'@id': 'kb:France94',
   '@type': ['Region'],
   'rdfs:label': {'en': ['Corse'], 'fr': ['Corse']},
   'insee': '94',
   'isPartOfCountry': {'@id': 'kb:France',
    '@type': ['schema:Country'],
    'rdfs:label': {'de': ['Frankreich'],
     'pt': ['França'],
     'en': ['France'],
     'it': ['Francia'],
     'fr': ['France'],
     'nl': ['Frankrijk'],
     'es': ['Francia']}}}}}

In [11]:
jsonObject.keys()

dict_keys(['@id', 'dc:identifier', '@type', 'rdfs:comment', 'rdfs:label', 'hasBeenCreatedBy', 'hasBeenPublishedBy', 'hasContact', 'hasDescription', 'hasTheme', 'hasTranslatedProperty', 'isLocatedAt', 'isOwnedBy', 'lastUpdate', 'lastUpdateDatatourisme'])

In [8]:
jsonObject['@id']

'https://data.datatourisme.fr/13/000fac17-cff9-3918-a3d6-8edc919c8533'

In [9]:
jsonObject['dc:identifier']

'5005925'

In [10]:
jsonObject['@type']

['schema:LocalBusiness',
 'ActivityProvider',
 'PlaceOfInterest',
 'PointOfInterest',
 'Store']

In [11]:
jsonObject['rdfs:comment']['fr']

["Lors de vos vacances en corse, les amateurs de sports nautiques et de sensations fortes pourront partager un moment inoubliable... à Calvi\r\nPromesse d'une rencontre avec... Pierre et Ghjulia"]

In [12]:
jsonObject['rdfs:label']['fr']

['Calvi Jet Locations']

In [13]:
jsonObject['hasBeenCreatedBy']

{'@id': 'https://data.datatourisme.fr/13/e4873aa9-a05c-35ed-8395-61d121516766',
 'dc:identifier': '1646',
 'schema:email': ['info@balagne-corsica.com'],
 'schema:legalName': 'Office de Tourisme Intercommunal Calvi - Balagne',
 '@type': ['schema:Organization', 'foaf:Agent', 'Agent'],
 'foaf:homepage': ['https://www.balagne-corsica.com/']}

In [14]:
jsonObject['hasBeenPublishedBy']

[{'@id': 'https://data.datatourisme.fr/8a9feb4b-2cbd-3d2c-b507-bd6c6776b23b',
  'schema:legalName': 'Apidae Tourisme Scic SA - source : Apidae Tourisme',
  '@type': ['schema:Organization', 'foaf:Agent', 'Agent'],
  'foaf:homepage': ['https://www.apidae-tourisme.com/']}]

In [15]:
jsonObject['hasContact']

[{'@id': 'https://data.datatourisme.fr/d7f7f123-e07f-3119-96de-88ac75239c71',
  'schema:email': ['calvijet@gmail.com'],
  'schema:telephone': ['+33 6 26 17 04 97'],
  '@type': ['foaf:Agent', 'Agent'],
  'foaf:homepage': ['https://www.calvi-jet.fr/']}]

In [71]:
jsonObject['hasDescription'][0]

{'@id': 'https://data.datatourisme.fr/1759cd32-f91f-3fda-826a-1c5bc4f7dc1c',
 '@type': ['Description'],
 'hasTranslatedProperty': [{'@id': 'https://data.datatourisme.fr/171d0853-1ebb-37ee-8933-784907bc7565',
   'dc:contributor': ['https://api.deepl.com/v2/translate'],
   'rdf:language': ['es'],
   'rdf:predicate': ['shortDescription']},
  {'@id': 'https://data.datatourisme.fr/3fbb553d-6bd2-36bf-8206-b7dd3b22eced',
   'dc:contributor': ['https://api.deepl.com/v2/translate'],
   'rdf:language': ['nl'],
   'rdf:predicate': ['shortDescription']},
  {'@id': 'https://data.datatourisme.fr/93ec039d-d9ca-31b5-bd6d-75b6eca73687',
   'dc:contributor': ['https://api.deepl.com/v2/translate'],
   'rdf:language': ['de'],
   'rdf:predicate': ['shortDescription']}],
 'shortDescription': {'de': ['Während Ihres Urlaubs auf Korsika können Liebhaber von Wassersport und Nervenkitzel einen unvergesslichen Moment miteinander teilen... in Calvi\r\nVersprechen einer Begegnung mit... Pierre und Ghjulia'],
  'en'

In [17]:
jsonObject['hasDescription'][0]['shortDescription']['fr']

["Lors de vos vacances en corse, les amateurs de sports nautiques et de sensations fortes pourront partager un moment inoubliable... à Calvi\r\nPromesse d'une rencontre avec... Pierre et Ghjulia"]

In [18]:
jsonObject['hasTheme'][0]['rdfs:label']['fr'] # jsonObject['hasTheme'][["plein"]]['rdfs:label']['fr']

['Kayak de mer']

In [20]:
jsonObject['hasTranslatedProperty']

[{'@id': 'https://data.datatourisme.fr/0b6fbe71-f8df-33d4-a052-5f68d814ee01',
  'dc:contributor': ['https://api.deepl.com/v2/translate'],
  'rdf:language': ['es'],
  'rdf:predicate': [{'@id': 'rdfs:comment'}]},
 {'@id': 'https://data.datatourisme.fr/79ad0739-d715-36e9-9b50-2b29b29d1fe0',
  'dc:contributor': ['https://api.deepl.com/v2/translate'],
  'rdf:language': ['de'],
  'rdf:predicate': [{'@id': 'rdfs:comment'}]},
 {'@id': 'https://data.datatourisme.fr/f1e14252-24e1-308e-8b79-ee16b824ac5f',
  'dc:contributor': ['https://api.deepl.com/v2/translate'],
  'rdf:language': ['nl'],
  'rdf:predicate': [{'@id': 'rdfs:comment'}]}]

In [23]:
jsonObject['isLocatedAt'][0].keys()

dict_keys(['@id', 'schema:address', 'schema:geo', 'schema:openingHoursSpecification', '@type'])

In [27]:
jsonObject['isLocatedAt'][0]['schema:address'][0]

{'@id': 'https://data.datatourisme.fr/7a9ea23e-6919-3616-a306-b03922fc920c',
 'schema:addressLocality': 'Calvi',
 'schema:postalCode': '20260',
 'schema:streetAddress': ['A côté du restaurant "Le Bout du Monde"',
  'Entrée par le supermarché "Casino"',
  'Plage de Calvi'],
 '@type': ['schema:PostalAddress', 'PostalAddress'],
 'hasAddressCity': {'@id': 'kb:2B050',
  '@type': ['City'],
  'rdfs:label': {'en': ['Calvi'], 'fr': ['Calvi']},
  'insee': '2B050',
  'isPartOfDepartment': {'@id': 'kb:France942B',
   '@type': ['Department'],
   'rdfs:label': {'en': ['Haute-Corse'], 'fr': ['Haute-Corse']},
   'insee': '2B',
   'isPartOfRegion': {'@id': 'kb:France94',
    '@type': ['Region'],
    'rdfs:label': {'en': ['Corse'], 'fr': ['Corse']},
    'insee': '94',
    'isPartOfCountry': {'@id': 'kb:France',
     '@type': ['schema:Country'],
     'rdfs:label': {'de': ['Frankreich'],
      'pt': ['França'],
      'en': ['France'],
      'it': ['Francia'],
      'fr': ['France'],
      'nl': ['Frankrij

In [29]:
jsonObject['isOwnedBy'][0]

{'@id': 'https://data.datatourisme.fr/194c52e6-bbae-33dc-8464-caca97844fbb',
 'schema:email': ['info@balagne-corsica.com'],
 'schema:legalName': 'Office de Tourisme Intercommunal Calvi - Balagne',
 '@type': ['schema:Organization', 'foaf:Agent', 'Agent'],
 'foaf:homepage': ['https://www.balagne-corsica.com/']}

In [30]:
jsonObject['lastUpdate']

'2022-08-11'

In [31]:
jsonObject['lastUpdateDatatourisme']

'2023-02-22T06:42:37.696Z'