# Pre-Project

## 1. Définition de l'enjeu
Le projet vise à améliorer l’expérience des touristes en France en 2025 en leur permettant de trouver les concerts qui correspondent le mieux à leurs préférences. Pour cela, nous prévoyons :
1. De collecter des données sur les concerts prévus en 2025 via une API fiable.
2. De trier ces concerts en catégories claires et compréhensibles (genre musical, localisation, description...).
3. D’enrichir ces données en webscrapant des commentaires sur les artistes pour offrir des informations qualitatives.

Ce système répond à un besoin concret : simplifier la recherche d’événements musicaux pour les touristes, en tenant compte de leurs goûts et de leur localisation.

---

## 2. Description du cas d’usage
Un touriste souhaitant assister à un concert en France peut saisir ses préférences via une interface (exemple : genre musical, date, localisation, budget). L’algorithme propose une liste de concerts correspondant à ses critères, enrichie d’informations telles que :
- Les avis sur les artistes.
- La qualité de l’expérience utilisateur lors des concerts précédents.

Cela permet de maximiser la satisfaction du visiteur tout en valorisant les artistes locaux.

---

## 3. Prove of concept : sources et faisabilité
Pour vérifier la faisabilité de notre projet :
1. **Sources des données :**
   - **OpenDataSoft** : Une API publique "opendatasoft" nous permettra d’extraire jusqu’à 100 événements publics en 2025 avec des métadonnées complètes (titre, description, localisation, dates…).
   - **Webscraping** : Les commentaires sur les artistes seront extraits depuis des sites comme des forums musicaux ou des plateformes d’évaluation.

2. **Tests techniques :**
   - **Collecte initiale** : Nous avons testé la récupération des données via l’API. Les résultats incluent des informations utiles comme les genres musicaux, les dates et les lieux.
   - **Webscraping** : Nous réfléchissons encore à quelles informations web scrapper sur les sites via les URL renseignés pour chaque concert.

---

## 4. Preuve de faisabilité
Les tests préliminaires démontrent que :
- Les données API sont accessibles, riches et pertinentes pour trier les concerts en catégories claires.

---

## 5. Conclusion
Ce projet est techniquement faisable grâce à la disponibilité des données et aux outils modernes de collecte et d’analyse. Il permettra aux touristes d’accéder à des recommandations ciblées et qualitatives, répondant à leur besoin de vivre des expériences musicales mémorables en France en 2025.


Import des données via une API :

In [1]:
import requests

# URL de base de l'API avec un paramètre pour augmenter la limite
base_url = "https://public.opendatasoft.com/api/explore/v2.1/catalog/datasets/evenements-publics-openagenda/records"

# Paramètres de la requête
params = {
    "refine": ["keywords_fr:concert", "location_countrycode:FR", "firstdate_begin:2025"],
    "limit": 100  
}

# Requête GET
response = requests.get(base_url, params=params)
data = response.json()

# Extraction des résultats
results = data.get("results", [])

# Vérifier le nombre d'événements récupérés
print(f"Nombre d'événements récupérés : {len(results)}")

columns = results[0].keys()  # Récupérer les noms de colonnes du premier événement
column_names = " / ".join(columns)  # Joindre les noms avec "/"
print("Noms des colonnes :")
print(column_names)

# Afficher les colonnes simplifiées pour tous les événements
for event in results:
    simplified_event = {key.split("_")[-1]: value for key, value in event.items()}
    print(simplified_event)


Nombre d'événements récupérés : 84
Noms des colonnes :
uid / slug / canonicalurl / title_fr / description_fr / longdescription_fr / conditions_fr / keywords_fr / image / imagecredits / thumbnail / originalimage / updatedat / daterange_fr / firstdate_begin / firstdate_end / lastdate_begin / lastdate_end / timings / accessibility / accessibility_label_fr / location_uid / location_coordinates / location_name / location_address / location_district / location_insee / location_postalcode / location_city / location_department / location_region / location_countrycode / location_image / location_imagecredits / location_phone / location_website / location_links / location_tags / location_description_fr / location_access_fr / attendancemode / onlineaccesslink / status / age_min / age_max / originagenda_title / originagenda_uid / contributor_email / contributor_contactnumber / contributor_contactname / contributor_contactposition / contributor_organization / category / country_fr / registration / 

In [1]:
import requests
import json

# Configuration
API_KEY = "f6e8553b-0fdb-45b6-becb-ecf54d29c362" 
base_url = f"https://diffuseur.datatourisme.fr/webservice/0a0fe2fb0f353640c868f2d42490832e/{API_KEY}"

# Faire une requête
try:
    response = requests.get(base_url)
    
    if response.status_code == 200:
        data = response.json()
        print("Données récupérées avec succès :")
        print(json.dumps(data, indent=2))
    else:
        print(f"Erreur {response.status_code}: {response.text}")
        
except Exception as e:
    print(f"Erreur lors de la requête : {str(e)}")

Erreur 503: {"message":"Le flux est en cours de programmation. Vous re\u00e7evrez un email d\u00e8s qu\u0027il sera disponible au t\u00e9l\u00e9chargement"}
