# Projet Data - Etape 2

Génération aléatoire d'un jeu de données utiles pour la simulation et l’expérimentation statistique de la solution proposée.

In [1]:
from pymongo import MongoClient
import pprint

In [2]:
# Connexion à la base de données
client = MongoClient("mongodb+srv://matthieu:matthieu@cluster0-jxr9o.mongodb.net/?retryWrites=true&w=majority")
db = client.donnee

On commence par déclarer les classes servant d'interface avec les objets dans notre base.

In [3]:
# Déclaration de la classe censée représenter les villes (sommets)
class Obj_Ville:
    _id = 0
    
    horaire_livraison_debut = 0  # Nombre de secondes dans la journée (entre 0 et 86400)
    horaire_livraison_fin = 0    # Nombre de secondes dans la journée (entre 0 et 86400)

In [4]:
# Déclaration de la classe censée représenter les routes (arêtes)
class Obj_Route:
    _id = 0
    
    ville_a = None   # Référence vers des "Obj_Ville"
    ville_b = None   # Référence vers des "Obj_Ville"

In [5]:
# Déclaration de la classe censée représenter les véhicules qui vont livrer les marchandises
class Obj_Vehicule:
    _id = 0
    
    capacite = 0
    
    # Tableau de références vers des "Obj_Marchandise"
    # marchandises = []

In [6]:
# Déclaration de la classe censée représenter les marchandises qui sont livrés par les véhicules
class Obj_Marchandise:
    _id = 0
    
    poids = 0
    
    destination = None  # Référence vers des "Obj_Ville"

In [7]:
# Déclaration de la classe censée représenter le trafic prédictif
class Obj_Trafic:
    _id = 0
    
    horaire_debut = 0  # Nombre de secondes dans la journée (entre 0 et 86400)
    horaire_fin = 0    # Nombre de secondes dans la journée (entre 0 et 86400)
    
    intensite = 0.0
    
    route = None       # Référence vers des "Obj_Route"

Ensuite, on procède à la génération aléatoire de données.

On définit la fonction "generateData" qui permet de générer un jeu de données en vue d'une étude :

_Paramètres_ :

<code>nb_villes</code>&emsp;&emsp;&emsp;&emsp;&emsp;&emsp;&emsp;: Le nombre de villes (sommets) à génerer sur le graphe <code>(int)</code>.  
<code>nb_vehicules</code>&emsp;&emsp;&emsp;&emsp;&emsp;: Le nombre de véhicules disponibles pour assurer les livraisons <code>(int)</code>.  
<code>nb_marchandises_min</code>&emsp;: La plage minimale de marchandises à livrer à une ville destination <code>(int)</code>.  
<code>nb_marchandises_max</code>&emsp;: La plage maximale de marchandises à livrer à une ville destination <code>(int)</code>.  
<code>poids_min</code>&emsp;&emsp;&emsp;&emsp;&emsp;&emsp;: La plage minimale de poids pour une marchandise <code>(int)</code>.  
<code>poids_max</code>&emsp;&emsp;&emsp;&emsp;&emsp;&emsp;: La plage maximale de poids pour une marchandise <code>(int)</code>.  
<code>capacite_min</code>&emsp;&emsp;&emsp;&emsp;&emsp;: La plage minimale de capacité pour un véhicule <code>(int)</code>.  
<code>capacite_max</code>&emsp;&emsp;&emsp;&emsp;&emsp;: La plage maximale de capacité pour un véhicule <code>(int)</code>.  
<code>horaire_debut</code>&emsp;&emsp;&emsp;&emsp;: La plage horaire minimale de l'étude (en secondes, entre 0 et 86400) <code>(int)</code>.  
<code>horaire_fin</code>&emsp;&emsp;&emsp;&emsp;&emsp;: La plage horaire maximale de l'étude (en secondes, entre 0 et 86400) <code>(int)</code>.

In [8]:
import random

villes = []
routes = []
vehicules = []
marchandises = []
trafics = []

# Déclaration de la fonction permettant de générer aléatoirement les données
def generateData(nb_villes, nb_vehicules, nb_marchandises_min, nb_marchandises_max, poids_min, poids_max, capacite_min, capacite_max, horaire_debut, horaire_fin):    
    horaire_plage = horaire_fin - horaire_debut
    
    # Génération des villes (sommets)
    m_id = 0
    for i in range(nb_villes):
        # On génère un intervalle de livraison entre 1h et toute la plage horaire
        intervalle = random.randint(3600, horaire_plage)
        
        # On créé la ville
        ville = Obj_Ville()
        ville._id = i
        ville.horaire_livraison_debut = random.randint(horaire_debut, horaire_fin - intervalle)
        ville.horaire_livraison_fin = ville.horaire_livraison_debut + intervalle
        villes.append(ville)
        
        # On génère les marchandises qui lui sont attribuées
        for m in range(random.randint(nb_marchandises_min, nb_marchandises_max)):
            marchandise = Obj_Marchandise()
            marchandise._id = m_id
            marchandise.poids = random.randint(poids_min, poids_max)
            marchandise.destination = ville
            marchandises.append(marchandise)
            
            m_id = m_id + 1
        
    # Génération des routes (arêtes)
    # Note : dans le problème de la tournées de véhicules, le graphe est "complet"!
    r_id = 0
    t_id = 0
    for v_a in villes:
        for v_b in villes:
            # On ne créé pas de route avec elle-même!
            if v_b == v_a:
                continue
            
            route = Obj_Route()
            route._id = r_id
            route.ville_a = v_a
            route.ville_b = v_b
            
            # On génère les prévisions du trafic en choisissant un découpage par tranches aléatoires
            trafic_decoupage = random.randint(2, 8)
            trafic_step = horaire_plage // trafic_decoupage
            for t in range(trafic_decoupage):
                trafic = Obj_Trafic()
                trafic._id = t_id
                trafic.horaire_debut = horaire_debut + (t * trafic_step)
                trafic.horaire_fin = trafic.horaire_debut + trafic_step
                trafic.intensite = random.randrange(1.0, 2.0)
                trafic.route = route
                trafics.append(trafic)
                
                # On incrémente le compteur d'ID pour avoir des identifiants toujours différents!
                t_id = t_id + 1
            
            routes.append(route)
            
            # On incrémente le compteur d'ID pour avoir des identifiants toujours différents!
            r_id = r_id + 1
            
    # Génération des véhicules
    for i in range(nb_vehicules):
        # On créé le véhicule
        vehicle = Obj_Vehicule()
        vehicle._id = i
        vehicle.capacite = random.randint(capacite_min, capacite_max)
        vehicules.append(vehicle)
        
# Initialisation du générateur pseudo-aléatoire
random.seed()

generateData(25, 6, 1, 3, 2, 8, 12, 24, 28800, 61200)

Enfin, on importe ces données dans la base de données MongoDB.

In [10]:
# On récupère les collections
collection_ville = db.ville
collection_route = db.route
collection_vehicule = db.vehicule
collection_marchandise = db.marchandise
collection_trafic = db.trafic

# On vide les collections au préalable
collection_ville.delete_many({})
collection_route.delete_many({})
collection_vehicule.delete_many({})
collection_marchandise.delete_many({})
collection_trafic.delete_many({})

# On importe les villes
for ville in villes:
    ville_stamp = {
        '_id' : ville._id,
        'horaire_debut_livraison' : ville.horaire_livraison_debut,
        'horaire_fin_livraison' : ville.horaire_livraison_fin
    }

    collection_ville.insert_one(ville_stamp)

# On importe les routes
for route in routes:
    route_stamp = {
        '_id' : route._id,
        'ville_a' : route.ville_a._id,
        'ville_b' : route.ville_b._id
    }
    
    collection_route.insert_one(route_stamp)
    
# On importe les véhicules
for vehicule in vehicules:
    vehicule_stamp = {
        '_id' : vehicule._id,
        'capacite' : vehicule.capacite
    }
    
    collection_vehicule.insert_one(vehicule_stamp)
    
# On importe les marchandises
for marchandise in marchandises:
    marchandise_stamp = {
        '_id' : marchandise._id,
        'poids' : marchandise.poids,
        'destination' : marchandise.destination._id
    }
    
    collection_marchandise.insert_one(marchandise_stamp)
    
# On importe les trafic
for trafic in trafics:
    trafic_stamp = {
        '_id' : trafic._id,
        'horaire_debut' : trafic.horaire_debut,
        'horaire_fin' : trafic.horaire_fin,
        'intensite' : trafic.intensite,
        'route' : trafic.route._id
    }
    
    collection_trafic.insert_one(trafic_stamp)