## Objectif : 
Pour les produit commercés / transportés pour les flux concernant le datasprint, obtenir 3 ensembles :
- ensemble 1 - produits qu'on retrouve à la fois dans Toflit18 et Portic
- ensemble 2 - produits qu'on retrouve exclusivement dans Toflit18
- ensemble 3 - produits qu'on retrouve exclusivement dans Portic

In [30]:
# choix d'une classification d'alignement
chosen_classification = 'product_revolutionempire'

In [31]:
from poitousprint import Portic, Toflit, get_pointcalls_commodity_purposes_as_toflit_product

toflit_client = Toflit()
portic_client = Portic()


In [32]:
# récupération des pointcalls Portic qui concernent le datasprint
pointcalls_datasprint = portic_client.get_pointcalls(
 year = 1789,
 pointcall_admiralty = ['La Rochelle', 'Marennes', 'Sables d\'Olonne']
)

# enrichissement de ces pointcalls avec la propriété 'commodity_as_toflit' qui nous donne l'équivalent des produits navigo dans Toflit18 avec la classification choisie
croisement_produits = get_pointcalls_commodity_purposes_as_toflit_product(pointcalls_datasprint, product_classification=chosen_classification)

In [26]:
navigo_products_for_datasprint = set()
for pointcall in croisement_produits:
    if pointcall['commodity_purposes'] is not None:
        for commodity in pointcall['commodity_purposes']:
            navigo_products_for_datasprint.add(commodity['commodity_as_toflit'])

navigo_products_for_datasprint

{'Alcalis',
 'Animaux',
 'Armes, munitions, poudre et pierres à fusil',
 'Beurre',
 'Bière, cidre et vinaigre',
 'Blé et autres grains comestibles',
 'Bois divers hors combustible',
 'Brai, goudron et résines',
 'Bâtiments de mer et apparaux',
 'Café',
 'Cendres diverses',
 'Chairs et œufs',
 'Chanvre',
 'Combustibles dont charbons et bois',
 'Cordage et filets',
 'Coton non transformé',
 'Cuirs, peaux et pelleterie',
 'Cuivre',
 'Divers incertains',
 'Divers mélangés',
 'Eaux-de-vie et liqueurs',
 'Farine, gruau, biscuits et pâtes',
 'Fer',
 'Fromage',
 'Fruits frais',
 'Fruits secs et noix',
 'Graines diverses et mélangées',
 'Graines grasses',
 'Graisses diverses',
 'Habits et lingerie',
 'Huiles diverses',
 'Laines non transformées diverses',
 'Lin',
 'Légumes',
 'Matières premières diverses',
 'Meubles, glaces et miroirs',
 None,
 'Ouvrages de bois, liège et jonc',
 'Ouvrages divers et mélangés',
 'Ouvrages métalliques',
 'Porcelaine, poterie, faïence et ouvrages de terre',
 'Prod

In [33]:
# récupération des flows Toflit18 qui concernent le datasprint
flows = toflit_client.get_flows(
    year=1789, 
    customs_region='La Rochelle',
)

toflit_products_for_datasprint = set()
for flow in flows:
    toflit_products_for_datasprint.add(flow[chosen_classification])

toflit_products_for_datasprint

{'Acier',
 'Alquifoux, mine de plomb et graphite',
 'Alun',
 'Animaux',
 'Argenterie et orfèvrerie',
 'Armes, munitions, poudre et pierres à fusil',
 'Azur et cobalt',
 'Beurre',
 'Bijouterie et pierres fines',
 'Bière, cidre et vinaigre',
 'Blé et autres grains comestibles',
 'Bois divers hors combustible',
 'Bonneterie de soie',
 'Bonneterie hors soie',
 'Bouchons principalement en liège',
 'Bougies, chandelles et flambeaux',
 'Brai, goudron et résines',
 'Bâtiments de mer et apparaux',
 'Cacao et chocolat',
 'Café',
 'Cannelle',
 'Chairs et œufs',
 'Chanvre',
 'Chapeaux hors paille et écorce',
 'Chevaux et bêtes de somme',
 'Châles et mouchoirs de soie',
 'Châles et mouchoirs hors soie',
 'Cire',
 'Colles diverses',
 'Combustibles dont charbons et bois',
 'Cordage et filets',
 'Cordonnerie et sellerie',
 'Cornes, corail, écailles, ivoire et nacre',
 'Coton non transformé',
 'Cuirs, peaux et pelleterie',
 'Cuivre',
 'Céruse et blanc de plomb',
 'Denrées coloniales et épiceries divers

In [34]:
result1 = toflit_products_for_datasprint.intersection(navigo_products_for_datasprint)

result2 = toflit_products_for_datasprint.difference(navigo_products_for_datasprint)

result3 = navigo_products_for_datasprint.difference(toflit_products_for_datasprint)

print("ensemble 1 - produits qu'on retrouve à la fois dans Toflit18 et Portic :\n", result1)
print("\n\nensemble 2 - produits qu'on retrouve exclusivement dans Toflit18 : \n", result2)
print("\n\nensemble 3 - produits qu'on retrouve exclusivement dans Portic : \n", result3)


ensemble 1 - produits qu'on retrouve à la fois dans Toflit18 et Portic :
 {'Légumes', 'Graines diverses et mélangées', 'Bière, cidre et vinaigre', 'Armes, munitions, poudre et pierres à fusil', 'Chairs et œufs', 'Habits et lingerie', 'Ouvrages de bois, liège et jonc', 'Eaux-de-vie et liqueurs', 'Chanvre', 'Divers incertains', 'Subsistances diverses et mélangées', 'Savon', 'Sel', 'Bois divers hors combustible', 'Produits inconnus', 'Porcelaine, poterie, faïence et ouvrages de terre', 'Cuirs, peaux et pelleterie', 'Coton non transformé', 'Fer', 'Huiles diverses', 'Meubles, glaces et miroirs', 'Ouvrages métalliques', 'Graines grasses', 'Beurre', 'Café', 'Ouvrages divers et mélangés', 'Fruits secs et noix', 'Combustibles dont charbons et bois', 'Graisses diverses', 'Sucre', 'Pêche et fruits de mer', 'Blé et autres grains comestibles', 'Animaux', 'Vins divers', 'Divers mélangés', 'Matières premières diverses', 'Cuivre', 'Verrerie', 'Lin', 'Cordage et filets', 'Brai, goudron et résines', 'Bâ

In [42]:
# écriture dans un csv

# initialisation du tableau avec une 1ere colonne contenant les produits communs
with open('preliminary_inquiry/dumps/croisement_produits_datasprint_revolutionempire.csv', 'w', newline='') as csvfile:
        fieldnames = ['produits communs datasprint']
        writer = csv.DictWriter(csvfile, fieldnames=fieldnames)

        writer.writeheader()
        for product in result1:
                    writer.writerow({'produits communs datasprint': product})

In [43]:
import csv
from csv import DictReader
from csv import DictWriter

# définition d'une fonction d'ajout de colonnes dans un csv (on va faire une colonne par ensemble)
def add_column_in_csv_2(input_file, output_file, iterable, transform_row, tansform_column_names):
    """ Append a column in existing csv using csv.reader / csv.writer classes"""
    # Open the input_file in read mode and output_file in write mode
    with open(input_file, 'r') as read_obj, \
            open(output_file, 'w', newline='') as write_obj:
        # Create a DictReader object from the input file object
        dict_reader = DictReader(read_obj)
        # Get a list of column names from the csv
        field_names = dict_reader.fieldnames
        # Call the callback function to modify column name list
        tansform_column_names(field_names)
        # Create a DictWriter object from the output file object by passing column / field names
        dict_writer = DictWriter(write_obj, field_names)
        # Write the column names in output csv file
        dict_writer.writeheader()
        # Read each row of the input csv file as dictionary
        for row, item in zip(dict_reader, iterable): 
            # Modify the dictionary / row by passing it to the transform function (the callback)
            transform_row(row, dict_reader.line_num, item)
            # Write the updated dictionary or row to the output file
            dict_writer.writerow(row)

In [47]:
# complétion du tableau les produits exclusifs à Toflit pour le datasprint : 
header_of_new_col = 'produits exclusifs Toflit'
# je réécris mon fichier csv en écrasant l'ancien
add_column_in_csv_2('preliminary_inquiry/dumps/croisement_produits_datasprint_revolutionempire.csv', 'preliminary_inquiry/dumps/croisement_produits_datasprint_revolutionempire.csv', result2,
                    lambda row, line_num, item: 
                            row.update({header_of_new_col: item}), 
                    lambda fiel_dnames: field_names.append(header_of_new_col))


TypeError: 'NoneType' object is not iterable

In [48]:
# complétion du tableau les produits exclusifs à Toflit pour le datasprint : 
header_of_new_col = 'produits exclusifs Navigo'
# je réécris mon fichier csv en écrasant l'ancien
add_column_in_csv_2('preliminary_inquiry/dumps/croisement_produits_datasprint_revolutionempire.csv', 'preliminary_inquiry/dumps/croisement_produits_datasprint_revolutionempire.csv', result3,
                    lambda row, line_num, item: 
                            row.update({header_of_new_col: item}), 
                    lambda field_names: field_names.append(header_of_new_col))

AttributeError: 'NoneType' object has no attribute 'append'