## Objectif : 
Pour les produit commercés / transportés pour les flux concernant le datasprint, obtenir 3 ensembles :
- ensemble 1 - produits qu'on retrouve à la fois dans Toflit18 et Portic
- ensemble 2 - produits qu'on retrouve exclusivement dans Toflit18
- ensemble 3 - produits qu'on retrouve exclusivement dans Portic

In [8]:
from poitousprint import Portic, Toflit, get_pointcalls_commodity_purposes_as_toflit_product

toflit_client = Toflit()
portic_client = Portic()


In [9]:
# choix d'une classification d'alignement
chosen_classification = 'product_simplification'

In [10]:
# récupération des pointcalls Portic qui concernent le datasprint
pointcalls_datasprint = portic_client.get_pointcalls(
 year = 1789,
 pointcall_admiralty = ['La Rochelle', 'Marennes', 'Sables d\'Olonne']
)

# enrichissement de ces pointcalls avec la propriété 'commodity_as_toflit' qui nous donne l'équivalent des produits navigo dans Toflit18 avec la classification choisie
croisement_produits = get_pointcalls_commodity_purposes_as_toflit_product(pointcalls_datasprint, product_classification=chosen_classification)

In [11]:
navigo_products_for_datasprint = set()
for pointcall in croisement_produits:
    if pointcall['commodity_purposes'] is not None:
        for commodity in pointcall['commodity_purposes']:
            navigo_products_for_datasprint.add(commodity['commodity_as_toflit'])

navigo_products_for_datasprint

{'???',
 None,
 'ails',
 'autres marchandises',
 'autres marchandises permises',
 'avoine',
 'baillarge',
 'beurre',
 'biscuit',
 'bière',
 'blé',
 'blé baillarge',
 'blé froment',
 'blé méture',
 'bois',
 'bois de charpente',
 'bois de chauffage',
 'bois de construction',
 'bois de merrains',
 'bois de navire',
 'bois merrains',
 'bois à brûler',
 'bordage',
 'bouteilles',
 'bouteilles vides',
 'brai',
 'briques',
 'bûches',
 'bûches à bruler',
 'café',
 'café avarié',
 'canons',
 'carreaux',
 'cendre',
 'cendre lessivière',
 'cercles',
 'cerises',
 'chanvre',
 'charbon',
 'charbon de bois',
 'charbon de terre',
 'chaux',
 'copeaux',
 'coton',
 'cuivre',
 'diverses marchandises',
 'diverses marchandises permises',
 'eau-de-vie',
 'en lest',
 'fagots',
 'fagots de fourrages',
 'faire la pêche au poisson frais',
 'farine',
 'faïence',
 'fer',
 'feuillards',
 'fourrages',
 'fromage',
 'froment',
 'fruits',
 'fumier',
 'futailles',
 'futailles vides',
 'fèves',
 'fûts vides',
 'garobe',
 

In [12]:
# récupération des flows Toflit18 qui concernent le datasprint
flows = toflit_client.get_flows(
    year=1789, 
    customs_region='La Rochelle',
)

toflit_products_for_datasprint = set()
for flow in flows:
    toflit_products_for_datasprint.add(flow[chosen_classification])

toflit_products_for_datasprint

{'acier',
 'agrès de navire',
 'alun',
 'amandes',
 'amidon',
 'armes blanches',
 'armes blanches en sabres',
 'armes blanches sabres',
 'armes à feu fusils',
 'armes à feu pistolets',
 'avoine',
 'azur',
 'baleine',
 'baleine coupée',
 'bestiaux bœuf',
 'beurre',
 'biscuit',
 'biscuit de mer',
 'bière',
 'blé seigle',
 "bois d'acajou",
 'bois de Caliatour',
 'bois de Campêche',
 'bois de Pernambouc',
 'bois de chêne',
 'bois de chêne en bordages',
 'bois de construction',
 'bois de menuiserie',
 'bois de pin en planches',
 'bois de sapin',
 'bois de sapin en bordages',
 'bois de sapin en morceaux',
 'bois de sapin en perches',
 'bois de sapin en planches',
 'bois de sapin en poutres',
 'bois de sapin pour construction',
 'bois divers',
 'bois du Brésil',
 "bois en barres d'anspect",
 'bois en bordage',
 'bois en cercles',
 'bois en lattes',
 'bois en manches de gaffes',
 'bois en matériaux',
 'bois en mâts',
 'bois en perches',
 'bois en planches',
 'bois en soliveaux',
 'bois et écor

In [13]:
result1 = toflit_products_for_datasprint.intersection(navigo_products_for_datasprint)

result2 = toflit_products_for_datasprint.difference(navigo_products_for_datasprint)

result3 = navigo_products_for_datasprint.difference(toflit_products_for_datasprint)

print("ensemble 1 - produits qu'on retrouve à la fois dans Toflit18 et Portic :\n", result1)
print("\n\nensemble 2 - produits qu'on retrouve exclusivement dans Toflit18 : \n", result2)
print("\n\nensemble 3 - produits qu'on retrouve exclusivement dans Portic : \n", result3)


ensemble 1 - produits qu'on retrouve à la fois dans Toflit18 et Portic :
 {'chanvre', 'avoine', 'charbon de terre', 'pierres', 'futailles vides', 'fer', 'café avarié', 'vinaigre', 'étoupes', 'brai', 'noix', 'beurre', 'bois à brûler', 'vaches', 'goudron', 'café', 'résines', 'graine de lin', 'fagots', 'meubles', 'fromage', 'morue verte', 'cuivre', 'farine', 'futailles', 'charbon de bois', 'bière', 'faïence', 'sel', 'lin', 'froment', 'eau-de-vie', 'biscuit', 'sardines salées', 'bois merrains', 'orge', 'chaux', 'plâtre', 'lard salé', 'suif', 'fèves', 'coton', 'oignons', 'laine', 'sardines', 'bois de construction', 'vin', 'savon'}


ensemble 2 - produits qu'on retrouve exclusivement dans Toflit18 : 
 {'bois et écorce de chêne et de frêne', 'chanvre en rames', 'mouchoirs des Indes', 'épicerie piment', 'peaux de martre', 'limes', 'fèves blanches', 'cuivre en planches', 'cuirs de bœuf tannés', 'étoffe diverse en laine', 'bois en soliveaux', 'fruits confits au vinaigre', 'peaux de mouton', 'hui

In [14]:
# écriture dans un fichier txt

# write data in a file.
fichier_texte = open('preliminary_inquiry/dumps/croisement_produits_datasprint_' + chosen_classification + '.txt',"w")
L = ["This is Delhi \n","This is Paris \n","This is London \n"] 
  
# \n is placed to indicate EOL (End of Line)
fichier_texte.write("ensemble 1 - produits qu'on retrouve à la fois dans Toflit18 et Portic :\n") 
for produit in result1:
    fichier_texte.write(str(produit)+"\n")

fichier_texte.write("\n\n\nensemble 2 - produits qu'on retrouve exclusivement dans Toflit18 :\n") 
for produit in result2:
    fichier_texte.write(str(produit)+"\n")

fichier_texte.write("\n\n\nensemble 3 - produits qu'on retrouve exclusivement dans Portic :\n") 
for produit in result3:
    fichier_texte.write(str(produit)+"\n")
    # file1.writelines(L)

fichier_texte.close() #to change file access modes
  
# file1 = open("myfile.txt","r+") 

In [15]:
# écriture dans un csv

# initialisation du tableau avec une 1ere colonne contenant les produits communs
with open('preliminary_inquiry/dumps/croisement_produits_datasprint_' + chosen_classification + '.csv', 'w', newline='') as csvfile:
        fieldnames = ['produits communs datasprint']
        writer = csv.DictWriter(csvfile, fieldnames=fieldnames)

        writer.writeheader()
        for product in result1:
                    writer.writerow({'produits communs datasprint': product})

NameError: name 'csv' is not defined

In [43]:
import csv
from csv import DictReader
from csv import DictWriter

# définition d'une fonction d'ajout de colonnes dans un csv (on va faire une colonne par ensemble)
def add_column_in_csv_2(input_file, output_file, iterable, transform_row, tansform_column_names):
    """ Append a column in existing csv using csv.reader / csv.writer classes"""
    # Open the input_file in read mode and output_file in write mode
    with open(input_file, 'r') as read_obj, \
            open(output_file, 'w', newline='') as write_obj:
        # Create a DictReader object from the input file object
        dict_reader = DictReader(read_obj)
        # Get a list of column names from the csv
        field_names = dict_reader.fieldnames
        # Call the callback function to modify column name list
        tansform_column_names(field_names)
        # Create a DictWriter object from the output file object by passing column / field names
        dict_writer = DictWriter(write_obj, field_names)
        # Write the column names in output csv file
        dict_writer.writeheader()
        # Read each row of the input csv file as dictionary
        for row, item in zip(dict_reader, iterable): 
            # Modify the dictionary / row by passing it to the transform function (the callback)
            transform_row(row, dict_reader.line_num, item)
            # Write the updated dictionary or row to the output file
            dict_writer.writerow(row)

In [47]:
# complétion du tableau les produits exclusifs à Toflit pour le datasprint : 
header_of_new_col = 'produits exclusifs Toflit'
# je réécris mon fichier csv en écrasant l'ancien
add_column_in_csv_2('preliminary_inquiry/dumps/croisement_produits_datasprint_revolutionempire.csv', 'preliminary_inquiry/dumps/croisement_produits_datasprint_revolutionempire.csv', result2,
                    lambda row, line_num, item: 
                            row.update({header_of_new_col: item}), 
                    lambda fiel_dnames: field_names.append(header_of_new_col))


TypeError: 'NoneType' object is not iterable

In [48]:
# complétion du tableau les produits exclusifs à Toflit pour le datasprint : 
header_of_new_col = 'produits exclusifs Navigo'
# je réécris mon fichier csv en écrasant l'ancien
add_column_in_csv_2('preliminary_inquiry/dumps/croisement_produits_datasprint_revolutionempire.csv', 'preliminary_inquiry/dumps/croisement_produits_datasprint_revolutionempire.csv', result3,
                    lambda row, line_num, item: 
                            row.update({header_of_new_col: item}), 
                    lambda field_names: field_names.append(header_of_new_col))

AttributeError: 'NoneType' object has no attribute 'append'