## Croisement 1 - Croisement produits

Objectif : 
Pour les produit commercés / transportés pour les flux concernant le datasprint, obtenir 3 ensembles :
- ensemble 1 - produits qu'on retrouve à la fois dans Toflit18 et Portic
- ensemble 2 - produits qu'on retrouve exclusivement dans Toflit18
- ensemble 3 - produits qu'on retrouve exclusivement dans Portic

In [8]:
from poitousprint import Portic, Toflit, get_pointcalls_commodity_purposes_as_toflit_product

toflit_client = Toflit()
portic_client = Portic()


In [16]:
# choix d'une classification d'alignement
chosen_classificationx = ['product_source', 'product_orthographic', 'product_simplification', 'product_revolutionempire']


In [17]:
# récupération des pointcalls Portic qui concernent le datasprint
pointcalls_datasprint = portic_client.get_pointcalls(
 year = 1789,
 pointcall_admiralty = ['La Rochelle', 'Marennes', 'Sables d\'Olonne']
)

# enrichissement de ces pointcalls avec la propriété 'commodity_as_toflit' qui nous donne l'équivalent des produits navigo dans Toflit18 avec la classification choisie
croisement_produits = get_pointcalls_commodity_purposes_as_toflit_product(pointcalls_datasprint, product_classification=chosen_classification)

In [18]:
navigo_products_for_datasprint = set()
for pointcall in croisement_produits:
    if pointcall['commodity_purposes'] is not None:
        for commodity in pointcall['commodity_purposes']:
            navigo_products_for_datasprint.add(commodity['commodity_as_toflit'])

navigo_products_for_datasprint

{'???',
 None,
 'ails',
 'ardoises',
 'avoine',
 'baillarge',
 'beurre',
 'biscuit',
 'bière',
 'blé',
 'bois',
 'bois de charpente',
 'bois de navire',
 'bois pour brûler',
 'bois pour construction',
 'bordage',
 'bouteilles',
 'bouteilles vides',
 'brai',
 'briques',
 'bûches',
 'café',
 'café avarié',
 'canons',
 'carreaux',
 'cendre',
 'cendre de lessive',
 'cercles',
 'cerises',
 'chanvre',
 'charbon',
 'charbon de bois',
 'charbon de terre',
 'chaux',
 'copeaux',
 'cordage vieux',
 'coton',
 'cuivre',
 'divers',
 'eau-de-vie',
 'fagots',
 'faire la pêche au poisson frais',
 'farine',
 'faïence',
 'fer',
 'fer vieux',
 'feuillards',
 'fourrages',
 'fourrages en fagots',
 'fromage',
 'fruits',
 'fumier',
 'futailles',
 'futailles vides',
 'fèves',
 'fûts',
 'goudron',
 'graine de lin',
 'grains',
 'grains baillarge',
 'grains blé',
 'grains de lin',
 'grains divers',
 'grains froment',
 'grains méteil',
 'grains orge',
 'hardes',
 'huile',
 'huîtres',
 'laine',
 'lard salé',
 'lent

In [19]:
# récupération des flows Toflit18 qui concernent le datasprint
flows = toflit_client.get_flows(
    year=1789, 
    customs_region='La Rochelle',
)

toflit_products_for_datasprint = set()
for flow in flows:
    toflit_products_for_datasprint.add(flow[chosen_classification])

toflit_products_for_datasprint

{'Marly',
 'Nankin',
 'acier',
 'agrès',
 'alun',
 'amandes',
 'amidon',
 'ancres de fer',
 'anisette',
 'armes blanches',
 'avoine',
 'azur',
 'babassis',
 'bajutapau',
 'baleine',
 'baleine coupée',
 "barres d'anspect en bois",
 'barres de fer',
 'bas de soie',
 'bayette',
 'beurre',
 'biscuit',
 'biscuit de mer',
 'bière',
 'bois',
 "bois d'acajou",
 'bois de Brésil',
 'bois de Caliatour',
 'bois de Campêche',
 'bois de Pernambouc',
 'bois de chêne',
 'bois de menuiserie',
 'bois de sapin',
 'bois et écorces de chêne et de frêne',
 'bois jaune',
 'bois osier',
 'bois pour brûler',
 'bois pour brûler et fagots',
 'bois pour construction',
 'bois pour construction de sapin',
 'bonneterie de coton',
 'bonneterie de fil',
 'bonneterie de laine',
 'bonneterie de soie',
 'bonnets de laine',
 'bordage',
 'bordage de chêne',
 'bordage de sapin',
 'brai',
 'brai et goudron',
 'brai gras',
 'brai gras et sec',
 'brai sec',
 'broderie',
 'bâtiments naufragés',
 'bœuf',
 'bœuf salé',
 'cacao',


In [20]:
result1 = toflit_products_for_datasprint.intersection(navigo_products_for_datasprint)

result2 = toflit_products_for_datasprint.difference(navigo_products_for_datasprint)

result3 = navigo_products_for_datasprint.difference(toflit_products_for_datasprint)

print("ensemble 1 - produits qu'on retrouve à la fois dans Toflit18 et Portic :\n", result1)
print("\n\nensemble 2 - produits qu'on retrouve exclusivement dans Toflit18 : \n", result2)
print("\n\nensemble 3 - produits qu'on retrouve exclusivement dans Portic : \n", result3)


ensemble 1 - produits qu'on retrouve à la fois dans Toflit18 et Portic :
 {'chanvre', 'avoine', 'merrains', 'pierres', 'charbon de terre', 'bois', 'fer', 'café avarié', 'bois pour brûler', 'futailles vides', 'vinaigre', 'étoupes', 'grains méteil', 'grains divers', 'bordage', 'brai', 'noix', 'beurre', 'fer vieux', 'vaches', 'goudron', 'café', 'résines', 'grains froment', 'graine de lin', 'fagots', 'marchandises', 'fromage', 'mobilier', 'morue verte', 'grains orge', 'cuivre', 'farine', 'bois pour construction', 'futailles', 'charbon de bois', 'bière', 'faïence', 'sel', 'lin', 'eau-de-vie', 'biscuit', 'sardines salées', 'chaux', 'plâtre', 'verges à moulins', 'lard salé', 'suif', 'fèves', 'coton', 'oignons', 'laine', 'sardines', 'vin', 'savon'}


ensemble 2 - produits qu'on retrouve exclusivement dans Toflit18 : 
 {'chanvre en rames', 'mouchoirs des Indes', 'planches de cuivre', 'peaux de martre', 'toile à carreaux et de lin', 'anisette', 'limes', 'mélasse rhum sirop taffia', 'fèves blanch

In [21]:
# écriture dans un fichier txt

# write data in a file.
fichier_texte = open('preliminary_inquiry/dumps/croisement_produits_datasprint_' + chosen_classification + '.txt',"w")
L = ["This is Delhi \n","This is Paris \n","This is London \n"] 
  
# \n is placed to indicate EOL (End of Line)
fichier_texte.write("ensemble 1 - produits qu'on retrouve à la fois dans Toflit18 et Portic :\n") 
for produit in result1:
    fichier_texte.write(str(produit)+"\n")

fichier_texte.write("\n\n\nensemble 2 - produits qu'on retrouve exclusivement dans Toflit18 :\n") 
for produit in result2:
    fichier_texte.write(str(produit)+"\n")

fichier_texte.write("\n\n\nensemble 3 - produits qu'on retrouve exclusivement dans Portic :\n") 
for produit in result3:
    fichier_texte.write(str(produit)+"\n")
    # file1.writelines(L)

fichier_texte.close() #to change file access modes
  
# file1 = open("myfile.txt","r+") 

In [22]:
# écriture dans un csv

# initialisation du tableau avec une 1ere colonne contenant les produits communs
with open('preliminary_inquiry/dumps/croisement_produits_datasprint_' + chosen_classification + '.csv', 'w', newline='') as csvfile:
        fieldnames = ['produits communs datasprint']
        writer = csv.DictWriter(csvfile, fieldnames=fieldnames)

        writer.writeheader()
        for product in result1:
                    writer.writerow({'produits communs datasprint': product})

NameError: name 'csv' is not defined

In [43]:
import csv
from csv import DictReader
from csv import DictWriter

# définition d'une fonction d'ajout de colonnes dans un csv (on va faire une colonne par ensemble)
def add_column_in_csv_2(input_file, output_file, iterable, transform_row, tansform_column_names):
    """ Append a column in existing csv using csv.reader / csv.writer classes"""
    # Open the input_file in read mode and output_file in write mode
    with open(input_file, 'r') as read_obj, \
            open(output_file, 'w', newline='') as write_obj:
        # Create a DictReader object from the input file object
        dict_reader = DictReader(read_obj)
        # Get a list of column names from the csv
        field_names = dict_reader.fieldnames
        # Call the callback function to modify column name list
        tansform_column_names(field_names)
        # Create a DictWriter object from the output file object by passing column / field names
        dict_writer = DictWriter(write_obj, field_names)
        # Write the column names in output csv file
        dict_writer.writeheader()
        # Read each row of the input csv file as dictionary
        for row, item in zip(dict_reader, iterable): 
            # Modify the dictionary / row by passing it to the transform function (the callback)
            transform_row(row, dict_reader.line_num, item)
            # Write the updated dictionary or row to the output file
            dict_writer.writerow(row)

In [47]:
# complétion du tableau les produits exclusifs à Toflit pour le datasprint : 
header_of_new_col = 'produits exclusifs Toflit'
# je réécris mon fichier csv en écrasant l'ancien
add_column_in_csv_2('preliminary_inquiry/dumps/croisement_produits_datasprint_revolutionempire.csv', 'preliminary_inquiry/dumps/croisement_produits_datasprint_revolutionempire.csv', result2,
                    lambda row, line_num, item: 
                            row.update({header_of_new_col: item}), 
                    lambda fiel_dnames: field_names.append(header_of_new_col))


TypeError: 'NoneType' object is not iterable

In [48]:
# complétion du tableau les produits exclusifs à Toflit pour le datasprint : 
header_of_new_col = 'produits exclusifs Navigo'
# je réécris mon fichier csv en écrasant l'ancien
add_column_in_csv_2('preliminary_inquiry/dumps/croisement_produits_datasprint_revolutionempire.csv', 'preliminary_inquiry/dumps/croisement_produits_datasprint_revolutionempire.csv', result3,
                    lambda row, line_num, item: 
                            row.update({header_of_new_col: item}), 
                    lambda field_names: field_names.append(header_of_new_col))

AttributeError: 'NoneType' object has no attribute 'append'