In [1]:
import pandas as pd
import glob
import json
import csv
import os

In [83]:
#create an absolute path to the file channel_advisor_api_data.txt
path = os.path.abspath('channel_advisor_api_data.txt')

#create an empty dataframe
df = pd.DataFrame()

In [78]:
def create_dataframe(file_name, df_fct):
    """
    This function creates a dataframe from a json file and appends it the existing dataframe
    :param file_name: the name of the json file
    :param df_fct: the existing dataframe
    :return: the new dataframe
    """
    #create an empty dataframe
    df1 = pd.DataFrame()

    #open the json file
    with open(file_name,'r') as f:
        data = json.load(f)
    f.close()

    #create a dataframe from the json file
    df1 = pd.DataFrame(data)

    # extract specific columns from the dataframe
    df1 = df1[['ID', 'ProfileID', 'CreateDateUtc', 'BuyItNowPrice', 'EAN', 'Attributes']]

    #For each name of 'Attributes' it create a column
    for i in range(len(df1['Attributes'])):
            if df1['Attributes'][i]['Name'] not in df1.columns:
                  df1[df1['Attributes'][i]['Name']] = df1['Attributes'][i]['Value']

    #Drop the column 'Attributes'
    df1 = df1.drop('Attributes', axis=1)

    df1 = df1.iloc[0:1]

    #Append the new dataframe to the existing one 
    df_fct = pd.concat([df_fct,df1], ignore_index=True)
    df1 = None

    #return the dataframe
    return df_fct

In [79]:
def write_csv(df_fct):
    """
    This function writes a csv file from a dataframe
    :param df_fct: the dataframe
    """
    #create a csv file
    with open('data.csv', 'w', newline='') as f:
        writer = csv.writer(f)
        writer.writerow(df.columns)
        for row in df.values:
            writer.writerow(row)
    f.close()

In [58]:
#Use the function to create a dataframe
df = create_dataframe(path, df)
df.head()

Unnamed: 0,ID,ProfileID,CreateDateUtc,BuyItNowPrice,EAN,(All_Basic)_Product lenght,(All_Basic)_Product weight,(All_Basic)_Product width,Amazon_DE_product_title,(All_General)_Product_color,...,Amazon_DE_b5,Marketplace_DE_description,(All_General)_Brand_introduction,Meta_description_XLDE,Product_description_XLDE,Bullet_Points_XLDE,Mascot XL Description,Mascot XL Bullet Points,ManoMano_DE_Description,Kaufland_HTML_Description_DE
0,9829791,12005841,2021-07-25T00:21:52.8466667Z,30.95,8720195383550,250.0,0.66,150.0,LIFA LIVING 2er Set Halbtransparente Vorhänge ...,Weiß,...,Weitere Informationen: Erhältlich in 4 verschi...,Halbtransparente Vorhänge von Lifa Living\r\n\...,<p><strong>Über Lifa Living</strong></p> <p>Hi...,Unsere Gardinen von Lifa Living sind aus 100 %...,<p><strong> Vorhänge mit Haken | Weiß | 150 x ...,• Unsere Vorhänge aus 100 % Polyester haben St...,Unsere Gardinen von Lifa Living sind aus 100 %...,• Unsere Vorhänge aus 100 % Polyester haben St...,<p style=text-align: justify;>1.<p style=text-...,<p style=text-align: justify;>1. Halbtranspare...


In [59]:
#Display the column "Mascot XL Bullet Points" of the dataframe.
df['Mascot XL Bullet Points'][0]

'• Unsere Vorhänge aus 100 % Polyester haben Standardmaße (150 x 250 cm) und ein zeitloses Design.\r\n• Die Vorhänge sind in vier verschiedenen Farben erhältlich: Weiß, Creme, Taubengrau und Hellgrau\r\n• Die Gardinen können in der Waschmaschine bei 30 Grad gewaschen werden.\r\n'

In [60]:
#write the csv file
write_csv(df)

In [80]:
#(!!BONUS!!)
#To execute the function "create_dataframe()" on a folder of many json files. It will add multiple rows to the dataframe for each product.

#Create a function that use create_dataframe for each file of a folder
def create_dataframe_from_folder(df_fct):
    """
    This function creates a dataframe from a folder of json files and appends it the existing dataframe
    :param path: the path of the folder
    :param df_fct: the existing dataframe
    :return: the new dataframe
    """
    #select all the files with the extension .txt in the folder
    files_names = glob.glob("*.txt")

    #create a absolute path for each file and use the function create_dataframe
    for file_name in files_names:
        path = os.path.abspath(file_name)
        df_fct = create_dataframe(path, df_fct)
    return df_fct

    

In [85]:
#use the function to create a dataframe from many json files
df = create_dataframe_from_folder(df)
df.head()

Unnamed: 0,ID,ProfileID,CreateDateUtc,BuyItNowPrice,EAN,(All_Basic)_Product lenght,(All_Basic)_Product weight,(All_Basic)_Product width,Amazon_DE_product_title,(All_General)_Product_color,...,Amazon_DE_b5,Marketplace_DE_description,(All_General)_Brand_introduction,Meta_description_XLDE,Product_description_XLDE,Bullet_Points_XLDE,Mascot XL Description,Mascot XL Bullet Points,ManoMano_DE_Description,Kaufland_HTML_Description_DE
0,9829791,12005841,2021-07-25T00:21:52.8466667Z,30.95,8720195383550,250.0,0.66,150.0,LIFA LIVING 2er Set Halbtransparente Vorhänge ...,Weiß,...,Weitere Informationen: Erhältlich in 4 verschi...,Halbtransparente Vorhänge von Lifa Living\r\n\...,<p><strong>Über Lifa Living</strong></p> <p>Hi...,Unsere Gardinen von Lifa Living sind aus 100 %...,<p><strong> Vorhänge mit Haken | Weiß | 150 x ...,• Unsere Vorhänge aus 100 % Polyester haben St...,Unsere Gardinen von Lifa Living sind aus 100 %...,• Unsere Vorhänge aus 100 % Polyester haben St...,<p style=text-align: justify;>1.<p style=text-...,<p style=text-align: justify;>1. Halbtranspare...
1,9829791,12005841,2021-07-25T00:21:52.8466667Z,30.95,8720195383550,250.0,0.66,150.0,LIFA LIVING 2er Set Halbtransparente Vorhänge ...,Weiß,...,Weitere Informationen: Erhältlich in 4 verschi...,Halbtransparente Vorhänge von Lifa Living\r\n\...,<p><strong>Über Lifa Living</strong></p> <p>Hi...,Unsere Gardinen von Lifa Living sind aus 100 %...,<p><strong> Vorhänge mit Haken | Weiß | 150 x ...,• Unsere Vorhänge aus 100 % Polyester haben St...,Unsere Gardinen von Lifa Living sind aus 100 %...,• Unsere Vorhänge aus 100 % Polyester haben St...,<p style=text-align: justify;>1.<p style=text-...,<p style=text-align: justify;>1. Halbtranspare...
