# File Handling in Python



So far we have seen different Python data types. We usually store our data in different file formats. In addition to handling files, we will also see different file formats(.txt, .json, .xml, .csv, .tsv, .excel) in this section. First, let us get familiar with handling files with common file format(.txt).

File handling is an import part of programming which allows us to create, read, update and delete files. In Python to handle data we use open() built-in function.

<font color="blue"> Nous avons déjà vu différents types de données Python. Nous stockons généralement nos données dans différents formats de fichiers. Outre la gestion des fichiers, nous aborderons également les différents formats de fichiers (.txt, .json, .xml, .csv, .tsv, .excel) dans cette section. Commençons par nous familiariser avec la gestion des fichiers au format courant (.txt).

<font color="blue">La gestion de fichiers est une étape importante de la programmation : elle permet de créer, lire, mettre à jour et supprimer des fichiers. En Python, la gestion des données s'effectue grâce à la fonction intégrée open().
</font>

In [None]:
# Syntax
open('filename', mode) # mode(r, a, w, x, t,b)  could be to read, write, update

<b>"r" - </b>Read - Default value. Opens a file for reading, it returns an error if the file does not exist<br>
<b>"a" - </b>Append - Opens a file for appending, creates the file if it does not exist<br>
<b>"w" - </b>Write - Opens a file for writing, creates the file if it does not exist<br>
<b>"x" - </b>Create - Creates the specified file, returns an error if the file exists<br>
<b>"t" - </b>Text - Default value. Text mode<br>
<b>"b" - </b>Binary - Binary mode (e.g. images)
<font color="blue"><br><br>
<b>"r" - </b>Lecture - Valeur par défaut. Ouvre un fichier en lecture ; renvoie une erreur si le fichier n'existe pas.<br>
<b>"a" - </b>Ajout - Ouvre un fichier en lecture et crée le fichier s'il n'existe pas.<br>
<b>"w" - </b>Écriture - Ouvre un fichier en écriture et crée le fichier s'il n'existe pas.<br>
<b>"x" - </b>Création - Crée le fichier spécifié et renvoie une erreur si le fichier existe.<br>
<b>"t" - </b>Texte - Valeur par défaut. Mode texte.<br>
<b>"b" - </b>Binaire - Mode binaire (par exemple, images).

### Opening Files for Reading
The default mode of open is reading, so we do not have to specify 'r' or 'rt'. I have created and saved a file named texst.txt in the files directory. Let us see how it is done:

### <font color="blue">Ouverture de fichiers en lecture
<font color="blue">Le mode d'ouverture par défaut est la lecture ; il n'est donc pas nécessaire de spécifier « r » ou « rt ». J'ai créé et enregistré un fichier nommé texst.txt dans le répertoire files. Voyons comment procéder :

In [10]:
f = open('texst.txt')
print(f)

<_io.TextIOWrapper name='texst.txt' mode='r' encoding='UTF-8'>


As you can see in the example above, I printed the opened file and it gave some information about it. Opened file has different reading methods: read(), readline, readlines. An opened file has to be closed with close() method.

read(): read the whole text as string. If we want to limit the number of characters we want to read, we can limit it by passing int value to the read(number) method.
    
<font color="blue">
Comme vous pouvez le voir dans l'exemple ci-dessus, j'ai affiché le fichier ouvert et obtenu quelques informations. Chaque fichier ouvert possède différentes méthodes de lecture : read(), readline et readlines. Un fichier ouvert doit être fermé avec la méthode close().

read() : lit le texte entier sous forme de chaîne. Pour limiter le nombre de caractères à lire, il suffit de passer une valeur de type int à la méthode read(number).</font>    
    

In [11]:
f = open('texst.txt')
txt = f.read()
#print(type(txt))
print(txt)
f.close()

This text has to be appended at the end. Great job!This text has to be appended at the end. Great job!This text has to be appended at the end. Great job!This text has to be appended at the end. Great job!


Instead of printing all the text, let us print the first 10 characters of the text file.

<font color="blue">Au lieu d'imprimer tout le texte, imprimons les 10 premiers caractères du fichier texte.</font>

In [14]:
f = open('texst.txt')
txt = f.read(20)
print(type(txt))
print(txt)
f.close()

<class 'str'>
This text has to be 


In [15]:
len(txt)

20

readline(): read only the first line<br>
<font color="blue">readline() : lire uniquement la première ligne</font>

In [17]:
f = open('texst.txt')
txt = f.readline()
print(type(txt))
print(txt)
f.close()

<class 'str'>
This text has to be appended at the end. Great job!This text has to be appended at the end. Great job!This text has to be appended at the end. Great job!This text has to be appended at the end. Great job!



readlines(): read all the text line by line and returns a list of lines<br>
<font color="blue">
readlines() : lit tout le texte ligne par ligne et renvoie une liste de lignes</font>

In [18]:
f = open('texst.txt')
txt = f.readlines()
print(type(txt))
print(txt)
f.close()

<class 'list'>
['This text has to be appended at the end. Great job!This text has to be appended at the end. Great job!This text has to be appended at the end. Great job!This text has to be appended at the end. Great job!\n', 'This text has to be appended at the end. Great job!This text has to be appended at the end. Great job2!\n', 'This text has to be appended at the end. Great job!This text has to be appended at the end. Great job3!']


Another way to get all the lines as a list is using splitlines():
<br><font color="blue">Une autre façon d'obtenir toutes les lignes sous forme de liste est d'utiliser splitlines() :</font>

In [19]:
f = open('texst.txt')
txt = f.read().splitlines()
print(type(txt))
print(txt)
f.close()

<class 'list'>
['This text has to be appended at the end. Great job!This text has to be appended at the end. Great job!This text has to be appended at the end. Great job!This text has to be appended at the end. Great job!', 'This text has to be appended at the end. Great job!This text has to be appended at the end. Great job2!', 'This text has to be appended at the end. Great job!This text has to be appended at the end. Great job3!']


After we open a file, we should close it. There is a high tendency of forgetting to close them. There is a new way of opening files using with - closes the files by itself. Let us rewrite the the previous example with the with method:

<font color="blue">Après avoir ouvert un fichier, il est conseillé de le fermer. On a souvent tendance à oublier de le fermer. Il existe une nouvelle méthode pour ouvrir les fichiers : with, qui ferme automatiquement les fichiers. Réécrivons l'exemple précédent avec la méthode with :</font>    

In [20]:

with open('texst.txt') as f:
    lines = f.read().splitlines()
    print(type(lines))
    print(lines)

<class 'list'>
['This text has to be appended at the end. Great job!This text has to be appended at the end. Great job!This text has to be appended at the end. Great job!This text has to be appended at the end. Great job!', 'This text has to be appended at the end. Great job!This text has to be appended at the end. Great job2!', 'This text has to be appended at the end. Great job!This text has to be appended at the end. Great job3!']


### Opening Files for Writing and Updating
To write to an existing file, we must add a mode as parameter to the open() function:

"a" - append - will append to the end of the file, if the file does not it creates a new file.
"w" - write - will overwrite any existing content, if the file does not exist it creates.
Let us append some text to the file we have been reading:


### <font color="blue">Ouverture de fichiers pour écriture et mise à jour</font>
<font color="blue">Pour écrire dans un fichier existant, nous devons ajouter un mode en paramètre à la fonction open() :
<br><font color="blue">« a » - append - ajoute à la fin du fichier ; si le fichier n'existe pas, un nouveau fichier est créé.</font>
<br><font color="blue">« w » - write - écrase tout contenu existant ; si le fichier n'existe pas, il est créé.</font>
<br><font color="blue">Ajoutons du texte au fichier que nous lisons :</font>

In [52]:
with open('texst.txt','a') as f:
    f.write('\nThis text has to be appended at the end 2023. Great job 2027!')
    
f = open('texst.txt')
#txt = f.read().splitlines()
txt = f.read()
print(txt)


This text has to be appended at the end 2023. Great job 2027!


The method below creates a new file, if the file does not exist:
<br><font color="blue">La méthode ci-dessous crée un nouveau fichier, si le fichier n'existe pas :</font>

In [53]:
with open('b_texst.txt','w') as f:
    f.write('This text has to be appended at the end using "w" 2024. Great job!')
    
f = open('b_texst.txt')
#txt = f.read().splitlines()
txt = f.read()
print(txt)

This text has to be appended at the end using "w" 2024. Great job!


### Deleting Files
We have seen in previous section, how to make and remove a directory using os module. Again now, if we want to remove a file we use os module.

### <font color="blue">Suppression de fichiers</font>
<font color="blue">Nous avons vu dans la section précédente comment créer et supprimer un répertoire à l'aide du module os. Pour supprimer un fichier, utilisez à nouveau le module os.</font>

In [54]:
import os
os.remove('b_texst.txt')

If the file does not exist, the remove method will raise an error, so it is good to use a condition like this:
<br><font color="blue">Si le fichier n'existe pas, la méthode remove générera une erreur, il est donc judicieux d'utiliser une condition comme celle-ci :</font>

In [55]:
import os
if os.path.exists('b_texst.txt'):
    os.remove('b_texst.txt')
else:
    print('The file does not exist')

The file does not exist


### File Types
<b>File with txt Extension:</b><br>
File with txt extension is a very common form of data and we have covered it in the previous section. Let us move to the JSON file
<b>File with json Extension:</b><br>
JSON stands for JavaScript Object Notation. Actually, it is a stringified JavaScript object or Python dictionary.

### <font color="blue">Types de fichiers</font>
<b><font color="blue">Fichier avec l'extension txt :</b><br>
<font color="blue">Les fichiers avec l'extension txt sont un format de données très courant, comme nous l'avons vu dans la section précédente. Passons maintenant au fichier JSON.
<br><b><font color="blue">Fichier avec l'extension json :</b><br>
<font color="blue">JSON signifie JavaScript Object Notation. Il s'agit en fait d'un objet JavaScript ou d'un dictionnaire Python transformé en chaîne.

In [29]:
person_dict = {
    'first_name':'Chayil',
    'last_name':'Assih',
    'age':25,
    'country':'New York',
    'is_marred':True,
    
    }

print(person_dict)

{'first_name': 'Chayil', 'last_name': 'Assih', 'age': 25, 'country': 'New York', 'is_marred': True}


In [30]:
person_json = '''{
    "first_name":"Chayil",
    "last_name":"Assih",
    "age":"25",
    "country":"New York",
    "is_marred":"True"
    }'''

print(person_json)

{
    "first_name":"Chayil",
    "last_name":"Assih",
    "age":"25",
    "country":"New York",
    "is_marred":"True"
    }


### Changing JSON to Dictionary
To change a JSON to a dictionary, first we import the json module and then we use loads method.

### <font color="blue">Convertir un JSON en dictionnaire
<font color="blue">Pour convertir un JSON en dictionnaire, il faut d'abord importer le module json, puis utiliser la méthode loads.

In [31]:
import json
person_json = '''{
    "first_name":"Chayil",
    "last_name":"Assih",
    "age":"25",
    "country":"New York",
    "is_marred":"True"
    }'''

# let's change JSON to dictionary
person_dct = json.loads(person_json)
print(type(person_dct))
print(person_dct)
print(person_dct['first_name'])

<class 'dict'>
{'first_name': 'Chayil', 'last_name': 'Assih', 'age': '25', 'country': 'New York', 'is_marred': 'True'}
Chayil


### Changing Dictionary to JSON
To change a dictionary to a JSON we use dumps method from the json module.

### <font color="blue">Conversion d'un dictionnaire en JSON</font>
<font color="blue">Pour convertir un dictionnaire en JSON, nous utilisons la méthode dumps du module JSON.</font>

In [32]:
import json
person_dict = {
    'first_name':'Chayil',
    'last_name':'Assih',
    'age':25,
    'country':'New York',
    'is_marred':True,
    
    }
# let's convert it to  json
person_json = json.dumps(person_dict, indent=4) # indent could be 2, 4, 8. It beautifies the json / # l'indentation peut être de 2, 4, 8. Cela embellit le json
print(type(person_json))
print(person_json)


<class 'str'>
{
    "first_name": "Chayil",
    "last_name": "Assih",
    "age": 25,
    "country": "New York",
    "is_marred": true
}


### Saving as JSON File
We can also save our data as a json file. Let us save it as a json file using the following steps. For writing a json file, we use the json.dump() method, it can take dictionary, output file, ensure_ascii and indent.

### <font color="blue">Enregistrement au format JSON</font>
<font color="blue">Nous pouvons également enregistrer nos données au format JSON. Pour ce faire, procédez comme suit : pour écrire un fichier JSON, utilisez la méthode json.dump(), qui peut prendre en charge un dictionnaire, un fichier de sortie, ensure_ascii et indent.</font>

In [33]:
person_dict = {
    'first_name':'Chayil',
    'last_name':'Assih',
    'age':25,
    'country':'New York',
    'is_marred':True,
    
    }

with open('test.json', 'w', encoding='utf-8') as f:
    json.dump(person_dict, f, ensure_ascii=False, indent=4)

### File with csv Extension
CSV stands for comma separated values. CSV is a simple file format used to store tabular data, such as a spreadsheet or database. CSV is a very common data format in data science.

### <font color="">Fichier avec extension CSV</font>
<font color="blue">CSV signifie « valeurs séparées par des virgules ». CSV est un format de fichier simple utilisé pour stocker des données tabulaires, comme celles d'une feuille de calcul ou d'une base de données. CSV est un format de données très courant en science des données.

In [57]:
import csv
with open('/home/as1babala/Python Code/b_texst.csv','w') as f:
    f.write('This text has to be appended at the end. Great job!')

In [35]:
with open('/home/as1babala/Python Code/b_texst.csv') as f:
    csv_reader = csv.reader(f, delimiter=',') # w use, reader method to read csv
    line_count = 0
    for row in csv_reader:
        if line_count == 0:
            print(f'Column names are :{", ".join(row)}')
            line_count += 1
        else:
            print(
                f'\t{row[0]} is a teachers. He lives in {row[1]}, {row[2]}.')
            line_count += 1
    print(f'Number of lines:  {line_count}')

Column names are :This text has to be appended at the end. Great job!
Number of lines:  1


### File with xlsx Extension
To read excel files we need to install xlrd package. We will cover this after we cover package installing using pip.

### <font color="blue"> Fichier avec extension xlsx
<font color="blue"> Pour lire les fichiers Excel, nous devons installer le package xlrd. Nous aborderons ce sujet après avoir abordé l'installation du package avec PIP.

In [58]:
from openpyxl import Workbook

# Create a new workbook and select the active worksheet
wb = Workbook()
ws = wb.active

# Add data to the worksheet
ws['A1'] = 'Item'
ws['B1'] = 'Quantity'
ws['C1'] = 'Price'
ws.append(['Apples', 10, 0.5])
ws.append(['Bananas', 5, 0.3])

#Enregistrer le classeur
# Save the workbook
wb.save('inventory.xlsx')

### openpyxl:
A library for reading and writing Excel 2010 xlsx/xlsm/xltx/xltm files.
Allows you to create and modify spreadsheets programmatically, add formulas, format cells, and much more.
openpyxl is great for tasks that involve detailed cell-level manipulations.
<br>=============<br>
<font color="blue">
Bibliothèque permettant de lire et d'écrire des fichiers Excel 2010 xlsx/xlsm/xltx/xltm.
Permet de créer et de modifier des feuilles de calcul par programmation, d'ajouter des formules, de formater des cellules et bien plus encore.
Openpyxl est idéal pour les tâches impliquant des manipulations détaillées au niveau des cellules.

In [41]:
import xlrd
# Create a new workbook and select the active worksheet
# Créez un nouveau classeur et sélectionnez la feuille de calcul active
wb = Workbook()
ws = wb.active

# Add data to the worksheet
# Ajouter des données à la feuille de calcul
ws['A1'] = 'Item'
ws['B1'] = 'Quantity'
ws['C1'] = 'Price'
ws.append(['Apples', 10, 0.5])
ws.append(['Bananas', 5, 0.3])

# Save the workbook
wb.save('inventory1.xls')

To open an Excel file like inventory.xlsx in Python, you can use the pandas library, which is commonly used for handling Excel and CSV files.
You must install pandas and openpyxl if you haven't already, here is how to install a library / package : <br><b>pip install pandas openpyxl</b>
<br><p></p>
<font color='blue'>
Pour ouvrir un fichier Excel comme inventory.xlsx en Python, vous pouvez utiliser la bibliothèque pandas, couramment utilisée pour la gestion des fichiers Excel et CSV.
Vous devez installer pandas et openpyxl si vous ne l'avez pas déjà fait, voici comment installer une bibliothèque / un package : <br><b>pip install pandas openpyxl</b>

In [38]:
import pandas as pd

# Load the Excel file
df = pd.read_excel('inventory.xlsx')

# Display the first few rows of the file
#Afficher les premières lignes du fichier
print(df.head(10))

      Item  Quantity  Price
0   Apples        10    0.5
1  Bananas         5    0.3


In [41]:
# To get a list of all sheet names:
# Pour obtenir une liste de tous les noms de feuilles :
excel_file = pd.ExcelFile('inventory.xlsx')
print(excel_file.sheet_names)

['Sheet']


In [44]:
# To specify a sheet, use:
# Pour spécifier une feuille, utilisez :
df = pd.read_excel('inventory.xlsx', sheet_name='Sheet')
print(df.head())

      Item  Quantity  Price
0   Apples        10    0.5
1  Bananas         5    0.3


In [50]:
# To read multiple sheets:
# Pour lire plusieurs feuilles :
dfs = pd.read_excel('inventory.xlsx', sheet_name=None)  # Returns a dict of DataFrames
print(dfs)

{'Sheet':       Item  Quantity  Price
0   Apples        10    0.5
1  Bananas         5    0.3}


### File with xml Extension
XML is another structured data format which looks like HTML. In XML the tags are not predefined. The first line is an XML declaration. The person tag is the root of the XML. The person has a gender attribute. Example:XML
### <font color="blue">Fichier avec extension XML</font>
<font color="blue">XML est un autre format de données structurées similaire au HTML. En XML, les balises ne sont pas prédéfinies. La première ligne est une déclaration XML. La balise « personne » est la racine du XML. La personne possède un attribut de genre. Exemple : XML    

In [39]:
xml_content = '''<?xml version="1.0"?>
<person gender="female">
  <name>Asabeneh</name>
  <country>Finland</country>
  <city>Helsinki</city>
  <skills>
    <skill>JavaScrip</skill>
    <skill>React</skill>
    <skill>Python</skill>
  </skills>
</person>'''

with open("person.xml", "w", encoding="utf-8") as f:
    f.write(xml_content)

print("XML file created successfully! / Fichier XML créé avec succès !")

XML file created successfully! / Fichier XML créé avec succès !


In [40]:
import xml.etree.ElementTree as ET

# Create the root element / Créer l'élément racine
person = ET.Element("person")
person.set("gender", "female")

# Create child elements / Créer des éléments enfants
name = ET.SubElement(person, "name")
name.text = "Chayil"

country = ET.SubElement(person, "country")
country.text = "USA"

city = ET.SubElement(person, "city")
city.text = "NYC"

# Create skills element with multiple skill children / Créer un élément de compétences avec plusieurs enfants de compétences
skills = ET.SubElement(person, "skills")

skill1 = ET.SubElement(skills, "skill")
skill1.text = "JavaScrip"

skill2 = ET.SubElement(skills, "skill")
skill2.text = "React"

skill3 = ET.SubElement(skills, "skill")
skill3.text = "Python"

# Create the tree and write to file / Créer l'arbre et écrire dans le fichier
tree = ET.ElementTree(person)
ET.indent(tree, space="  ", level=0)  # For pretty formatting (Python 3.9+)
tree.write("person.xml", encoding="utf-8", xml_declaration=True)

print("XML file created successfully! / Fichier XML créé avec succès !")

XML file created successfully! / Fichier XML créé avec succès !


In [41]:
import xml.etree.ElementTree as ET

# Load and parse the XML file
tree = ET.parse('person.xml')
root = tree.getroot()

# Print the root tag
print(f"Root tag: {root.tag}\n")

# Iterate through elements
for child in root:
    print(f"Tag: {child.tag}, Attributes: {child.attrib}")
    for sub_child in child:
        print(f"  Sub-tag: {sub_child.tag}, Value: {sub_child.text}")

Root tag: person

Tag: name, Attributes: {}
Tag: country, Attributes: {}
Tag: city, Attributes: {}
Tag: skills, Attributes: {}
  Sub-tag: skill, Value: JavaScrip
  Sub-tag: skill, Value: React
  Sub-tag: skill, Value: Python


In [42]:
# Check the current directory
import os
print(os.getcwd())

/home/as1babala/Python Code/Coding


In [60]:
import os

# Define the path (make sure this path exists on your system)
path = '/home/as1babala/Python Code/AI_Agent'  # change this to your valid path

# Change the current working directory

os.chdir(path)


In [61]:

# Confirm that the directory has changed
print(os.getcwd())


/home/as1babala/Python Code/AI_Agent


In [45]:
dfs1 = pd.read_excel('inventory.xlsx', sheet_name=None)  # Returns a dict of DataFrames
print(dfs1)

{'Sheet':       Item  Quantity  Price
0   Apples        10    0.5
1  Bananas         5    0.3}


In [48]:
# List all files and folders in the current directory / Lister tous les fichiers et dossiers du répertoire actuel
print(os.getcwd())


/home/as1babala/Python Code/AI_Agent


In [49]:
print(os.listdir())

['person.xml', 'inventory1.xls', 'inventory.xlsx', 'logs', '.ipynb_checkpoints', 'Directories Scraper.ipynb']


In [51]:
import os

path = '/home/as1babala/Python Code/AI_Agent'

try:
    os.chdir(path)
    print(f"Changed directory to: {os.getcwd()}")
except FileNotFoundError:
    print("The directory does not exist.")

Changed directory to: /home/as1babala/Python Code/AI_Agent


Happy Pythoning!<br>
<font color="blue">Bon Pythoning !</font>