# Робота з файлами. Основна інформація

Використовуйте функцію open(), щоб відкрити файл. Він повертає файловий об’єкт.



```
file = open('filename', mode)
```

Common modes:
* Read Only (‘r’): Open text file for reading. If the file does not exist, raises the I/O error. This is also the default mode in which a file is opened.
* Read and Write (‘r+’): Open the file for reading and writing. Raises I/O error if the file does not exist.
* Write Only (‘w’): Open the file for writing. For the existing files, the data is truncated and over-written. Creates the file if the file does not exist.
* Write and Read (‘w+’): Open the file for reading and writing. For an existing file, data is truncated and over-written.
* Append Only (‘a’): Open the file for writing. The file is created if it does not exist. The handle is positioned at the end of the file. The data being written will be inserted at the end, after the existing data.
* Append and Read (‘a+’): Open the file for reading and writing. The file is created if it does not exist. The handle is positioned at the end of the file. The data being written will be inserted at the end, after the existing data.
* 'b' – Binary mode (e.g., 'rb', 'wb' for reading/writing binary files)
* 'x' – Exclusive creation, fails if the file already exists


In [None]:
word_file = open('word.json', 'r')
print(type(word_file))

Завжди закривайте файл, щоб звільнити системні ресурси - file.close().

In [None]:
word_file.close()
type(word_file)

In [None]:
word_file.read()

In [None]:
word_file.closed

#  Завдання 1: Завантажити будь яким способом файли типу: txt, json, csv, xlsx  +  Завдання 3: завантажити Pandas

In [None]:
import pandas as pd     #     Імпортуємо pandas для роботи з таблицями
import json             #     Для роботи з JSON


In [None]:
# Завантаження файлів з комп'ютера
from google.colab import files               # Імпортуємо модуль для завантаження файлів
uploaded = files.upload()                    # Відкриває вікно для завантаження локальних файлів



Saving example.txt to example.txt
Saving internet_store_sales.csv to internet_store_sales.csv
Saving internet_store_sales.json to internet_store_sales.json
Saving internet_store_sales.xlsx to internet_store_sales.xlsx


In [None]:
# 1. TXT файл (example.txt)
with open("example.txt", "r") as file:       # Відкриваємо текстовий файл у режимі читання
    txt_data = file.read()                   # Зчитуємо весь вміст файлу
print(txt_data)                              # Виводимо текст у консоль


{
        "order_id":205154,
        "customer_id":9771,
        "order_date":"2024-07-12",
        "shipping_date":"2024-07-16",
        "order_status":"Pending",
        "total_amount":133.15
    },
    {
        "order_id":857862,
        "customer_id":4478,
        "order_date":"2024-09-27",
        "shipping_date":"2024-10-02",
        "order_status":"Shipped",
        "total_amount":446.21
    },
    {
        "order_id":561738,
        "customer_id":2773,
        "order_date":"2024-12-08",
        "shipping_date":"2024-12-13",
        "order_status":"Pending",
        "total_amount":370.6
    }


In [None]:
# 2. JSON з TXT
import json                                  # Імпортуємо модуль для роботи з JSON

txt_data_list = "[" + txt_data.strip().rstrip(',') + "]"   # Додаємо дужки, щоб утворити коректний список
json_data = json.loads(txt_data_list)                      # Перетворюємо текст у Python об'єкт (список словників)
print(json_data)                                           # Виводимо результат


[{'order_id': 205154, 'customer_id': 9771, 'order_date': '2024-07-12', 'shipping_date': '2024-07-16', 'order_status': 'Pending', 'total_amount': 133.15}, {'order_id': 857862, 'customer_id': 4478, 'order_date': '2024-09-27', 'shipping_date': '2024-10-02', 'order_status': 'Shipped', 'total_amount': 446.21}, {'order_id': 561738, 'customer_id': 2773, 'order_date': '2024-12-08', 'shipping_date': '2024-12-13', 'order_status': 'Pending', 'total_amount': 370.6}]


In [None]:
# 3. CSV файл (internet_store_sales.csv)
import pandas as pd                         # Імпортуємо бібліотеку pandas

csv_df = pd.read_csv("internet_store_sales.csv")    # Зчитуємо CSV-файл у таблицю DataFrame
print(csv_df.head())                        # Виводимо перші 5 рядків таблиці


   order_id  customer_id  order_date shipping_date order_status  total_amount
0    205154         9771  2024-07-12    2024-07-16      Pending        133.15
1    857862         4478  2024-09-27    2024-10-02      Shipped        446.21
2    561738         2773  2024-12-08    2024-12-13      Pending        370.60
3    415920         7307  2024-06-20    2024-06-24      Shipped        456.88
4    720670         6123  2024-12-31    2025-01-05      Pending        476.70


In [None]:
# 4. XLSX файл (internet_store_sales.xlsx)
xlsx_df = pd.read_excel("internet_store_sales.xlsx")      # Зчитуємо Excel-файл у DataFrame
print(xlsx_df.head())                            # Виводимо перші рядки таблиці


   order_id  customer_id  order_date shipping_date order_status  total_amount
0    205154         9771  2024-07-12    2024-07-16      Pending        133.15
1    857862         4478  2024-09-27    2024-10-02      Shipped        446.21
2    561738         2773  2024-12-08    2024-12-13      Pending        370.60
3    415920         7307  2024-06-20    2024-06-24      Shipped        456.88
4    720670         6123  2024-12-31    2025-01-05      Pending        476.70


# Домашнє завдання - Завдання 2: Провести базові операції з файлами:
читання, писання, додавання, видалення

## 2.1. TXT-файл

In [None]:
# Читання
with open("example.txt", "r") as original_file:
    content = original_file.read()
print(" Вміст оригіналу:\n", content)

# Створимо копію оригінального файлу (щоб не втратити первинної інформації)
with open("example_copy.txt", "w") as copy_file:
    copy_file.write(content)
print(" Створено копію: example_copy.txt")

# Перевірка вмісту копії
with open("example_copy.txt", "r") as copy_file:
    print(" Вміст копії:\n", copy_file.read())

 Вміст оригіналу:
 {
        "order_id":205154,
        "customer_id":9771,
        "order_date":"2024-07-12",
        "shipping_date":"2024-07-16",
        "order_status":"Pending",
        "total_amount":133.15
    },
    {
        "order_id":857862,
        "customer_id":4478,
        "order_date":"2024-09-27",
        "shipping_date":"2024-10-02",
        "order_status":"Shipped",
        "total_amount":446.21
    },
    {
        "order_id":561738,
        "customer_id":2773,
        "order_date":"2024-12-08",
        "shipping_date":"2024-12-13",
        "order_status":"Pending",
        "total_amount":370.6
    }
 Створено копію: example_copy.txt
 Вміст копії:
 {
        "order_id":205154,
        "customer_id":9771,
        "order_date":"2024-07-12",
        "shipping_date":"2024-07-16",
        "order_status":"Pending",
        "total_amount":133.15
    },
    {
        "order_id":857862,
        "customer_id":4478,
        "order_date":"2024-09-27",
        "shipping_date":"2

In [None]:
#  Запис (перезаписуємо повністю)
with open("example_copy.txt", "w") as file:
    file.write("Це новий текстовий вміст.\n")
print("TXT файл перезаписано.")

with open("example_copy.txt", "r") as file:
    print("Новий вміст TXT:\n", file.read())


TXT файл перезаписано.
Новий вміст TXT:
 Це новий текстовий вміст.



In [None]:
# Додавання до кінця файлу:
with open("example_copy.txt", "a") as file:
    file.write("Це доданий рядок.\n")
print("Рядок додано до TXT.")

with open("example_copy.txt", "r") as file:
    print("Оновлений вміст TXT:\n", file.read())


Рядок додано до TXT.
Оновлений вміст TXT:
 Це новий текстовий вміст.
Це доданий рядок.



In [None]:
# Видалення (перезапис без певного рядка):
with open("example_copy.txt", "r") as file:
    lines = file.readlines()

# Видаляємо рядок, який містить слово "доданий"
with open("example_copy.txt", "w") as file:
    for line in lines:
        if "доданий" not in line:
            file.write(line)

print("Видалено рядок із TXT.")

with open("example_copy.txt", "r") as file:
    print("Вміст після видалення:\n", file.read())


Видалено рядок із TXT.
Вміст після видалення:
 Це новий текстовий вміст.



## 2.2. CSV файл – internet_store_sales.csv

In [None]:
import pandas as pd

# 1. Читання CSV-файлу
print("=== 1. Читання оригінального файлу ===")
df = pd.read_csv("internet_store_sales.csv")
print(df)
print("-" * 50)



=== 1. Читання оригінального файлу ===
      order_id  customer_id  order_date shipping_date order_status  \
0       205154         9771  2024-07-12    2024-07-16      Pending   
1       857862         4478  2024-09-27    2024-10-02      Shipped   
2       561738         2773  2024-12-08    2024-12-13      Pending   
3       415920         7307  2024-06-20    2024-06-24      Shipped   
4       720670         6123  2024-12-31    2025-01-05      Pending   
...        ...          ...         ...           ...          ...   
4995    198541         8387  2024-10-14           NaN    Cancelled   
4996    745614         6404  2024-08-19    2024-08-24      Pending   
4997    688045         3555  2024-08-24    2024-08-26      Pending   
4998    325529         6113  2024-11-18    2024-11-25      Pending   
4999    404645         1656  2024-09-16           NaN     Returned   

      total_amount  
0           133.15  
1           446.21  
2           370.60  
3           456.88  
4           476

In [None]:
# 2. Створення копії файлу
print("=== 2. Створення копії ===")
df.to_csv("internet_store_sales_copy.csv", index=False)
print(" Копію створено як 'internet_store_sales_copy.csv'")
print("-" * 50)


=== 2. Створення копії ===
 Копію створено як 'internet_store_sales_copy.csv'
--------------------------------------------------


In [None]:
# 3. Запис у копію (перезапис всієї копії з новими даними)
print("=== 3. Перезапис копії новими даними ===")
new_data = [
    {"Order ID": 1001, "Customer": "Olga", "Amount": 200.0},
    {"Order ID": 1002, "Customer": "Petro", "Amount": 250.0}
]
df_copy = pd.DataFrame(new_data)
df_copy.to_csv("internet_store_sales_copy.csv", index=False)
print(" Нові дані записано в копію:")
print(df_copy)
print("-" * 50)


=== 3. Перезапис копії новими даними ===
 Нові дані записано в копію:
   Order ID Customer  Amount
0      1001     Olga   200.0
1      1002    Petro   250.0
--------------------------------------------------


In [None]:
# 4. Додавання нового рядка до копії
print("=== 4. Додавання нового рядка ===")
new_row = {"Order ID": 1003, "Customer": "Ivan", "Amount": 300.0}
df_copy = pd.read_csv("internet_store_sales_copy.csv")
df_copy = pd.concat([df_copy, pd.DataFrame([new_row])], ignore_index=True)
df_copy.to_csv("internet_store_sales_copy.csv", index=False)
print(" Оновлений вміст копії після додавання:")
print(df_copy)
print("-" * 50)



=== 4. Додавання нового рядка ===
 Оновлений вміст копії після додавання:
   Order ID Customer  Amount
0      1001     Olga   200.0
1      1002    Petro   250.0
2      1003     Ivan   300.0
--------------------------------------------------


In [None]:
# 5. Видалення рядка з Order ID = 1001
print("=== 5. Видалення запису з Order ID = 1001 ===")
df_copy = pd.read_csv("internet_store_sales_copy.csv")
df_copy = df_copy[df_copy["Order ID"] != 1001]
df_copy.to_csv("internet_store_sales_copy.csv", index=False)
print(" Оновлений вміст копії після видалення:")
print(df_copy)
print("-" * 50)


=== 5. Видалення запису з Order ID = 1001 ===
 Оновлений вміст копії після видалення:
   Order ID Customer  Amount
1      1002    Petro   250.0
2      1003     Ivan   300.0
--------------------------------------------------


## 2.3. XLSX файл – internet_store_sales.xlsx

In [None]:
import pandas as pd

# 1. Читання XLSX-файлу
print("=== 1. Читання оригінального Excel-файлу ===")
df = pd.read_excel("internet_store_sales.xlsx")
print(df)
print("-" * 50)



=== 1. Читання оригінального Excel-файлу ===
      order_id  customer_id  order_date shipping_date order_status  \
0       205154         9771  2024-07-12    2024-07-16      Pending   
1       857862         4478  2024-09-27    2024-10-02      Shipped   
2       561738         2773  2024-12-08    2024-12-13      Pending   
3       415920         7307  2024-06-20    2024-06-24      Shipped   
4       720670         6123  2024-12-31    2025-01-05      Pending   
...        ...          ...         ...           ...          ...   
4995    198541         8387  2024-10-14           NaN    Cancelled   
4996    745614         6404  2024-08-19    2024-08-24      Pending   
4997    688045         3555  2024-08-24    2024-08-26      Pending   
4998    325529         6113  2024-11-18    2024-11-25      Pending   
4999    404645         1656  2024-09-16           NaN     Returned   

      total_amount  
0           133.15  
1           446.21  
2           370.60  
3           456.88  
4        

In [None]:
# 2. Створення копії файлу
print("=== 2. Створення копії ===")
df.to_excel("internet_store_sales_copy.xlsx", index=False)
print(" Копію створено як 'internet_store_sales_copy.xlsx'")
print("-" * 50)



=== 2. Створення копії ===
 Копію створено як 'internet_store_sales_copy.xlsx'
--------------------------------------------------


In [None]:
# 3. Перезапис копії новими даними
print("=== 3. Перезапис копії новими даними ===")
new_data = [
    {"Order ID": 1001, "Customer": "Olga", "Amount": 200.0},
    {"Order ID": 1002, "Customer": "Petro", "Amount": 250.0}
]
df_copy = pd.DataFrame(new_data)
df_copy.to_excel("internet_store_sales_copy.xlsx", index=False)
print(" Нові дані записано в копію:")
print(df_copy)
print("-" * 50)


=== 3. Перезапис копії новими даними ===
 Нові дані записано в копію:
   Order ID Customer  Amount
0      1001     Olga   200.0
1      1002    Petro   250.0
--------------------------------------------------


In [None]:
# 4. Додавання нового рядка до копії
print("=== 4. Додавання нового рядка ===")
new_row = {"Order ID": 1003, "Customer": "Ivan", "Amount": 300.0}
df_copy = pd.read_excel("internet_store_sales_copy.xlsx")
df_copy = pd.concat([df_copy, pd.DataFrame([new_row])], ignore_index=True)
df_copy.to_excel("internet_store_sales_copy.xlsx", index=False)
print(" Оновлений вміст копії після додавання:")
print(df_copy)
print("-" * 50)



=== 4. Додавання нового рядка ===
 Оновлений вміст копії після додавання:
   Order ID Customer  Amount
0      1001     Olga   200.0
1      1002    Petro   250.0
2      1003     Ivan   300.0
--------------------------------------------------


In [None]:
# 5. Видалення рядка з Order ID = 1001
print("=== 5. Видалення запису з Order ID = 1001 ===")
df_copy = pd.read_excel("internet_store_sales_copy.xlsx")
df_copy = df_copy[df_copy["Order ID"] != 1001]
df_copy.to_excel("internet_store_sales_copy.xlsx", index=False)
print(" Оновлений вміст копії після видалення:")
print(df_copy)
print("-" * 50)


=== 5. Видалення запису з Order ID = 1001 ===
 Оновлений вміст копії після видалення:
   Order ID Customer  Amount
1      1002    Petro     250
2      1003     Ivan     300
--------------------------------------------------


## 2.4. JSON-файл

In [None]:
import json

# 1. Відкриваємо оригінальний JSON-файл у режимі читання
with open("internet_store_sales.json", "r") as file:
    data = json.load(file)  # Завантажуємо JSON-дані у змінну `data`

# Виводимо перші 2 записи для перевірки
print("=== 1. Читання JSON-файлу ===")
print(data[:2])
print("-" * 50)



=== 1. Читання JSON-файлу ===
[{'order_id': 205154, 'customer_id': 9771, 'order_date': '2024-07-12', 'shipping_date': '2024-07-16', 'order_status': 'Pending', 'total_amount': 133.15}, {'order_id': 857862, 'customer_id': 4478, 'order_date': '2024-09-27', 'shipping_date': '2024-10-02', 'order_status': 'Shipped', 'total_amount': 446.21}]
--------------------------------------------------


In [None]:
# 2. Записуємо вміст у новий файл-копію
with open("internet_store_sales_copy.json", "w") as file:
    json.dump(data, file, indent=4)  # indent=4 — для гарного форматування

print("=== 2. Копія створена ===")
print("Файл 'internet_store_sales_copy.json' створено.")
print("-" * 50)


=== 2. Копія створена ===
Файл 'internet_store_sales_copy.json' створено.
--------------------------------------------------


In [None]:
# 3. Створюємо нові тестові дані (оновлений вміст)
new_data = [
    {
        "order_id": 999001,
        "customer_id": 1,
        "order_date": "2025-01-01",
        "shipping_date": "2025-01-05",
        "order_status": "Pending",
        "total_amount": 123.45
    }
]

# Записуємо нові дані у копію
with open("internet_store_sales_copy.json", "w") as file:
    json.dump(new_data, file, indent=4)

print("=== 3. Копія перезаписана новими даними ===")
print(new_data)
print("-" * 50)


=== 3. Копія перезаписана новими даними ===
[{'order_id': 999001, 'customer_id': 1, 'order_date': '2025-01-01', 'shipping_date': '2025-01-05', 'order_status': 'Pending', 'total_amount': 123.45}]
--------------------------------------------------


In [None]:
# 4. Зчитуємо існуючі дані з копії
with open("internet_store_sales_copy.json", "r") as file:
    data = json.load(file)

# Додаємо новий запис
new_record = {
    "order_id": 999002,
    "customer_id": 2,
    "order_date": "2025-01-02",
    "shipping_date": "2025-01-06",
    "order_status": "Shipped",
    "total_amount": 456.78
}
data.append(new_record)

# Записуємо назад у файл
with open("internet_store_sales_copy.json", "w") as file:
    json.dump(data, file, indent=4)

print("=== 4. Додано новий запис до копії ===")
print(data)
print("-" * 50)


=== 4. Додано новий запис до копії ===
[{'order_id': 999001, 'customer_id': 1, 'order_date': '2025-01-01', 'shipping_date': '2025-01-05', 'order_status': 'Pending', 'total_amount': 123.45}, {'order_id': 999002, 'customer_id': 2, 'order_date': '2025-01-02', 'shipping_date': '2025-01-06', 'order_status': 'Shipped', 'total_amount': 456.78}]
--------------------------------------------------


In [None]:
# 5. Зчитуємо поточні дані
with open("internet_store_sales_copy.json", "r") as file:
    data = json.load(file)

# Видаляємо запис, де order_id дорівнює 999001
data = [entry for entry in data if entry["order_id"] != 999001]

# Записуємо результат у файл
with open("internet_store_sales_copy.json", "w") as file:
    json.dump(data, file, indent=4)

print("=== 5. Видалено запис з order_id = 999001 ===")
print(data)
print("-" * 50)


=== 5. Видалено запис з order_id = 999001 ===
[{'order_id': 999002, 'customer_id': 2, 'order_date': '2025-01-02', 'shipping_date': '2025-01-06', 'order_status': 'Shipped', 'total_amount': 456.78}]
--------------------------------------------------


# Підсумковий блок завершення роботи з файлами

In [None]:
# Закриваємо середовище і очищаємо завантажені файли - щоб якщо написав код і десь натупив, коли перевіряв - очистити все і повторити заново

import os

# Список файлів, які ми створювали/змінювали
files_to_remove = [
    "example.txt",
    "internet_store_sales.csv",
    "internet_store_sales.xlsx",
    "internet_store_sales.json"
]

# Видалення файлів, якщо вони існують
for filename in files_to_remove:
    if os.path.exists(filename):
        os.remove(filename)
        print(f" Файл {filename} видалено.")
    else:
        print(f" Файл {filename} не знайдено.")

# Повідомлення про завершення
print("\n Усі файли очищено. Домашнє завдання завершено!")


 Файл example.txt видалено.
 Файл internet_store_sales.csv видалено.
 Файл internet_store_sales.xlsx видалено.
 Файл internet_store_sales.json видалено.

 Усі файли очищено. Домашнє завдання завершено!
