**Описание проекта**
1. Необходимо получить данные с сайта https://fakestoreapi.com/ с помощью Python, сформировать csv файл с описанием 10 любых продуктов. (преобразование из формата json в csv должно происходить внутри кода).
2. С помощью Python открыть csv файл из задания 1 и разделить товары на категории в зависимости от цены: cheap - нижние 30% при сортировке по стоимости; middle - 40-70% при сортировке по стоимости; expensive - верхние 30% при сортировке по стоимости. Разделить полученные данные на 3 отдельных файла excel в соответствии с полученной категорией. 

In [32]:
# Импорт необходимых библиотек
import requests
import pandas as pd

**1. Выгрузим данные с сайта https://fakestoreapi.com/ с помощью Python, сформируем csv файл с описанием 10 любых продуктов**

In [33]:
# Получение данных с сайта
response = requests.get('https://fakestoreapi.com/products')
data = response.json()

# Преобразование данных в DataFrame
df = pd.DataFrame(data)

# Вывод общей информации о датафрейме для проверки корректности данных
df.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 20 entries, 0 to 19
Data columns (total 7 columns):
 #   Column       Non-Null Count  Dtype  
---  ------       --------------  -----  
 0   id           20 non-null     int64  
 1   title        20 non-null     object 
 2   price        20 non-null     float64
 3   description  20 non-null     object 
 4   category     20 non-null     object 
 5   image        20 non-null     object 
 6   rating       20 non-null     object 
dtypes: float64(1), int64(1), object(5)
memory usage: 1.2+ KB


***Вывод:*** Тип данных соответствует содержимому, пропущенных данных не обнаружено. Можно продолжить анализ данных.

In [34]:
# Выбор 10 случайных продуктов
df_sample = df.sample(n=10, random_state=1)

# Запись DataFrame в CSV файл
output_path = r'products.csv'
df_sample.to_csv(output_path, index=False)

print(f"Данные сохранены в файл {output_path}.")

Данные сохранены в файл products.csv.


In [35]:
# Чтение CSV файла и отображение его содержимого
df_read = pd.read_csv(output_path)
print("Содержимое файла:")
print(df_read)

Содержимое файла:
   id                                              title   price  \
0   4                               Mens Casual Slim Fit   15.99   
1  17  Rain Jacket Women Windbreaker Striped Climbing...   39.99   
2   7                         White Gold Plated Princess    9.99   
3  11  Silicon Power 256GB SSD 3D NAND A55 SLC Cache ...  109.00   
4   3                                 Mens Cotton Jacket   55.99   
5  15  BIYLACLESEN Women's 3-in-1 Snowboard Jacket Wi...   56.99   
6   5  John Hardy Women's Legends Naga Gold & Silver ...  695.00   
7  18        MBJ Women's Solid Short Sleeve Boat Neck V     9.85   
8   8  Pierced Owl Rose Gold Plated Stainless Steel D...   10.99   
9   2             Mens Casual Premium Slim Fit T-Shirts    22.30   

                                         description          category  \
0  The color could be slightly different between ...    men's clothing   
1  Lightweight perfet for trip or casual wear---L...  women's clothing   
2  Classic 

**Вывод:** Были получены данные с сайта и выполнена их проверка. Данные были отсортированы в соответствии с заданием и сохранены в файл под названием 'products.csv' в формате CSV.

**2. С помощью Python откроем csv файл 'products.csv' и разделим товары на категории в зависимости от цены**

In [36]:
# Чтение данных из CSV файла
df = pd.read_csv(output_path)

# Сортировка данных по цене
df_sorted = df.sort_values(by='price')

# Определение границ для категорий
n = len(df_sorted)
cheap_boundary = int(n * 0.3)
middle_boundary_start = int(n * 0.3)
middle_boundary_end = int(n * 0.7)

# Разделение данных на категории
cheap = df_sorted.iloc[:cheap_boundary]
middle = df_sorted.iloc[middle_boundary_start:middle_boundary_end]
expensive = df_sorted.iloc[middle_boundary_end:]

# Запись данных в отдельные файлы Excel
cheap.to_excel('cheap_products.xlsx', index=False)
middle.to_excel('middle_products.xlsx', index=False)
expensive.to_excel('expensive_products.xlsx', index=False)

print("Данные разделены на категории и сохранены в файлы Excel.")

Данные разделены на категории и сохранены в файлы Excel.


In [37]:
# Чтение и вывод содержимого файлов Excel на экран
cheap_read = pd.read_excel('cheap_products.xlsx')

print("\nCheap Products:")
print(cheap_read)


Cheap Products:
   id                                              title  price  \
0  18        MBJ Women's Solid Short Sleeve Boat Neck V    9.85   
1   7                         White Gold Plated Princess   9.99   
2   8  Pierced Owl Rose Gold Plated Stainless Steel D...  10.99   

                                         description          category  \
0  95% RAYON 5% SPANDEX, Made in USA or Imported,...  women's clothing   
1  Classic Created Wedding Engagement Solitaire D...          jewelery   
2  Rose Gold Plated Double Flared Tunnel Plug Ear...          jewelery   

                                               image  \
0  https://fakestoreapi.com/img/71z3kpMAYsL._AC_U...   
1  https://fakestoreapi.com/img/71YAIFU48IL._AC_U...   
2  https://fakestoreapi.com/img/51UDEzMJVpL._AC_U...   

                        rating  
0  {'rate': 4.7, 'count': 130}  
1    {'rate': 3, 'count': 400}  
2  {'rate': 1.9, 'count': 100}  


In [38]:
middle_read = pd.read_excel('middle_products.xlsx')

print("Содержимое файла 'middle_products.xlsx':")
print(middle_read)

Содержимое файла 'middle_products.xlsx':
   id                                              title  price  \
0   4                               Mens Casual Slim Fit  15.99   
1   2             Mens Casual Premium Slim Fit T-Shirts   22.30   
2  17  Rain Jacket Women Windbreaker Striped Climbing...  39.99   
3   3                                 Mens Cotton Jacket  55.99   

                                         description          category  \
0  The color could be slightly different between ...    men's clothing   
1  Slim-fitting style, contrast raglan long sleev...    men's clothing   
2  Lightweight perfet for trip or casual wear---L...  women's clothing   
3  great outerwear jackets for Spring/Autumn/Wint...    men's clothing   

                                               image  \
0  https://fakestoreapi.com/img/71YXzeOuslL._AC_U...   
1  https://fakestoreapi.com/img/71-3HjGNDUL._AC_S...   
2  https://fakestoreapi.com/img/71HblAHs5xL._AC_U...   
3  https://fakestoreapi.com/

In [39]:
expensive_read = pd.read_excel('expensive_products.xlsx')

print("Содержимое файла 'expensive_products.xlsx':")
print(expensive_read)

Содержимое файла 'expensive_products.xlsx':
   id                                              title   price  \
0  15  BIYLACLESEN Women's 3-in-1 Snowboard Jacket Wi...   56.99   
1  11  Silicon Power 256GB SSD 3D NAND A55 SLC Cache ...  109.00   
2   5  John Hardy Women's Legends Naga Gold & Silver ...  695.00   

                                         description          category  \
0  Note:The Jackets is US standard size, Please c...  women's clothing   
1  3D NAND flash are applied to deliver high tran...       electronics   
2  From our Legends Collection, the Naga was insp...          jewelery   

                                               image  \
0  https://fakestoreapi.com/img/51Y5NI-I5jL._AC_U...   
1  https://fakestoreapi.com/img/71kWymZ+c+L._AC_S...   
2  https://fakestoreapi.com/img/71pWzhdJNwL._AC_U...   

                        rating  
0  {'rate': 2.6, 'count': 235}  
1  {'rate': 4.8, 'count': 319}  
2  {'rate': 4.6, 'count': 400}  


**Вывод:** Все товары разделили на категории в зависимости от цены и сохранили каждую категорию в отдельный Excel-файл.