# Работа с csv файлами

CSV - формат текстовых данных для представления таблиц. Строка таблицы - это строка текста, разделенная запятой.

### Ручная работа с файлами

In [12]:
file = open('football.csv')
print(file.readline()) # что-то сделали с файлом
print(file.closed, 'потому что еще идёт работа с файлом')
file.close()
file.closed

Number,Name,Club,Country

False потому что еще идёт работа с файлом


True

In [13]:
with open('football.csv') as file:
    data = file.read() # считываем всё

In [14]:
print(data)# текстовые данные

Number,Name,Club,Country
10,Leo Messi,"Barselona,PSG",Argentina
7,Cr Ronaldo,Real Madrid,Portugal
1,Manuel Neuer,Bayern,Germany
4,S Ramos,Real Mardid,Spain



In [17]:
for line in data.splitlines():
    print(line.split(','))  # в виде списка

['Number', 'Name', 'Club', 'Country']
['10', 'Leo Messi', '"Barselona', 'PSG"', 'Argentina']
['7', 'Cr Ronaldo', 'Real Madrid', 'Portugal']
['1', 'Manuel Neuer', 'Bayern', 'Germany']
['4', 'S Ramos', 'Real Mardid', 'Spain']


In [18]:
# для более удобного доступа можно сделать список списков

with open('football.csv') as file:
    data = file.read()
    table = [s.split(',') for s in data.splitlines()]

In [19]:
table

[['Number', 'Name', 'Club', 'Country'],
 ['10', 'Leo Messi', '"Barselona', 'PSG"', 'Argentina'],
 ['7', 'Cr Ronaldo', 'Real Madrid', 'Portugal'],
 ['1', 'Manuel Neuer', 'Bayern', 'Germany'],
 ['4', 'S Ramos', 'Real Mardid', 'Spain']]

In [23]:
table[4][1]

'S Ramos'

In [24]:
# сортировка по номеру

with open('football.csv') as file:
    data = file.read()
    table = [s.split(',') for s in data.splitlines()]
    del table[0] # удаление заголовка
    print(*table, sep='\n')
    print()
    table.sort(key=lambda x: int(x[0]))
    print(*table, sep='\n')

['10', 'Leo Messi', '"Barselona', 'PSG"', 'Argentina']
['7', 'Cr Ronaldo', 'Real Madrid', 'Portugal']
['1', 'Manuel Neuer', 'Bayern', 'Germany']
['4', 'S Ramos', 'Real Mardid', 'Spain']

['1', 'Manuel Neuer', 'Bayern', 'Germany']
['4', 'S Ramos', 'Real Mardid', 'Spain']
['7', 'Cr Ronaldo', 'Real Madrid', 'Portugal']
['10', 'Leo Messi', '"Barselona', 'PSG"', 'Argentina']


**Вручную лучше не обрабатывать, так как могут встретиться данные с ','**

В этом случае если запись содержит запятые, то нужно заключить их в кавычки или вместо запятых для разделения использовать знаки табуляции (tsv)

In [25]:
import csv

В данном модуле используются два основых объекта **reader** и **writer** 

## Чтение данных csv

In [26]:
with open('football.csv') as file:
    
    rows = csv.reader(file, delimiter=',', quotechar='"') # rows - это построчный итератор
    # всё еще присутсвуют заголовки 
    
    for row in rows:
        print(row)  # списки 

['Number', 'Name', 'Club', 'Country']
['10', 'Leo Messi', 'Barselona,PSG', 'Argentina']
['7', 'Cr Ronaldo', 'Real Madrid', 'Portugal']
['1', 'Manuel Neuer', 'Bayern', 'Germany']
['4', 'S Ramos', 'Real Mardid', 'Spain']


In [27]:
rows

<_csv.reader at 0x1cedf80ce80>

Параметры **delimiter**=',' и **quotechar**=' " ' отвечают за символы для разделения и кавычек для специальных символах

### Чтение данных с помощью DictReader

csv.reader() возвращает из файла списки, где первая строка - заголовок, который обычно удаляется. С помощью **DictReader** можно создать словарь на основе названий столбцов.

In [28]:
with open('football.csv') as file:
    rows = csv.DictReader(file)
    for row in rows:
        print(row) # словари

{'Number': '10', 'Name': 'Leo Messi', 'Club': 'Barselona,PSG', 'Country': 'Argentina'}
{'Number': '7', 'Name': 'Cr Ronaldo', 'Club': 'Real Madrid', 'Country': 'Portugal'}
{'Number': '1', 'Name': 'Manuel Neuer', 'Club': 'Bayern', 'Country': 'Germany'}
{'Number': '4', 'Name': 'S Ramos', 'Club': 'Real Mardid', 'Country': 'Spain'}


In [29]:
rows

<csv.DictReader at 0x1cedf471820>

In [30]:
rows.fieldnames  # ключи словаря

['Number', 'Name', 'Club', 'Country']

In [31]:
with open('football.csv') as file:
    rows = csv.DictReader(file) # в любой reader помещаем файл, а не текст!
    array = list(rows)
array

[{'Number': '10',
  'Name': 'Leo Messi',
  'Club': 'Barselona,PSG',
  'Country': 'Argentina'},
 {'Number': '7',
  'Name': 'Cr Ronaldo',
  'Club': 'Real Madrid',
  'Country': 'Portugal'},
 {'Number': '1',
  'Name': 'Manuel Neuer',
  'Club': 'Bayern',
  'Country': 'Germany'},
 {'Number': '4', 'Name': 'S Ramos', 'Club': 'Real Mardid', 'Country': 'Spain'}]

## Запись данных 

Для записи используем объект csv.writer

In [38]:
colums = ['Name','Age','High']
data = [('Vanya', 20, 183), ('Sasha',14,170), ('Slavik',19,182)]

with open('new_file_friends.csv', mode='w', encoding='utf-8', newline='') as new_file:
    
    writer = csv.writer(new_file, delimiter=';',quoting=csv.QUOTE_NONNUMERIC)
    
    writer.writerow(colums) # запись заголовка
    
    for friend in data:
        writer.writerow(friend)   # запись каждой строки

In [39]:
with open('new_file_friends.csv') as file:
    print(file.read())

"Name";"Age";"High"
"Vanya";20;183
"Sasha";14;170
"Slavik";19;182



Значение аргумента **quoting**=csv.QUOTE_NONNUMERIC означает, что в кавычки будут браться все нечисловые значения. По умолчанию символом кавычки является ", если нужно поменять символ, то используйте уже знакомый нам именованный аргумент quotechar.

Помимо метода **writerow()** можно использовать и метод **writerows()**, чтобы записать сразу несколько строк. Единственным аргументом этого метода может быть коллекция коллекций. То есть, каждый элемент списка rows в нашем случае должен быть коллекцией.

In [40]:
with open('new_file_friends.csv','w') as new_file:
    writer = csv.writer(new_file, delimiter=';')
    writer.writerow(colums)
    writer.writerows(data)

### Запись данных с помощью DictWriter

In [None]:
# коллекция из словарей
data = [{'first_name': 'Тимур', 'second_name': 'Гуев', 'class_number': 11, 'class_letter': 'А'},
        {'first_name': 'Руслан', 'second_name': 'Чаниев', 'class_number': 9, 'class_letter': 'Б'},
        {'first_name': 'Роман', 'second_name': 'Белых', 'class_number': 10, 'class_letter': 'В'}]

columns = ['first_name', 'second_name', 'class_number', 'class_letter']

In [None]:
with open('students.csv', 'w', encoding='utf-8', newline='') as file:
    writer = csv.DictWriter(file, fieldnames=columns, delimiter=';', quoting=csv.QUOTE_NONNUMERIC)
    writer.writeheader()                 # запись заголовков
    for row in data:                     # запись строк
        writer.writerow(row)