### CSV

CSV (comma-separated value) - это формат представления табличных данных (например, это могут быть данные из таблицы или данные из БД).


Пример файла в формате CSV (sw_data.csv):

**csv.reader**

Пример чтения файла в формате CSV (файл csv_read.py):


In [2]:
import csv

with open('sw_data.csv') as f:
    reader = csv.reader(f)
    for row in reader:
        print(row)

['hostname', 'vendor', 'model', 'location']
['sw1', 'Cisco', '3750', 'London']
['sw2', 'Cisco', '3850', 'Liverpool']
['sw3', 'Cisco', '3650', 'Liverpool']
['sw4', 'Cisco', '3650', 'London']


In [3]:
with open('sw_data.csv') as f:
    reader = csv.reader(f)
    print(reader)

<_csv.reader object at 0x0000014FB9EA2DC0>


In [4]:
with open('sw_data.csv') as f:
     reader = csv.reader(f)
     print(list(reader))

[['hostname', 'vendor', 'model', 'location'], ['sw1', 'Cisco', '3750', 'London'], ['sw2', 'Cisco', '3850', 'Liverpool'], ['sw3', 'Cisco', '3650', 'Liverpool'], ['sw4', 'Cisco', '3650', 'London']]


**csv.DictReader**

Он создает объект, который отображает прочитанную информацию в словарь, ключи которого задаются параметром fieldnames. Этот параметр является необязательным, но если он не указан в файле, данные первой строки становятся ключами словаря.

In [5]:
with open('sw_data.csv') as f:
    reader = csv.DictReader(f)
    for row in reader:
        print(row)
        print(row['hostname'], row['model'])

{'hostname': 'sw1', 'vendor': 'Cisco', 'model': '3750', 'location': 'London'}
sw1 3750
{'hostname': 'sw2', 'vendor': 'Cisco', 'model': '3850', 'location': 'Liverpool'}
sw2 3850
{'hostname': 'sw3', 'vendor': 'Cisco', 'model': '3650', 'location': 'Liverpool'}
sw3 3650
{'hostname': 'sw4', 'vendor': 'Cisco', 'model': '3650', 'location': 'London'}
sw4 3650


**csv.DictWriter**

Этот класс аналогичен классу DictWriter и выполняет противоположную функцию: запись данных в файл CSV. Класс определяется 

In [2]:
data = [{'Grade': 'B', 'first_name': 'Alex', 'last_name': 'Brian'}, 
{'Grade': 'A', 'first_name': 'Rachael', 'last_name': 'Rodriguez'},
{'Grade': 'C', 'first_name': 'Tom', 'last_name': 'smith'},
{'Grade': 'B', 'first_name': 'Jane', 'last_name': 'Oscar'}, 
{'Grade': 'A', 'first_name': 'Kennzy', 'last_name': 'Tim'}]

In [12]:
import csv
with open('example.csv', 'w') as csvfile:
    fieldnames = ['first_name', 'last_name', 'Grade']
    writer = csv.DictWriter(csvfile, fieldnames=fieldnames)
 
    writer.writeheader()
    writer.writerow({'Grade': 'B', 'first_name': 'Alex', 'last_name': 'Brian'})
    writer.writerow({'Grade': 'A', 'first_name': 'Rachael','last_name': 'Rodriguez'})
    writer.writerow({'Grade': 'B', 'first_name': 'Jane', 'last_name': 'Oscar'})
    writer.writerow({'Grade': 'B', 'first_name': 'Jane', 'last_name': 'Loive'})
 
print("Writing complete")

Writing complete


In [14]:
import csv
 
with open('example.csv', 'w') as csvfile:
    fieldnames = ['first_name', 'last_name', 'Grade']
    writer = csv.DictWriter(csvfile, fieldnames=fieldnames)
 
    writer.writeheader()
    writer.writerows([{'Grade': 'B', 'first_name': 'Alex', 'last_name': 'Brian'},
                      {'Grade': 'A', 'first_name': 'Rachael','last_name': 'Rodriguez'},
                      {'Grade': 'C', 'first_name': 'Tom', 'last_name': 'smith'},
                      {'Grade': 'B', 'first_name': 'Jane', 'last_name': 'Oscar'},
                      {'Grade': 'A', 'first_name': 'Kennzy', 'last_name': 'Tim'}])
 
print("writing complete")

writing complete


### XML

**Введение в XML**

XML — это язык разметки для описания иерархии структурированных данных. XML документ содержит один или более элементов разделённых открывающими и закрывающими тегами.

XML документ:

Элементы могут быть неограниченно вложены друг в друга. Так как элемент bar вложен в элемент foo, то его называют подэлементом или дочерним элементом элемента foo.

Пример представленный ниже не является XML документом, так как он имеет два корневых элемента:

Элементы могут иметь атрибуты состоящие из пары имя-значение.

Элементы могут иметь текст (текстовое содержание).

Элементы которые не содержат текста и дочерних элементов называются пустыми.

Существует сокращённая запись пустого элемента. Поместив знак дроби / в конце открывающего тега, вы можете пропустить закрывающий тег. XML документ предыдущего примера с пустым элементов может быть записан следующим образом:

Для объявления пространства имён по умолчанию используется директива xmlns. Объявление пространства имён очень похоже на атрибут, но имеет специальное значение.

XML документы могут содержать информацию о кодировке символов в первой строке до корневого элемента. 

**Синтаксический разбор XML**

In [26]:
>>> import xml.etree.ElementTree as etree   
>>> tree = etree.parse('feed.xml')  
>>> root = tree.getroot()                    
>>> root    

<Element '{http://www.w3.org/2005/Atom}feed' at 0x000002A060170220>

**Элементы XML есть списки Python**

В API ElementTree элементы представляются встроенным типом Python - списком. Каждый из элементов списка представляет собой дочерние XML элементы.

In [27]:
root.tag         

'{http://www.w3.org/2005/Atom}feed'

In [28]:
len(root)

9

In [29]:
for child in root: 
    print(root)

<Element '{http://www.w3.org/2005/Atom}feed' at 0x000002A060170220>
<Element '{http://www.w3.org/2005/Atom}feed' at 0x000002A060170220>
<Element '{http://www.w3.org/2005/Atom}feed' at 0x000002A060170220>
<Element '{http://www.w3.org/2005/Atom}feed' at 0x000002A060170220>
<Element '{http://www.w3.org/2005/Atom}feed' at 0x000002A060170220>
<Element '{http://www.w3.org/2005/Atom}feed' at 0x000002A060170220>
<Element '{http://www.w3.org/2005/Atom}feed' at 0x000002A060170220>
<Element '{http://www.w3.org/2005/Atom}feed' at 0x000002A060170220>
<Element '{http://www.w3.org/2005/Atom}feed' at 0x000002A060170220>


**Атрибуты XML есть словари Python**

Документ XML это не только набор элементов; каждый элемент так же имеет набор атрибутов. Имея конкретный XML элемент, Вы можете легко получить его атрибуты как словарь Python.

In [30]:
root.attrib     

{'{http://www.w3.org/XML/1998/namespace}lang': 'en'}

In [31]:
root[4]       

<Element '{http://www.w3.org/2005/Atom}link' at 0x000002A0601776D0>

In [32]:
root[4].attrib           

{'rel': 'alternate', 'type': 'text/html', 'href': 'http://diveintomark.org/'}

In [33]:
root[3] 

<Element '{http://www.w3.org/2005/Atom}updated' at 0x000002A0601779F0>

In [34]:
root[3].attrib 

{}

**Поиск узлов в XML документе**

In [35]:
root.findall('{http://www.w3.org/2005/Atom}entry') 

[<Element '{http://www.w3.org/2005/Atom}entry' at 0x000002A060177360>,
 <Element '{http://www.w3.org/2005/Atom}entry' at 0x000002A06013E540>,
 <Element '{http://www.w3.org/2005/Atom}entry' at 0x000002A06013E220>]

In [36]:
root.tag

'{http://www.w3.org/2005/Atom}feed'

In [37]:
root.findall('{http://www.w3.org/2005/Atom}feed')

[]

In [38]:
root.findall('{http://www.w3.org/2005/Atom}author')

[]

In [39]:
tree.findall('{http://www.w3.org/2005/Atom}entry') 

[<Element '{http://www.w3.org/2005/Atom}entry' at 0x000002A060177360>,
 <Element '{http://www.w3.org/2005/Atom}entry' at 0x000002A06013E540>,
 <Element '{http://www.w3.org/2005/Atom}entry' at 0x000002A06013E220>]

In [40]:
tree.findall('{http://www.w3.org/2005/Atom}author')

[]

In [41]:
entries = tree.findall('{http://www.w3.org/2005/Atom}entry')  
len(entries)

3

In [42]:
title_element = entries[0].find('{http://www.w3.org/2005/Atom}title')
title_element.text

'Dive into history, 2009 edition'

In [43]:
foo_element = entries[0].find('{http://www.w3.org/2005/Atom}foo')
foo_element
type(foo_element)

NoneType

In [46]:
all_links = tree.findall('.//{http://www.w3.org/2005/Atom}link') 
all_links

[<Element '{http://www.w3.org/2005/Atom}link' at 0x000002A0601776D0>,
 <Element '{http://www.w3.org/2005/Atom}link' at 0x000002A060177090>,
 <Element '{http://www.w3.org/2005/Atom}link' at 0x000002A060177680>,
 <Element '{http://www.w3.org/2005/Atom}link' at 0x000002A06013EDB0>,
 <Element '{http://www.w3.org/2005/Atom}link' at 0x000002A060185040>]

In [47]:
all_links[0].attrib

{'rel': 'alternate', 'type': 'text/html', 'href': 'http://diveintomark.org/'}

**Создание XML**

In [22]:
new_feed = etree.Element('{http://www.w3.org/2005/Atom}feed',     
    attrib={'{http://www.w3.org/XML/1998/namespace}lang': 'en'})  
print(etree.tostring(new_feed))                                   

b'<ns0:feed xmlns:ns0="http://www.w3.org/2005/Atom" xml:lang="en" />'


### XML

**xml.etree.ElementTree** — реализация API для работы с XML файлами на чистом Python

**Element**

Функция Element () используется для создания элементов XML

In [1]:
import xml.etree.ElementTree as xml
p = xml.Element('parent')

**SubElement**

Функция SubElement (), используемая для создания вложенных элементов в элементе give

In [2]:
c = xml.SubElement(p, 'child1')

**dump**

Используется для вывода элементов xml.

In [3]:
xml.dump(p)

<parent><child1 /></parent>


**write**

Используется для сохранения файла.

In [4]:
tree = xml.ElementTree(p)
tree.write("sample.xml")

**Comment**

Функция Comment() используется для вставки комментариев в XML-файл.

In [6]:
comment = xml.Comment('user comment')
p.append(comment) #этот комментарий будет добавлен к родительскому элементу

xml.dump(p)

<parent><child1 /><!--user comment--><!--user comment--></parent>


In [38]:
tree = xml.parse('sample.xml')
root=tree.getroot()
element = root[0] #получите первого ребенка родительского корня
print(element)

<Element 'child1' at 0x000001AC7FCFE3B0>


In [39]:
element.set('attribute_name', 'attribute_value') #установите артрибут xml элементу
element.text="string_text"

In [40]:
root.remove(element)

In [41]:
tree.write('sample.xml')

**Пример создания XML**

In [7]:
import xml.etree.ElementTree as xml
 
def createXML(filename):
    """
    Создаем XML файл.
    """
    root = xml.Element("zAppointments")
    appt = xml.Element("appointment")
    root.append(appt)
    
    # создаем дочерний суб-элемент. 
    begin = xml.SubElement(appt, "begin")
    begin.text = "1181251680"
    
    uid = xml.SubElement(appt, "uid")
    uid.text = "040000008200E000"
    
    alarmTime = xml.SubElement(appt, "alarmTime")
    alarmTime.text = "1181572063"
    
    state = xml.SubElement(appt, "state")
    
    location = xml.SubElement(appt, "location")
    
    duration = xml.SubElement(appt, "duration")
    duration.text = "1800"
    
    subject = xml.SubElement(appt, "subject")
    
    tree = xml.ElementTree(root)
    with open(filename, "w") as fh:
        tree.write(open('appt.xml', 'w'), encoding='unicode')
 
createXML("appt.xml")

**Пример парсинга XML**

In [65]:
# -*- coding: utf-8 -*-
import xml.etree.cElementTree as ET

def parseXML(xml_file):
    """
    Парсинг XML используя ElementTree
    """
    tree = ET.ElementTree(file=xml_file)
    print(tree.getroot())
    root = tree.getroot()
    print("tag=%s, attrib=%s" % (root.tag, root.attrib))
    
    for child in root:
        print(child.tag, child.attrib)
        if child.tag == "appointment":
            for step_child in child:
                print(step_child.tag)

    # Парсинг всей XML структуры.
    print("-" * 40)
    print("Iterating using a tree iterator")
    print("-" * 40)
    iter_ = tree.iter()
    
    for elem in iter_:
        print(elem.tag)

    # получаем данные используя дочерние элементы.
    print("-" * 40)
    print("Обрабатываем дочерние элменты getchildren()")
    print("-" * 40)
    appointments = list(root)
    
    for appointment in appointments:
        appt_children = list(appointment)
        for appt_child in appt_children:
            print("%s=%s" % (appt_child.tag, appt_child.text))

if __name__ == "__main__":
    parseXML("appt.xml")

<Element 'zAppointments' at 0x000001AC7FD01EA0>
tag=zAppointments, attrib={}
appointment {}
begin
uid
alarmTime
state
location
duration
subject
----------------------------------------
Iterating using a tree iterator
----------------------------------------
zAppointments
appointment
begin
uid
alarmTime
state
location
duration
subject
----------------------------------------
Обрабатываем дочерние элменты getchildren()
----------------------------------------
begin=1181251680
uid=040000008200E000
alarmTime=1181572063
state=None
location=None
duration=1800
subject=None


In [1]:
Залание:

SyntaxError: invalid syntax (<ipython-input-1-17b8da04349d>, line 1)