## XML 문서 생성하기
- 엘리먼트(Element)를 이용해 태그 만들고 태그에 텍스트 값 추가하기
- 서브엘리먼트(SubElement)를 이용하면 좀더 편리하게 태그 추가 가능

In [1]:
# 1) Element 이용 - note 및 tag 생성 가능.
from xml.etree.ElementTree import Element, dump

In [6]:
#note생성, to에 'Tove' 추가
note = Element('note')
to = Element('to')
to.text = 'Tove' #tag에 text 추가 

note.append(to)
dump(note) #note 출력 명령어 

<note><to>Tove</to></note>


In [5]:
# 2)SubElement 이용 - tag에 text 추가 시 편리함.
from xml.etree.ElementTree import Element, SubElement, dump

In [7]:
#to에 'Tove'와 from 'Jani'도 추가
note = Element('note')
to = Element('to')
to.text = 'Tove'
note.append(to)

SubElement(note, 'from').text = 'Jani' #SubElement(note, tag).text = '추가할 텍스트'

dump(note)

<note><to>Tove</to><from>Jani</from></note>


In [33]:
#태그 사이에 태그 추가 - note.insert(인덱스, tag)
note = Element('note')
dummy = Element('dummy')
note.insert(1, dummy)
dump(note)

<note><dummy /></note>


In [32]:
#또는- note.append(tag)
note = Element('note')
dummy = Element('dummy')
note.append(dummy)
dump(note)

<note><dummy /></note>


In [34]:
#특정 태그 삭제- note.remove(tag)
note.remove(dummy)
dump(note)

<note />


In [35]:
#note 태그에 애트리뷰트(attribute) 추가하기 - note.attrib[애트리뷰트명] = '텍스트'
from xml.etree.ElementTree import Element, SubElement, dump

note = Element('note')
to = Element('to')
to.text = 'Tove'

note.append(to)
SubElement(note, 'from').text = 'Jani'
note.attrib['date'] = '20210209' #애트리뷰트 추가 
note.attrib['author'] = 'suyeon' #계속 추가 가능

dump(note)

<note author="suyeon" date="20210209"><to>Tove</to><from>Jani</from></note>


In [36]:
#위의 과정을 간단히 하려면 note 생성 시
note = Element('note', date='20210209', author='suyeon') #이렇게 써줘도 같은 결과이다.
to = Element('to')
to.text = 'Tove'

note.append(to)
SubElement(note, 'from').text = 'Jani'

dump(note)

<note author="suyeon" date="20210209"><to>Tove</to><from>Jani</from></note>


In [37]:
##만들고자 했던 것을 만들어보자.
from xml.etree.ElementTree import Element, SubElement, dump

note = Element('note', date='20210209')
to = Element('to')
to.text = 'Tove'

note.append(to)
SubElement(note, 'from').text = 'Jani'
SubElement(note, 'heading').text = 'Reminder'
SubElement(note, 'body').text = 'Don"t forget me this weekend!'

dump(note)

<note date="20210209"><to>Tove</to><from>Jani</from><heading>Reminder</heading><body>Don"t forget me this weekend!</body></note>


In [38]:
#위의 출력값 띄어쓰기 하기 - indent 함수 만들어 사용 
from xml.etree.ElementTree import Element, SubElement, dump

note = Element('note', date='20210209')
to = Element('to')
to.text = 'Tove'

note.append(to)
SubElement(note, 'from').text = 'Jani'
SubElement(note, 'heading').text = 'Reminder'
SubElement(note, 'body').text = 'Don"t forget me this weekend!'


def indent(elem, level=0):
    i = '\n' + level*" "
    if len(elem):
        if not elem.text or not elem.text.strip():
            elem.text = i+' '
        if not elem.tail or not elem.tail.strip():
            elem.tail = i
        for elem in elem:
            indent(elem, level+1)
        if not elem.tail or not elem.tail.strip():
            elem.tail = i
    else:
        if level and (not elem.tail or not elem.tail.strip()):
            elem.tail = i
            

In [39]:
#함수 적용 
indent(note)

In [40]:
#출력 
dump(note)

<note date="20210209">
 <to>Tove</to>
 <from>Jani</from>
 <heading>Reminder</heading>
 <body>Don"t forget me this weekend!</body>
</note>


### 파일에 쓰기(xml 문서): ElementTree(객체명).write(파일명.xml)

In [18]:
from xml.etree.ElementTree import ElementTree
ElementTree(note).write('note.xml') #아까 만든 'note'를 'note.xml'이라는 파일로 생성!

### XML 문서 파싱하기(parsing)

In [19]:
from xml.etree.ElementTree import parse
tree = parse('note.xml')
note = tree.getroot()

In [20]:
print(note)

<Element 'note' at 0x000002464D850D68>


In [21]:
#애트리뷰트 값 읽기
print(note.get('date'))
print(note.get('foo','default')) #딕셔너리 메서드라서 'foo'라는 key가 없으면 default 반환 
print(note.keys()) #현재 이 note 라는 xml 파일에는 'date'라는 key뿐임.
print(note.items())

20210209
default
['date']
[('date', '20210209')]


### xml 문서의 태그 접근하기: xml문서명.find('태그명')

In [22]:
from_tag = note.find('from') #tag가 'from'인 것을 찾음. 여러개라면 그 중 첫번째 값만 리턴
from_tags = note.findall('from') #tag가 'from'인 모든 값을 리턴 
from_text = note.findtext('from') #tag가 'from'인 것의 text명을 반환 

In [25]:
from_tag

<Element 'from' at 0x000002464D8430E8>

In [26]:
from_text

'Jani'

In [27]:
#특정 태그의 모든 하위 엘리먼트를 순차적으로 처리할 경우 
note.getiterator()

<_elementtree._element_iterator at 0x2464d851b28>

In [28]:
note.getchildren() #모든 태그 반환 

  """Entry point for launching an IPython kernel.


[<Element 'to' at 0x000002464D8434F8>,
 <Element 'from' at 0x000002464D8430E8>,
 <Element 'heading' at 0x000002464D8439F8>,
 <Element 'body' at 0x000002464D843A48>]

In [29]:
#getiterator()는 ()안에 특정 태그명만 받을수 있음.
note.getiterator('body')

<_elementtree._element_iterator at 0x2464d85a048>