# 读取xml文档
- 通过parse函数可以读取xml文档，该函数返回ElementTree对象，该对象的iterfind方法可以对特定节点进行迭代


In [None]:
from xml.etree.ElementTree import parse

doc = parse("files/produces.xml")
print(type(doc))
for item in doc.iterfind('products/product'):
    id = item.findtext('id')  # 获取节点的内容
    name = item.findtext('name')
    price = item.findtext('price')
    uuid = item.get('uuid')  # 获取节点的属性
    print(id, name, price, uuid)

# 如何将一个字典转换为xml文档，并将该xml文档保存成文本文件？
- 使用dicttoxml模块

# 如何读取xml文件的内容，并将其转化为字典
- 使用xmltodict模块

In [6]:
# 将dict转换为xml文档
import dicttoxml
import os
from xml.dom.minidom import parseString

d = [10, 'names', {'name': "bill", "age": 23, "sal": 8000},
                    {"name": "Mike", "age": 40, "sal": 9000},
                    {"name": "John", "age": 35, "sal": 10000}]
bxml = dicttoxml.dicttoxml(d, custom_root="persons")  # 转化为字节类型并设置根节点
xml = bxml.decode("utf-8")
# print(xml)
# 美化并保存为文件
dom = parseString(xml)
prettyxml = dom.toprettyxml(indent="  ")
# print(prettyxml)

with open("testing.xml", 'w', encoding="utf-8") as fp:
    fp.write(prettyxml)
    print(prettyxml)
    print("写入完成")

<?xml version="1.0" ?>
<persons>
  <item type="int">10</item>
  <item type="str">names</item>
  <item type="dict">
    <name type="str">bill</name>
    <age type="int">23</age>
    <sal type="int">8000</sal>
  </item>
  <item type="dict">
    <name type="str">Mike</name>
    <age type="int">40</age>
    <sal type="int">9000</sal>
  </item>
  <item type="dict">
    <name type="str">John</name>
    <age type="int">35</age>
    <sal type="int">10000</sal>
  </item>
</persons>

写入完成


In [10]:
# 将xml文档转换为字典
import xmltodict
import pprint
with open("testing.xml", "r", encoding="utf-8") as fp:
    xml = fp.read()
# print(xml)
d = xmltodict.parse(xml)
# print(d)
pp = pprint.PrettyPrinter(indent=4)
pp.pprint(d)

OrderedDict([   (   'persons',
                    OrderedDict([   (   'item',
                                        [   OrderedDict([   ('@type', 'int'),
                                                            ('#text', '10')]),
                                            OrderedDict([   ('@type', 'str'),
                                                            (   '#text',
                                                                'names')]),
                                            OrderedDict([   ('@type', 'dict'),
                                                            (   'name',
                                                                OrderedDict([   (   '@type',
                                                                                    'str'),
                                                                                (   '#text',
                                                                                    'bill')])),
            

# 将json字符串映射为一个类对象
- json模块的loads函数可以装载json文档，并将其转换为json对象，关键需要通过object_hook参数指定钩子对象，然后在类的构造方法中将传入的json对象赋值给内部变量__dict__


In [17]:
# 将json文档转换为类对象
import json

class Product:
    def __init__(self, d):
        # 这个就可以默认去寻找对应的属性
        self.__dict__ = d
    
    
with open("test.json", "r", encoding="utf-8") as fp:
    json_str = fp.read()
# 通过设置object_hook参数将json_str作为字典传入Product就可以将它转换为一个类对象
dt = json.loads(json_str, object_hook=Product)
print(dt.name)
print(dt.price)
print(dt.color)

# 下面使用函数返回对象
def jsonToProduct(d):
    return Product(d)
    
new_dt = json.loads(json_str, object_hook=jsonToProduct)
print(new_dt.name)

iphone
8000
blue
iphone


In [18]:
import json
d = {"name": "iphone", "price": 8000, "color": "blue"}
with open("test.json", "w", encoding="utf-8") as fp:
    json_str = json.dumps(d)
    fp.write(json_str)
    print("写入完毕")

写入完毕


# 将一个类对象转换为对应的json字符串
- json模块的dumps用于将对象转换为json字符串，通过default参数指定一个转换函数，可以在该函数中提取对象的属性值，并生成json对象，最后dumps负责将转换函数返回的json对象转换为json字符串

# 将对象列表转换为json数组

In [24]:
# 将一个类对象转换为对应的json字符串，需要自定义函数实现
class Stu:
    def __init__(self, name, age, home):
        self.name = name
        self.age = age
        self.home = home
        
stu = Stu("小明", 23, "chengdu")

def dictToJson(obj):
    return {
        'name': obj.name,
        'age': obj.age,
        'home': obj.home
    }

# res = json.dumps(stu, default=dictToJson, ensure_ascii=False)
# print(res)
# 下面这种写法更合理
res1 = json.dumps(stu, default=lambda obj: obj.__dict__, ensure_ascii=False)
print(res1, type(res1))


{"name": "小明", "age": 23, "home": "chengdu"} <class 'str'>


#  如何创建SQLite数据库 
- 使用sqlite3模块

# 如何向SQLite表中插入数据

# 如何查询SQLite表中的数据 


In [28]:
import sqlite3
import os

# 先创建一个库文件
dbPath = "data.sqlite3"
if not os.path.exists(dbPath):
    conn = sqlite3.connect(dbPath)
    c = conn.cursor()
    c.execute("""
    create table persons(
    id int primary key,
    name char(32) not null,
    age int not null,
    address char(100),
    salary double
    );
    """)
    conn.commit()
    conn.close()
    print("数据库创建成功")
conn = sqlite3.connect(dbPath)
c = conn.cursor()
c.execute('delete from persons')
c.execute("""
insert into persons(id, name, age, address, salary) values (1, 'taotao', 23, 'chengdu', 8000)
""")

c.execute("""
insert into persons(id, name, age, address, salary) values (2, '娇娇', 21, 'chengdu', 10000)
""")
conn.commit()
print("数据插入成功")

# 查询
persons = c.execute("select * from persons")
for person in persons:
    print(person)
    print(person[0])
    print(person[1])

数据库创建成功
数据插入成功
(1, 'taotao', 23, 'chengdu', 8000.0)
1
taotao
(2, '娇娇', 21, 'chengdu', 10000.0)
2
娇娇


# 在python语言中常用的ORM框架有哪些？它们有啥区别？
- 主要有两种
    - SQLAlchemy：偏向于SQL，可以灵活地提交SQL语句
    - SQLObject ：更加面向对象，无法自由使用原生 的SQL语句
        - 需要安装pip install sqlobject

# 使用SQLobject框架操作mysql数据库？
- sqlobject模块，底层封装了pymysql模块，需要安装

In [None]:
from sqlobject import *
from sqlobject.mysql import builder
import json


#  连接数据库
mysql = "mysql://root:p1237752@localhost:3306/test_db?charset=utf8"
sqlhub.processConnection = connectionForURI(mysql, driver="pymysql")

# 因为是ORM模型映射，需要建立一个对象
class Person(SQLObject):
    class sqlmeta:
        table = "t_persons"
    name = StringCol(length=30)
    age = IntCol()
    address = StringCol(length=30)
    salary = FloatCol()

try:
    Person.dropTable()
except:
    pass
Person.createTable()
print("成功创建了数据表")

person1 = Person(name="jiaojiao", age=21, address="成都", salary=8000)
person2 = Person(name="xiaoxiao", age=22, address="上海", salary=8000)
person3 = Person(name="shasha", age=23, address="珠海", salary=6000)
print("成功插入一条数据")

# 修改数据
person1.name = "taotao"

# 查询数据
person = Person.selectBy(name="shasha")
print(person[0])
print(person[0].id)
print(person[0].name)
print(person[0].address)

# 删除数据
person[0].destroySelf()
print("数据删除成功")


## 请解释什么是NoSQL数据库，有哪些类型的NoSQL数据库，请说出这些数据库的典型产品，以及每个类型的NoSQL数据库的应用场景？
- NoSQL：Not only SQL，不仅仅只有SQL语法的数据库，是菲关系型数据库
- 类型有：
    - 键值（key-value）数据库
        - 比如redis，riak，Memcached
        - 使用场景：用来存储用户信息，比如会员，配置文件，参数，购物车等
    - 文档（Document-Oriented）数据库
        - 比如MongoDB，CouchDB， RavenDB
        - 使用场景：日志，分析数据，能够存储各种 类型的数据
    - 列存储数据库
        - 比如Hbase，Cassandra 
        - 使用场景：日志，博客平台，标签可以存储到一列，类别可以存储到另一列，文章可以存储在另外一列
    - 图数据库 
        - Neo4J， OrientDB
        - 使用场景：在一些关系性强的数据库可以使用，作为推荐引擎的数据库


# 将xml文档保存到MongoDB数据库中，并查询文档中的数据

In [41]:
"""
- 使用步骤：
    - 1.获取链接mongodb的对象
        client = pymongo.MongoClient("127.0.0.1", port=27017)
        默认IP地址就是本机，端口号默认是27017
    - 2.获取数据库，若对象中不包含这个数据库，则会新建一个
        db = client.testing
    - 3.获取数据库中的集合（就是MySQL中的表）
        collection = db.test
    - 4.写入数据
        collection.insert({"username":litao, "age":18, "address":"chengdu"})
"""

from pymongo import *

Client = MongoClient("127.0.0.1", port=27017)
# 建立数据库
db = Client.test_db
# 建立数据表
movie_data = db.movies
movie_data.delete_many({"stars": {'$gt': 0}})

import xmltodict
with open("movies.xml", "r", encoding="utf-8") as fp:
    xml = fp.read()
# print(xml)

# 获取xml文档中的内容
d = xmltodict.parse(xml)
moviesList = d['movies']['movie']
# print(moviesList)

for movie in moviesList:
    movie['stars'] = int(movie['stars'])
    # 将数据插入数据表中
    movie_star = movie_data.insert_one(movie).inserted_id
    print(movie_star)
    
for movie in movie_data.find({"stars": {"$gt": 0}}):
    print(movie)

6031d89c00ab2c6bd38f425a
6031d89c00ab2c6bd38f425b
6031d89c00ab2c6bd38f425c
6031d89c00ab2c6bd38f425d
{'_id': ObjectId('6031d89c00ab2c6bd38f425a'), '@title': 'Enemy Behind', 'type': 'War, Thriller', 'format': 'DVD', 'year': '2003', 'rating': 'PG', 'stars': 10, 'description': 'Talk about a US-Japan war'}
{'_id': ObjectId('6031d89c00ab2c6bd38f425b'), '@title': 'Transformers', 'type': 'Anime, Science Fiction', 'format': 'DVD', 'year': '1989', 'rating': 'R', 'stars': 8, 'description': 'A schientific fiction'}
{'_id': ObjectId('6031d89c00ab2c6bd38f425c'), '@title': 'Trigun', 'type': 'Anime, Action', 'format': 'DVD', 'episodes': '4', 'rating': 'PG', 'stars': 10, 'description': 'Vash the Stampede!'}
{'_id': ObjectId('6031d89c00ab2c6bd38f425d'), '@title': 'Ishtar', 'type': 'Comedy', 'format': 'VHS', 'rating': 'PG', 'stars': 2, 'description': 'Viewable boredom'}
