# container
容器是存储某些元素的统称，最大的特性是判断一个元素是否在容器内。

可以使用`in`,`not in`进行判断。 `str`,`list`,`tuple`,`set`,`dict`都可以通过这样的方式进行判断。所以他们也称为容器。

之所以能实现这样的判断，是由于内部实现了`__contains__`方法。

In [1]:
class A:
    
    def __init__(self):
        self.items = [1,2]
        
    def __contains__(self,item):
        return item in self.items
    
a = A()

print(1 in a)
print(2 in a )
print(3 in a )

True
True
False


另外，使用容器时，还可以迭代进行容器内的元素输出。基于迭代器
# 迭代器

如果一个类实现了迭代协议，也可以被称之为迭代器。

在 Python 中，实现迭代器协议就是实现以下 2 个方法：

`__iter__`：这个方法返回对象本身，即 self

`__next__`：这个方法每次返回迭代的值，在没有可迭代元素时，抛出 StopIteration 异常




In [2]:
class A:
    """A 实现了迭代器协议 它的实例就是一个迭代器"""
    def __init__(self, n):
        self.idx = 0
        self.n = n

    def __iter__(self):
        print('__iter__')
        return self

    def __next__(self):
        if self.idx < self.n:
            val = self.idx
            self.idx += 1
            return val
        else:
            raise StopIteration()

# 迭代元素
a = A(3)
for i in a:
    print(i)

__iter__
0
1
2


在这个例子中，我们定义了一个类 A，它内部实现了 __iter__ 和 __next__ 方法。

其中 __iter__ 方法返回了 self，__next__ 方法实现了具体的迭代细节。

然后执行 a = A(3)，在执行 for i in a 时，我们看到调用了 __iter__ 方法，然后依次输出 __next__ 中的元素。

其实在执行 for 循环时，实际执行流程是这样的：

for i in a 相当于执行 iter(a)
每次迭代时会执行一次 __next__ 方法，返回一个值
如果没有可迭代的数据，抛出 StopIteration 异常，for 会停止迭代
但是请注意，当我们迭代完 for i in a 时，如果再次执行迭代，将不会有任何数据输出。

如果我们想每次执行都能迭代元素，只需每次迭代一个新对象即可：

# 可迭代对象
凡是可以返回一个「迭代器」的对象，都可以称之为「可迭代对象」。

换句话说：__iter__ 方法返回一个迭代器，那么这个对象就是「可迭代对象」。

听起来不太好理解，我们来看一个例子。


In [3]:
class A:
    # A是迭代器 因为它实现了 __iter__ 和__next__方法
    def __init__(self, n):
        self.idx = 0
        self.n = n

    def __iter__(self):
        return self

    def __next__(self):
        if self.idx < self.n:
            val = self.idx
            self.idx += 1
            return val
        else:
            raise StopIteration()

class B:
    # B不是迭代器 但B的实例是一个可迭代对象
    # 因为它只实现了 __iter__
    # __iter__返回了A的实例 迭代细节交给了A
    def __init__(self, n):
        self.n = n

    def __iter__(self):
        return A(self.n)

# a是一个迭代器 同时也是一个可迭代对象
a = A(3)
for i in a:
    print(i)
# <__main__.A object at 0x10eb95550>
print(iter(a))

# b不是迭代器 但它是可迭代对象 因为它把迭代细节交给了A
b = B(3)
for i in b:
    print(i)
# <__main__.A object at 0x10eb95450>
print(iter(b))

0
1
2
<__main__.A object at 0x0000019E8DB17990>
0
1
2
<__main__.A object at 0x0000019E8DB17790>


仔细看这个例子，我们定义了 2 个类 A 和 B，A 实现了 __iter__ 和 __next__ 方法。

而 B 只实现了 __iter__，并没有实现 __next__，而且它的 __iter__ 返回值是一个 A 的实例。

对于 A 来说：

A 是一个「迭代器」，因为其实现了迭代器协议 __iter__ 和 __next__
同时 A 的 __iter__ 方法返回了实例本身 self，也就是说返回了一个迭代器，所以 A 的实例 a 也是一个「可迭代对象」
对于B 来说：

B 不是一个「迭代器」，因为它只了实现 __iter__，没有实现 __next__
由于 B 的 __iter__ 返回了 A 的实例，而 A 是一个迭代器，所以 B 的实例 b 是一个「可迭代对象」，换句话说，B 把迭代细节交给了 A
总之，一个类的迭代细节，是可以交给另一个类的，就像这个例子的 B 这样，所以 B 的实例只能是「可迭代对象」，而不是「迭代器」。

其实，这种情况我们见的非常多，我们使用最多的 list、tuple、set、dict 类型，都只是「可迭代对象」，但不是「迭代器」，因为它们都是把迭代细节交给了另外一个类，这个类才是真正的迭代器。

```python

# list 是可迭代对象
>>> l = [1, 2]
# list 的迭代器是 list_iterator
>>> iter(l)
<list_iterator object at 0x1009c1c18>
# 执行的是 list_iterator 的 __next__
>>> iter(l).__next__()
>>> 1

# tuple 是可迭代对象
>>> t = ('a', 'b')
# tuple 的迭代器是 tuple_iterator
>>> iter(t)
<tuple_iterator object at 0x1009c1b00>
# 执行的是 tuple_iterator 的 __next__
>>> iter(t).__next__()
>>> a

# set 是可迭代对象
>>> s = {1, 2}
# set 的迭代器是 set_iterator
>>> iter(s)
<set_iterator object at 0x1009c70d8>
# 执行的是 set_iterator 的 __next__
>>> iter(s).__next__()
>>> 1

# dict 是可迭代对象
>>> d = {'a': 1, 'b': 2}
# dict 的迭代器是 dict_keyiterator
>>> iter(d)
# 执行的是 dict_keyiterator 的 __next__
<dict_keyiterator object at 0x1009c34f8>
>>> iter(d).next()
>>> a
```

由此我们可以得出一个结论：**迭代器一定是个可迭代对象，但可迭代对象不一定是迭代器。**

# 生成器

「生成器」是一个特殊的「迭代器」，并且它也是一个「可迭代对象」。

有 2 种方式可以创建一个生成器：

.. 生成器表达式

.. 生成器函数


In [4]:
g = (i for i in range(5))
g

<generator object <genexpr> at 0x0000019E8DA39CB0>

In [6]:
iter(g)

<generator object <genexpr> at 0x0000019E8DA39CB0>

In [5]:
for i in g:
    print(i)

0
1
2
3
4


我们使用 g = (i for i in range(5)) 创建了一个生成器，它的类型是 generator，同时调用 iter(g) 可以得知 __iter__ 返回的是实例本身，即生成器也是一个迭代器，并且它也是一个可迭代对象。

In [7]:
def gen(n):
    for i in range(n):
        yield i

# 创建一个生成器
g = gen(5)
# <generator object gen at 0x10bb46f50>
print(g)
# <type 'generator'>
print(type(g))

# 迭代这个生成器
for i in g:
    print(i)

<generator object gen at 0x0000019E8DB206C0>
<class 'generator'>
0
1
2
3
4


我们在函数中使用 yield 关键字。其实，包含 yield 关键字的函数，不再是一个普通的函数，而返回的是一个生成器。它在功能上与上面的例子一样，可以迭代生成器中的所有数据。

通常情况下，我们习惯在函数内使用 yield 的方式来创建一个生成器。


# 使用生成器迭代数据相比于普通方式迭代数据，有什么优势呢

使用 yield 的函数与使用 return 的函数，在执行时的差别在于：

1. 包含 return 的方法会以 return 关键字为最终返回，每次执行都返回相同的结果
2. 包含 yield 的方法一般用于迭代，每次执行时遇到 yield 就返回 yield 后的结果，但内部会保留上次执行的状态，下次继续迭代时，会继续执行 yield 之后的代码，直到再次遇到 yield 后返回

当我们想得到一个集合时，如果使用普通方法，只能一次性创建出这个集合，然后 return 返回：

In [11]:
def gen_data(n):
    # 创建一个集合
    return [i for i in range(n)]

gen_data(10)

[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]

但如果此时这个集合中的数据非常多，我们就需要在内存中一次性申请非常大的内存空间来存储。

如果我们使用 yield 生成器的方式迭代这个集合，就能解决内存占用大的问题：

In [15]:
def gen_data(n):
    for i in range(n):
        # 每次只返回一个元素
        yield i
        
gen_data(10)

<generator object gen_data at 0x0000019E8DA3B920>

In [22]:
import pandas as pd
from openpyxl import Workbook
from openpyxl.utils.dataframe import dataframe_to_rows
from openpyxl import load_workbook

data1 = [
    ['Name', 'Category', 'Amount'],
    ['John', 'Food', 100],
    ['Jane', 'Food', 150],
    ['John', 'Clothes', 200],
    ['Jane', 'Clothes', 250],
    ['John', 'Food', 120],
]

data = {'Column1': [1, 2, 3], 'Column2': ['A', 'B', 'C']}
df = pd.DataFrame(data)

file = r'C:/Users/Lenovo/Desktop/test1.xlsx'

# Create an openpyxl Workbook object
workbook = Workbook()

# Get the active sheet
worksheet1 = workbook.active
# Write data to the sheet
for row in dataframe_to_rows(df, index=False, header=True):
    worksheet1.append(row)

# Add a new sheet in the file
worksheet2 = workbook.create_sheet('data')
for row_data in data1:
    worksheet2.append(row_data)

# worksheet3 = workbook.create_sheet('this is newest')
# for row in dataframe_to_rows(df, index=False, header=True):
#     worksheet3.append(row)
    
# Save the workbook
workbook.save(file)

In [2]:
from openpyxl.utils.dataframe import dataframe_to_rows
from openpyxl import load_workbook

data1 = [
    ['Name', 'Category', 'Amount'],
    ['John', 'Food', 100],
    ['Jane', 'Food', 150],
    ['John', 'Clothes', 200],
    ['Jane', 'Clothes', 250],
    ['John', 'Food', 120],
]

# data = {'Column1': [1, 2, 3], 'Column2': ['A', 'B', 'C']}
# df = pd.DataFrame(data)

file = r'C:/Users/Lenovo/Desktop/test1.xlsx'

# Create an openpyxl Workbook object
workbook = load_workbook(file)

# Get the active sheet
# worksheet1 = workbook["summary"]
# pivot = worksheet1._pivots[0]
# pivot.cache.refreshOnLoad = True

# worksheet1 = workbook.active
# # Write data to the sheet
# for row in dataframe_to_rows(df, index=False, header=True):
#     worksheet1.append(row)

# Add a new sheet in the file
worksheet2 = workbook.create_sheet('data')
for row_data in data1:
    worksheet2.append(row_data)

# worksheet3 = workbook.create_sheet('this is newest')
# for row in dataframe_to_rows(df, index=False, header=True):
#     worksheet3.append(row)
    
# Save the workbook
workbook.save(file)

In [48]:
from openpyxl import load_workbook
import pandas as pd

data1 = pd.DataFrame([
    ['Name', 'Category', 'Amount'],
    ['John', 'Food', 100],
    ['Jane', 'Food', 150],
    ['John', 'Clothes', 200],
    ['Jane', 'Clothes', 250],
    ['John', 'Food', 120],
])

data2 = pd.DataFrame([    ['Name', 'Category', 'Amount'],
    ['Sohn', 'Food', 100],
    ['Sane', 'Food', 150],
    ['Sohn', 'Clothes', 200],
    ['Sane', 'Clothes', 250],
    ['Sohn', 'Food', 120]])


df = pd.concat([data1,data2.loc[1:,]], axis = 0)

file = r'C:/Users/Lenovo/Desktop/test.xlsx'
df = pd.read_excel(file, sheet_name='data')


writer = pd.ExcelWriter(file, engine='xlsxwriter')
writer.book = load_workbook(file)
df.to_excel(writer, sheet_name= 'data',index = False)
writer.close()


BadZipFile: File is not a zip file

In [49]:
writer.close()

IndexError: At least one sheet must be visible

In [7]:
a = '  a b c   , '
a_new = a.rstrip(",")
a_new

'  a b c   , '

In [8]:
"12mn".isascii()

False

In [9]:
"nmn".islower()

True

In [13]:
wardrobe = {'shirt': ['red', 'blue', 'white'], 'jeans': ['blue', 'black']}
new_items = {'jeans': ['white'], 'scarf': ['yellow'], 'socks': ['black', 'brown']}
wardrobe.update(new_items)
wardrobe

{'shirt': ['red', 'blue', 'white'],
 'jeans': ['white'],
 'scarf': ['yellow'],
 'socks': ['black', 'brown']}

In [14]:
numbers = [ 4, 6, 2, 7, 1 ]

numbers.sort()

print(numbers)


[1, 2, 4, 6, 7]


In [2]:
from pyecharts import options as opts
from pyecharts.charts import Tree

data = [
    {
        "name": "python变量",
        "children": [
            {"name": "字符串",
            "children": [{"name": "实例1：'abc'"}, {"name": "实例2：'123abc'"}]},
            {"name": "列表",
            "children": [{"name": "实例1：[a,b,c]"}, {"name": "实例2：'[1,2,3]"}]},
            {"name": "字典",
            "children": [{"name": "实例1：{1:'a','2':'b'}}"}, {"name": "实例2：'{a:[1,2,3],'2':(1,2))}"}]},
            {"name": "元组",
             "children": [{"name": "实例1：(1,2,3)}"}, {"name": "实例2：(a,b,c)"}]}
]}
]

c = (
    Tree()
    .add("", data)
)
# c.render_notebook()
c.render('test.html')


'e:\\git\\learning\\python\\test.html'

In [2]:
fruit = {"oranges": 3, "apples": 5, "bananas": 7, "pears": 2}

import operator

sorted(fruit.items(), key = operator.itemgetter(1), reverse = True)

[('bananas', 7), ('apples', 5), ('oranges', 3), ('pears', 2)]

In [5]:
sorted(fruit.items(), key = operator.itemgetter(0), reverse = True)

[('pears', 2), ('oranges', 3), ('bananas', 7), ('apples', 5)]

In [18]:
a = {'cat':[1,0]}



In [19]:
a['dog'] = a.get('dog',[0,0])
a['cat'] = a.get('cat',[0,0])     
a['cat'] = [a.get('cat',[0,0])[0]+1,a['cat'][1]]
a['dog'] = [a.get('dog',[0,0])[0]+1,a['dog'][1]]
a

{'cat': [2, 0], 'dog': [1, 0]}

In [20]:
error_count = {'Timeout while retrieving information':15,'The ticket was modified while updating':3,'Connection to DB failed':5,'Tried to add information to a closed ticket':10,'Permission denied while closing ticket':22,'Ticket doesn\'t exist':9}

with open('error_message.csv','w') as f:
  f.write('Error,Count\n')
  for key in error_count.keys():
    f.write(f'{key},{error_count[key]}\n')


In [22]:
per_user_count = {'mdouglas':[1,4],'noel':[5,4],'breee':[5,4],'ac':[13,9],'blossom':[9,8],'rr.robinson':[8,0],'oren':[9,2]}

with open('user_statistics.csv','w') as f:
    f.write(f'Username,INFO,ERROR\n')
    for key in per_user_count.keys():
        f.write(f'{key},{per_user_count[key][0]},{per_user_count[key][1]}\n')
        

In [23]:
a = [('Timeout while retrieving information', 15), ('Connection to DB failed', 13), ('Tried to add information to closed ticket', 12), ('Permission denied while closing ticket', 10), ('The ticket was modified while updating', 9), ("Ticket doesn't exist", 7)]


with open('test.csv','w') as f:
    f.write('Error,Count\n')
    for i in a:
        f.write(f'{i[0]},{i[1]}\n')

In [None]:
b = [('ac', [2, 2]), ('ahmed.miller', [2, 4]), ('blossom', [2, 6]), ('bpacheco', [0, 2]), ('breee', [1, 5]), ('britanni', [1, 1]), ('enim.non', [2, 3]), ('flavia', [0, 5]), ('jackowens', [2, 4]), ('kirknixon', [2, 1]), ('mai.hendrix', [0, 3]), ('mcintosh', [4, 3]), ('mdouglas', [2, 3]), ('montanap', [0, 4]), ('noel', [6, 3]), ('nonummy', [2, 3]), ('oren', [2, 7]), ('rr.robinson', [2, 1]), ('sri', [2, 2]), ('xlg', [0, 4])]


