In [None]:
'''
Pandas对象之间的基本迭代的行为取决于类型。当迭代一个系列时，它被视为数组式，基本
迭代产生这些值。其他数据结构，如：DataFrame和Panel，遵循类似惯例迭代对象的键。
简而言之，基本迭代(对于i在对象中)产生:
    1.Series - 值
    2.DataFrame - 列标签
    3.Pannel - 项目标签
'''

In [1]:
# 迭代DataFrame
# 迭代DataFrame 提供列名
import pandas as pd
import numpy as np

N=20

df = pd.DataFrame({
    'A': pd.date_range(start='2016-01-01',periods=N,freq='D'),
    'x': np.linspace(0,stop=N-1,num=N),
    'y': np.random.rand(N),
    'C': np.random.choice(['Low','Medium','High'],N).tolist(),
    'D': np.random.normal(100, 10, size=(N)).tolist()
    })

for col in df:
   print (col)

A
x
y
C
D


In [None]:
'''
要遍历数据帧(DataFrame)中的行，可以使用以下函数:
    1.iteritems() - 迭代(key，value)对
    2.iterrows() - 将行迭代为(索引，系列)对
    3.itertuples() - 以namedtuples的形式迭代行
'''

In [3]:
# iteritems() 将每个列作为键，将值与值作为键和列值迭代为Series对象，单独迭代每个列作为系列中的键值对
import pandas as pd
import numpy as np

df = pd.DataFrame(np.random.randn(4,3),columns=['col1','col2','col3'])
for key,value in df.iteritems():
   print (key,value)

col1 0    0.249366
1    1.392427
2   -0.853800
3    0.564505
Name: col1, dtype: float64
col2 0   -0.365649
1    1.257594
2    0.227465
3    0.563868
Name: col2, dtype: float64
col3 0   -1.250930
1   -1.717263
2   -0.130490
3   -0.251159
Name: col3, dtype: float64


In [5]:
# iterrows() 返回迭代器 =，产生每个索引值以及包含每行数据的序列
import pandas as pd
import numpy as np

df = pd.DataFrame(np.random.randn(4,3),columns = ['col1','col2','col3'])
for row_index,row in df.iterrows():
   print (row_index,row)
# 由于iterrows()遍历行，因此不会跨该行保留数据类型。0,1,2是行索引，col1，col2，col3是列索引

0 col1    0.251203
col2   -0.079055
col3   -1.631583
Name: 0, dtype: float64
1 col1   -1.843991
col2    0.320257
col3   -1.078194
Name: 1, dtype: float64
2 col1   -0.001489
col2    0.657456
col3    1.644389
Name: 2, dtype: float64
3 col1   -1.800872
col2    0.254387
col3   -1.363497
Name: 3, dtype: float64


In [9]:
# itertuples()  
# itertuples()方法将为DataFrame中的每一行返回一个产生一个元组类型的迭代器。
# 元组的第一个元素将是行的相应索引值，而剩余的值是行值
import pandas as pd
import numpy as np

df = pd.DataFrame(np.random.randn(4,3),columns = ['col1','col2','col3'])
for row in df.itertuples():
    print (row)
    
# 不要尝试再迭代时修改任何对象。迭代是用于读取，迭代器返回原始对
# 象(视图)的副本，因此更改将不会反映在原始对象上
df = pd.DataFrame(np.random.randn(4,3),columns = ['col1','col2','col3'])

for index, row in df.iterrows():
   row['a'] = 10
print (df)# 输出看到，修改并没有反映出来

Pandas(Index=0, col1=-0.4282898319844832, col2=1.3574015917931395, col3=-1.027512652938967)
Pandas(Index=1, col1=1.4891570864091994, col2=-1.1010007590651494, col3=-0.13998267799836175)
Pandas(Index=2, col1=-0.7357977694910255, col2=0.5677452882218071, col3=-1.017650892491355)
Pandas(Index=3, col1=1.2333978650863027, col2=0.33146867917621536, col3=-0.08367433670203753)
       col1      col2      col3
0  0.213632 -0.463274 -2.734760
1 -0.113822  0.130594 -0.798658
2 -0.351115 -0.694644  0.722309
3  0.746832  0.178098  0.365050
