[Fonte](https://www.tutorialspoint.com/python_pandas/python_pandas_iteration.htm)

O comportamento da iteração básica sobre objetos Pandas depende do tipo. Ao iterar sobre uma série, ela é considerada semelhante a uma matriz e a iteração básica produz os valores. Outras estruturas de dados, como DataFrame e Panel, seguem a convenção semelhante a ditado de iterar sobre as chaves dos objetos.

Resumindo, a iteração básica (para `i` no objeto) produz:

* Série − valores
* DataFrame - rótulos de coluna
* Painel − rótulos de itens

# Iterando um DataFrame

A iteração de um DataFrame fornece nomes de coluna. Vamos considerar o seguinte exemplo para entender o mesmo.

In [None]:
import pandas as pd
import numpy as np
 
N=20
df = pd.DataFrame({
   'A': pd.date_range(start='2016-01-01',periods=N,freq='D'),
   'x': np.linspace(0,stop=N-1,num=N),
   'y': np.random.rand(N),
   'C': np.random.choice(['Low','Medium','High'],N).tolist(),
   'D': np.random.normal(100, 10, size=(N)).tolist()
   })
print(df.head())
for col in df:
    print(col)

Para iterar nas linhas do DataFrame, podemos usar as seguintes funções −

* `iteritems()` − para iterar sobre os pares (chave, valor)
* `iterrows()` − iterar sobre as linhas como pares (índice, série)
* `itertuples()` − iterar sobre as linhas como namedtuples

## iteritems()

Itera sobre cada coluna como chave, par de valor com rótulo como chave e valor de coluna como um objeto Series.

> Observe que cada coluna é iterada separadamente como um par chave-valor em uma série.

[mais em Pandas](https://pandas.pydata.org/pandas-docs/version/1.3/reference/api/pandas.DataFrame.iteritems.html#pandas-dataframe-iteritems)

In [8]:
import pandas as pd
import numpy as np
 
df = pd.DataFrame(np.random.randn(4,3),columns=['col1','col2','col3'])
print(df.head(), '\n')
for key,value in df.items():
    print(f'label: {key}', type(key))
    print(f'content: {value}', sep='\n')
    print(type(value), '\n')

       col1      col2      col3
0 -0.547416 -0.189310 -2.122048
1  0.533379 -1.801052  0.106869
2 -1.076706 -1.834793  0.038968
3  0.281210  0.101605 -0.866777 

label: col1 <class 'str'>
content: 0   -0.547416
1    0.533379
2   -1.076706
3    0.281210
Name: col1, dtype: float64
<class 'pandas.core.series.Series'> 

label: col2 <class 'str'>
content: 0   -0.189310
1   -1.801052
2   -1.834793
3    0.101605
Name: col2, dtype: float64
<class 'pandas.core.series.Series'> 

label: col3 <class 'str'>
content: 0   -2.122048
1    0.106869
2    0.038968
3   -0.866777
Name: col3, dtype: float64
<class 'pandas.core.series.Series'> 



## iterrows()

`iterrows()` retorna o iterador gerando cada valor de índice junto com uma série contendo os dados em cada linha.

> **Observação:** Como `iterrows()` iteram sobre as linhas, ele não preserva o tipo de dados na linha. 

> `0`, `1`, `2` são os índices de linha e `col1`, `col2`, `col3` são índices de coluna.

[mais em pandas](https://pandas.pydata.org/pandas-docs/version/1.3/reference/api/pandas.DataFrame.iterrows.html#pandas.DataFrame.iterrows)

In [30]:
import pandas as pd
import numpy as np

df = pd.DataFrame(np.random.randn(4,3),columns = ['col1','col2','col3'])
print(df, '\n')
for row_index, row in df.iterrows():
   print(f'index: {row_index}', type(row_index))
   print(row)
   for r in row:
      print('>>> r', r, 'type r', type(r))
   print('type row', type(row), '\n')

       col1      col2      col3
0 -0.894206  0.040148 -0.741859
1 -0.869025 -0.059945  0.014203
2  0.004482 -1.202750 -0.277030
3 -0.166198  0.833034 -1.172269 

index: 0 <class 'int'>
col1   -0.894206
col2    0.040148
col3   -0.741859
Name: 0, dtype: float64
>>> r -0.8942063344682829 type r <class 'float'>
>>> r 0.0401484222025935 type r <class 'float'>
>>> r -0.7418585721952748 type r <class 'float'>
type row <class 'pandas.core.series.Series'> 

index: 1 <class 'int'>
col1   -0.869025
col2   -0.059945
col3    0.014203
Name: 1, dtype: float64
>>> r -0.8690254712209803 type r <class 'float'>
>>> r -0.05994481915617261 type r <class 'float'>
>>> r 0.014202854189897954 type r <class 'float'>
type row <class 'pandas.core.series.Series'> 

index: 2 <class 'int'>
col1    0.004482
col2   -1.202750
col3   -0.277030
Name: 2, dtype: float64
>>> r 0.00448223566379704 type r <class 'float'>
>>> r -1.2027499565327044 type r <class 'float'>
>>> r -0.27703044477711913 type r <class 'float'>
type ro

## itertuplas()

`itertuples()` retornará um iterador gerando uma tupla nomeada para cada linha no DataFrame. O primeiro elemento da tupla será o valor de índice correspondente da linha, enquanto os valores restantes são os valores da linha.

[mais em pandas](https://pandas.pydata.org/pandas-docs/version/1.3/reference/api/pandas.DataFrame.itertuples.html)

In [24]:
import pandas as pd
import numpy as np

df = pd.DataFrame(np.random.randn(4,3),columns = ['col1','col2','col3'])
print(df, '\n')
for row in df.itertuples():
    print('row', row, type(row))
    for r in row:
        print('r', r, type(r))

       col1      col2      col3
0  0.588605  0.897320  0.797308
1  0.164387 -0.047755 -0.915652
2  0.029146 -0.316070 -0.871190
3  1.380692 -0.627874  1.386279 

row Pandas(Index=0, col1=0.5886047836668269, col2=0.8973204972328737, col3=0.7973081239133667) <class 'pandas.core.frame.Pandas'>
r 0 <class 'int'>
r 0.5886047836668269 <class 'float'>
r 0.8973204972328737 <class 'float'>
r 0.7973081239133667 <class 'float'>
row Pandas(Index=1, col1=0.16438747651320787, col2=-0.04775492742571446, col3=-0.9156519664955515) <class 'pandas.core.frame.Pandas'>
r 1 <class 'int'>
r 0.16438747651320787 <class 'float'>
r -0.04775492742571446 <class 'float'>
r -0.9156519664955515 <class 'float'>
row Pandas(Index=2, col1=0.02914583275144513, col2=-0.3160695901014719, col3=-0.8711895103125828) <class 'pandas.core.frame.Pandas'>
r 2 <class 'int'>
r 0.02914583275144513 <class 'float'>
r -0.3160695901014719 <class 'float'>
r -0.8711895103125828 <class 'float'>
row Pandas(Index=3, col1=1.3806916327348697, co

> **Nota:** Não tente modificar nenhum objeto durante a iteração. A iteração destina-se à leitura e o iterador retorna uma cópia do objeto original (uma exibição), portanto, as alterações não serão refletidas no objeto original.

In [19]:
import pandas as pd
import numpy as np

df = pd.DataFrame(np.random.randn(4,3),columns = ['col1','col2','col3'])

for index, row in df.iterrows():
   row['a'] = 10
print(df)

       col1      col2      col3
0 -0.011082 -0.116534 -0.834158
1  0.872729  0.759126  0.462441
2 -0.061433  1.655906 -0.528696
3 -0.491968  0.420851  0.258411
