## Przeszukiwanie list w pętli

Do tej pory wszystkie operacje wykonywaliśmy na pojedycznych jednostkach listy. To jednak mocno nieefektywne.

Aby wykonać operacje na wszystkich elementach potrzebne jest zapisanie tzw. petli.

Składnia takiej pętli jest następująca:

```
# for dowolna_nazwa in nazwa_listy:
```
Zobaczmy przykład na żywym kodzie:


In [None]:
SerieATable = ["Napoli", "AC Milan", "Inter Milan", "Roma", "Lazio"]

for SerieATeam in SerieATable:
  position = SerieATable.index(SerieATeam) + 1
  print(f"{SerieATeam} jest na {position} pozycji w serie A")

Skąd kompilator wie gdzie kończy się peta? - pomaga system wcięć robionych tabulatorem

In [None]:
przykladowaLista = ["Jeden", "Dwa", "Trzy"]

for dowolnaNazwa in przykladowaLista:
  #Kod po wcięciu będzie wykonany wiele raz
  print(dowolnaNazwa + " Przyklad")

#Kod bez wcięcia nie będzie wykonywany w pętli - pierwsza taka linijka kończy pętle
print(przykladowaLista)

Czy zmienna służąca do iterowania przeżywa po wykonaniu pętli?

In [None]:
print(dowolnaNazwa)

### Szybki zapis pętli tzw. *list comprehension*
W przypadku pojedynczych operacji bardzo popularny wśród programistów jest następujący zapis:


```
# Lista = [Operacja(element) for element in Lista]
```
Pozwala on na wykonanie dowolnej operacji na wszystkich elementach listy.


Wykorzystamy go, aby przetworzyć listę imion na małe litery:

In [None]:
listaPoczatkowa = ["Jan", "Antoni", "Beata", "Zofia"]
listaKoncowa = [element.lower() for element in listaPoczatkowa]

print(listaPoczatkowa)
print(listaKoncowa)

**Ćwiczenie:** Zmień rozszerzenia plików z html na pdf w liście za pomocą szybkiej pętli.

In [None]:
list_BIS_PDFs = [ "https://www.bis.org/review/r210903a.htm",
                 "https://www.bis.org/review/r210903b.htm",
                 "https://www.bis.org/review/r210903c.htm",
                 "https://www.bis.org/review/r210902a.htm" ]

List_BIS_Completed = []

print(*List_BIS_Completed, sep = "\n")

### Przykład - pobieranie zdjęć z Instagrama

Bardzo często ciekawe operacje są wykonywane w róznego rodzaju paczkach. Wykorzystanie pętli z połączeniem pojedynczej operacji z takiego pakietu pozwoli na zbudowanie ciekawej bazy danych np. kolekcji filmów z Youtube czy zdjęć z Instagrama.

Wykonamy te drugie.

Paczki instalujemy poleceniem:

```
# pip install nazwa_paczki
```



Paczka pobierająca treść z instagrama nazywa się Instaloader.

In [None]:
pip install instaloader

Pobierzemy obrazki profilowe [Messiego](https://www.instagram.com/leomessi) i [Ronaldo](https://www.instagram.com/cristiano/)

In [None]:
import instaloader
ig = instaloader.Instaloader()

GOAT = ["cristiano", "leomessi"]

for player in GOAT:
  ig.download_profile(player , profile_pic_only=True)

Foldery zawierające zdjęcia rodzin piłkarzy pojawiły się w miejscu skąd wykonaliści skrypt.

## Pętle bazujące na indeksach numerycznych

Czasami będziemy potrzebować wyjśc poza przegladanie wszystkich elementów listy. Wyobraźmy sobie, że chcemy dodać np. kilka elementów z dwóch list o róznych długościach. W takim przypadku pętla for będzie miała trochę inną konstrukcję.

Podstawowa wygląda następująco:

```
# for nazwa_zmiennej in range(początek,koniec)
```
Poniżej prosty przykład sumowania dwóch list:


In [None]:
lista1 = [1.2, 3.1, 4.3, 4,5]
lista2 = [1.1, .3, .5]

listaWynikow = []
for i in range(0,3):
  listaWynikow.append(lista1[i] + lista2[i])

print(listaWynikow)

**Ciekawostka:** Obiekt range działa bardzo podobnie do listy - można go zapisać do zmiennej.

In [None]:
zmiennaRange = range(0,3)

for i in zmiennaRange:
  print(i)

### Petle z dodatkową instrukcją krok (ang. step)
Możemy też dodać trzeci parametr, który opisuje o ile powiększać się ma wartość i z każdym wykonaniem pętli:

```
# for nazwa_zmiennej in range(początek,koniec, krok)
```
Jako przykład niech posłuży generowanie liczb parzystych:

In [None]:
listaParzystych = []
for i in range(2,22,2):
  listaParzystych.append(i)

print(listaParzystych)

**Uwaga:** Wartość kroku może być również ujemna. W takim przypadku nalezy jednak pilnować, aby pętla się kiedyś skończyła:

In [None]:
listaParzystych = []
for i in range(20,0,-2):
  listaParzystych.append(i)

print(listaParzystych)

### Przykład - odczytanie zawartości tysięcy plików CSV

Dobrym przykładem wykonania pętli jest przetworzenie informacji znajdujących sie w powtarzalnych plikach.

W naszym przypadku wykorzystamy dane z systemu Ministerstwa Finansów - [Bestia@](https://bestia-api.mf.gov.pl/dev/index.html)

Tam gdzie pojawiają się operacje tego typu będę wykorzystywał bibliotekę pandas i obiekt DataFrame - w uproszczeniu bardzo rozbudowana lista.

In [None]:
import pandas as pd

filePath = ""
fileName = "2021_1_GT0_rb28s_"

compiledDatabase = pd.read_csv(filePath + fileName + str(1)  + ".csv", encoding="windows-1250")
for i in range(2, 101):
    print(i)
    tempDatabase = pd.read_csv(filePath + fileName + str(i)  + ".csv", encoding="windows-1250")
    compiledDatabase = compiledDatabase.append(tempDatabase)

compiledDatabase.to_csv(filePath + "merged_data.csv", index = False, encoding="windows-1250")

## Uwaga: Częsty błąd - Usuwanie w pętli

Pętla nie służy do usuwania elementów - przy pierszej definicji pętla kształtuje to jak ma przejść po naszej strukturze. W momencie usunięcia elementu zmiana nie podlega aktualizacji. Takie pętle są niesterowne.

Zobaczmy poniższy przykład:

In [None]:
lista_usuwanie = [0.09, 0.5, "Do usunięcia", 0.6, "Do usunięcia", 0.66, "Do usunięcia", 0.08, 0.66, 0.21, 0.49, 0.31, 0.25,
                  "Do usunięcia", 0.61, 0.61, 0.47, 0.57, 0.09, 0.26, "Do usunięcia", 0.78, 0.71, 0.35, 0.36, 0.49,
                  "Do usunięcia", "Do usunięcia", 0.34, 0.02, ]

for element in lista_usuwanie:
  if element == "Do usunięcia":
    lista_usuwanie.remove(element)

print(lista_usuwanie)

Faktycznie lepiej filtrować elemetny, których nie chcemy usuwać

In [None]:
lista_usuwanie = [0.09, 0.5, "Do usunięcia", 0.6, "Do usunięcia", 0.66, "Do usunięcia", 0.08, 0.66, 0.21, 0.49, 0.31, 0.25,
                  "Do usunięcia", 0.61, 0.61, 0.47, 0.57, 0.09, 0.26, "Do usunięcia", 0.78, 0.71, 0.35, 0.36, 0.49,
                  "Do usunięcia", "Do usunięcia", 0.34, 0.02, ]

wynik = []
for element in lista_usuwanie:
  if element != "Do usunięcia":
    wynik.append(element)

print(wynik)

## Zagnieżdzanie pętli

W każdej pętli może znajdować się kolejna pętla. Budując takie konstrukcje trzeba pamiętać o kolejności wykonywania operacji:  

In [None]:
for i in range(0,5):
  for j in range (0,3):
    print(f'Pętla dla i = {i} oraz j ={j}')

## Przydatne linki:

* Ćwiczenia [W3 Schools](https://www.w3schools.com/python/exercise.asp?filename=exercise_for_loops1)
* Dokumentacja [Instaloader](https://instaloader.github.io/index.html)