# 8. Pętla `for` i warunki w `awk`

Pętle i instrukcje warunkowe są również zaimplementowane w języku skryptowym awk. Poniżej przedstawione są sposoby jak z nich korzystać.

## 8.1 Instrukcja warunkowa w `awk`

Ta intrukcja służy do tworzenia warunków (który zostanie zinterpretowany jako wartość logiczna __true (prawda)__ lub __false (fałsz)__. Jeśli podany przez nas warunek będzie spełniony, możemy wyspecyfikować jakie komendy mają zostać wykonane, także co skrypt ma zrobić jeśli warunek nie będzie spełniony. Schemat takiej instrukcji dla komend __jednolinijkowych__ jest przedstawiony poniżej:

Schemat `if`. Jak widać, w przeciwieństwie do równoważnej komendy w `bash`-u, nie ma słowa `then` oraz nie kończy się wyrażenia słowem `fi`.
```bash
awk '{if(warunek) {nasze komendy}' plik
```

Schemat `if-else` (czyli co skrypt ma zrobić gdy warunek nie będzie spełniony)
```bash
awk '{if(warunek) {nasze komendy} else {inne komendy}}'  plik
```

Schemat z `else if` (tych warunków możemy dodać tyle ile chcemy)
```bash
awk '{if(warunek) {nasze komendy} else if (inny warunek) {inny komendy} else {jeszcze inne komendy}}'  plik
```

__Przykład jednolinijkowy:__

Zawartośc pliku `liczby.dat`
```bash
1
2
3
4
5
6
7
8
9
```

In [2]:
awk '{if($1>5) {print $1" jest wieksza niz 5"} else {print $1" jest mniejsza niz 5"}}' liczby.dat

1 jest mniejsza niz 5
2 jest mniejsza niz 5
3 jest mniejsza niz 5
4 jest mniejsza niz 5
5 jest mniejsza niz 5
6 jest wieksza niz 5
7 jest wieksza niz 5
8 jest wieksza niz 5
9 jest wieksza niz 5


Można udoskonalić:

In [3]:
awk '{if($1>5) {print $1" jest wieksza niz 5"} else if($1==5) {print $1" rowne 5"} else {print $1" jest mniejsza niz 5"}}' liczby.dat

1 jest mniejsza niz 5
2 jest mniejsza niz 5
3 jest mniejsza niz 5
4 jest mniejsza niz 5
5 rowne 5
6 jest wieksza niz 5
7 jest wieksza niz 5
8 jest wieksza niz 5
9 jest wieksza niz 5


Jak można zauważyć, bardziej skomplikowane komendy jednolinikowe są mało czytelne. Jeśli piszemy taką komendę w skrypcie, to warto ją odpowiednio sformatować - znacznie zwiększy to czytelność takiego kodu.
__Przykład:__

Skrypt sprawdzi, czy liczby w pliku są większe/mniejsze/równe 5. Oczywiście nie zostały tu obsłużone błędy jak np. podanie litery lub innego znaku zamiast liczby.

Zawartość `ifnumber.bash`:
```bash
#!/bin/bash
awk '{
if ($1 == 5 )
{
    print "Gratulacje, Twoja liczba jest rowna dokladnie 5"
} 
else if ($1 > 5)
{
    print "Twoja liczba jest większa od 5"
}
else
{
    print "Twoja liczba jest mniejsza niż 5"
}
'} liczby.dat
```

In [1]:
bash ifnumber.bash liczby.dat

Twoja liczba jest mniejsza niż 5
Twoja liczba jest mniejsza niż 5
Twoja liczba jest mniejsza niż 5
Twoja liczba jest mniejsza niż 5
Gratulacje, Twoja liczba jest rowna dokladnie 5
Twoja liczba jest większa od 5
Twoja liczba jest większa od 5
Twoja liczba jest większa od 5
Twoja liczba jest większa od 5


## 8.2 Instrukcja warunkowa - jaki warunek?

Próbując zdefiniować warunek w `bash`-u trzeba wiedzieć, że istnieją różne sposoby jego formułowania. Można podzielić je na 3 typy w zależności od konstrukcji, a każdy z nich ma również swoje podtypy:
 - za pomocą pojedynczych nawiasów kwadratowych `[ warunek ]`
  - działające na plikach
  - działające na ciągach znaków
  - działające na liczbach
 - za pomocą podwójnych nawiasów kwadratowych  `[[ warunek ]]` - rozszerza/zmienia możliwości warunku w pojednyczych nawiasach kwadratowych
  - działające na plikach, ale np. plik `*.bash` rozpozna dosłownie jako `*.bash` a nie wszystkie pliki z roszerzeniem `.bash`
  - działające na ciągach znaków, ale np. umożliwia stosowanie wyrażeń regularnych
  - działające na liczbach, ale np. dopuszcza stosowanie operatorów logicznych do łączenia warunków, np. `&&`
 - za pomocą podwójnych nawiasów zwykłych `(( warunek ))`
 
 Jest tego dużo i omówię tylko kilka przykładów, natomiast dobre opracowanie znajduje się na stronie do której link podaję poniżej.<br>
 https://linuxacademy.com/blog/linux/conditions-in-bash-scripting-if-statements/


__1) Przykład z warunkiem na ciągu znaków. Sprawdzam, czy podany e-mail w pliku ma właściwą konstrukcję. Znak `~` służy do porównania z wyrażeniem regularnym, które należy opakować w znaki ukośnika__ `/REGEX/`__:__

Zawartość `mail_list.dat`:
```bash
kotysz@astro.uni.wroc.pl
krzysztof.kotysz@uwr.edu.pl
adres@email
123456
```

Zawartość `ifemail.bash`:
```bash
#!/bin/bash
awk '{
if ($1 ~ /^[A-Za-z0-9\._%+-]+@[A-Za-z0-9\.-]+\.[A-Za-z]{2,4}$/)
{
    print "Adres "$1" jest prawidłowy"
}
else
{
    print "Adres "$1" jest nieprawidłowy"
}
'} mail_list.dat
```

In [7]:
bash ifemail.bash

Adres kotysz@astro.uni.wroc.pl jest prawidłowy
Adres krzysztof.kotysz@uwr.edu.pl jest prawidłowy
Adres adres@email jest nieprawidłowy
Adres 123456 jest nieprawidłowy


__W `awk` porównywanie liczb (także rzeczywistych), czy ciągów znaków odbywa się w tej samej konstrukcji, nie ma rozróżnienia ze względu na rodzaj nawiasu.__

## 8.3 Pętla `for` w `awk`

Pętla `for` umożliwia wielokrotne wykonanie danej komendy (tzw. iterowanie) z góry określoną liczbę razy. Za każdym razem, kiedy uruchamiać się będzie nowe powtórzenie pętli, możemy wykonać tę samą czynność z inną zmienną. W `awk` ma trochę odmienna postać niż w `bash`-u - zlicza kolejne iteracje pętli. Składnia pętli `for` jest następująca:

```bash
awk '{for(zainicjowanie_zmiennej; warunek_konca; wzrost_zmiennej) {działanie} '}
```

Wartości mogą być zdefiniowane przez liczby, pliki lub też wynik działania komendy. Poniżej 3 przykłady.

__1) Przykład pętli `for` po zakresie liczb:__

Zawartość `for_num.bash`:
```bash
#!/bin/bash
awk 'BEGIN{
for(i=1; i<=10; i++)
    print i
}'

```

In [11]:
bash for_num.bash    # wartość zmiennej `i` przyjmuje wartości od 1 do 10 z krokiem 1 i za każdym razem jest wypisywana

1
2
3
4
5
6
7
8
9
10


__2) Przykład pętli `for` po tablicy:__

Zawartość `for_array.bash`:
```bash
#!/bin/bash
awk 'BEGIN{
   owoce["ananas"] = "zolty";
   owoce["pomarancza"] = "pomaranczowy";
   owoce["kiwi"] = "zielony";
   owoce["granat"] = "czerwony";
for(i in owoce)
    print i
}'
```

In [13]:
bash for_array.bash

pomarancza
granat
ananas
kiwi


## 8.4 Przerywanie `break` i kontynuacja `continue` pętli w `awk`

__Można wymusić przerwanie pętli, gdy np. spełniony zostanie jakiś warunek. Używa się do tego komendy `break`.__

Zawartość `for_break.bash`:<br>
Przykład skryptu, który znajduje najmniejszy dzielnik liczby.

```bash
#!/bin/bash
awk '{
    liczba = $1;
    for (dzielnik = 2; dzielnik * dzielnik <= liczba; dzielnik++)
    {
        if (liczba % dzielnik == 0)
        {
            break
        }
    };

    if (liczba % dzielnik == 0)
    {
        printf("Najmniejszy dzielnik %d to %d\n", liczba, dzielnik)
    }    
    else
    {
    printf("%d jest liczba pierwsza\n", liczba)
    }
}' liczby.dat
```

In [14]:
bash for_break.bash

1 jest liczba pierwsza
Najmniejszy dzielnik 2 to 2
3 jest liczba pierwsza
Najmniejszy dzielnik 4 to 2
5 jest liczba pierwsza
Najmniejszy dzielnik 6 to 2
7 jest liczba pierwsza
Najmniejszy dzielnik 8 to 2
Najmniejszy dzielnik 9 to 3


__Alternatywnie można pominąć pętlę, gdy spełniony zostanie określony warunek. Używa się do tego komendy `continue`.__

Zawartość `for_continue.bash`:<br>
Tutaj pętla wykona się 20 razy, ale gdy wartość zmiennej nie jest podzielna przez 5, to pętla pominie resztę komend i przejdzie do nowego wykonania pętli.
```bash
#!/bin/bash
awk 'BEGIN {
    for (x = 0; x <= 20; x++)
    {
        if (x % 5)
        {
            continue
        }
        printf "%d ", x
    }
    print ""
}'
```

In [17]:
bash for_continue.bash

0 5 10 15 20 


## 8.5 Generowanie komend przy pomocy `awk`

Przy pomocy `awk` i wykorzystania pętli, można również w łatwy sposób generować komendy, które potem będa uruchomione w `bash`-u. Jest to sprytny sposób na szybkie wykonanie wielu komend, który daje więcej możliwości formatowania oraz pozwala na wykrycie błędów zanim się daną komende uruchomi

Np. Można wygenerować liste komend, które np. działają na skrypcie `gcd.sh` który szuka NWD dwóch liczb.

In [65]:
awk 'BEGIN{for(i=1;i<=5;i=i+0.5)printf("./gcd.sh 10 %.1f\n",i)}'

./gcd.sh 10 1,0
./gcd.sh 10 1,5
./gcd.sh 10 2,0
./gcd.sh 10 2,5
./gcd.sh 10 3,0
./gcd.sh 10 3,5
./gcd.sh 10 4,0
./gcd.sh 10 4,5
./gcd.sh 10 5,0


In [39]:
awk 'BEGIN{for(i=1;i<=5;i=i+0.5)printf("./gcd.sh 10 %.1f\n",i)}' | bash

1,0
0,5
2,0
2,5
1
0,5
2
0,5
5,0


Inny przykładem jest generowanie komend do działania na plikach, np. kopiowanie lub tworzenie katalogów:

In [43]:
awk 'BEGIN{for(i=2;i<=16;i=i+2)printf("touch kat_%d\n",i)}'

touch kat_2
touch kat_4
touch kat_6
touch kat_8
touch kat_10
touch kat_12
touch kat_14
touch kat_16


In [63]:
awk 'BEGIN{for(i=2;i<=16;i=i+2)printf("touch kat_%d\n",i)}' | bash  # wygeneruje parzyste katalogi

In [62]:
for i in $(seq 1 2 16); do echo "touch kat_$i"; done | bash  # wygeneruje nieparzyste katalogi

In [64]:
ls kat*

kat_1  kat_11 kat_13 kat_15 kat_2  kat_4  kat_6  kat_8
kat_10 kat_12 kat_14 kat_16 kat_3  kat_5  kat_7  kat_9
