# Podatkovni tipi v knjižnici `pandas`

Knjižnica [`pandas`](https://pandas.pydata.org/) omogoča procesiranje, obdelavo in analizo podatkov, shranjenih v podatkovno tabelo. Na začetku dela s knjižnico bomo najprej spoznali osnovne podatkovne tipe za sestavljanje tabel: zaporedje (angl. _Series_) in podatkovni okvir (angl. _DataFrame_), ki ga bomo imenovali tudi podatkovna tabela.

Podatkovna tabela v `pandas` je sestavljena iz vrstic in stolpcev, imenovanih tudi spremenljivke. Vsak stolpec v tabeli je tipe zaporedje. Stolpci (spremenljivke) so v podatkovnih tabelah posebnega pomena, saj večina operacij podatkovne obdelave in analize poteka na stolpcih. Zato bomo najprej dobro spoznali podatkovni tip zaporedje in se naučili delati s posameznimi stolpci tabele, nato pa se naučili delati s podatkovnimi okviri. Pri obdelavi zaporedij bomo si pogosto pomagali z izpeljanimi seznami, o katerih smo govorili v okviru uvodnega predavanja.

## Osnovni podatkovni tipi v zaporedjih

Podatkovni tip zaporedje (_Series_) v Pandasu je osnovna struktura za shranjevanje enodimenzionalnih podatkov. Zaporedje je podobno seznamu, vendar ima dodatne funkcionalnosti in je bolj prilagojeno obdelavi podatkov. Vsak element zaporedja je povezan z indeksom, kar olajša dostop do podatkov.

Zaporedje lahko ustvarimo na več načinov, a najbolj pogosto si bomo pomagali s seznamom ali slovarjem. V primeru, ko zaporedje ustvarimo iz seznama so njegovi indeksi zaporedna naravna števila, pri čemer je indeks prvega elementa, tako kot pri seznamih, enak 0. Zaporedje ustvarimo s pomočjo konstruktorja `pd.Series` takole:

In [1]:
import pandas as pd

s1 = pd.Series(range(10, 51, 10))
print(s1)

0    10
1    20
2    30
3    40
4    50
dtype: int64


Spoznajmo na začetku nekaj ključnih lastnosti (atributov) zaporedij:
* `size`: število elementov zaporedja, tudi dolžina zaporedja,
* `dtype`: podatkovni tip vrednosti v zaporedju,
* `values`: vrednosti elementov zaporedja, in
* `index`: indeksi elementov v zaporedju (podobno kot `keys` v slovarjih).

In [2]:
print(s1.size)
print(s1.dtype)

5
int64


Iz izpisa lahko torej ugotovimo, da ima zaporedje 5 elementov celoštevilskega tipa (`int64`). Poglejmo zdaj lastnost `values`:

In [3]:
print(type(s1.values))
print(s1.values)
print(s1.values.tolist())
print(type(s1.values.tolist()))

<class 'numpy.ndarray'>
[10 20 30 40 50]
[10, 20, 30, 40, 50]
<class 'list'>


Lastnost je polje, kot ga definira knjižnica `numpy` (`numpy.ndarray`). Izpis vrednosti nam pokaže elemente polja: dejstvo, da v izpisu ni vejic med zaporednimi elementi, nakazuje, da ne gre za navaden Pythonovski seznam. Slednjega lahko dobimo z uporabo metode `tolist()`.

Poglejmo si še lastnost `index`:

In [4]:
print(type(s1.index))
print(s1.index)
print(s1.index.tolist())
print(type(s1.index.tolist()))

<class 'pandas.core.indexes.range.RangeIndex'>
RangeIndex(start=0, stop=5, step=1)
[0, 1, 2, 3, 4]
<class 'list'>


Vidimo, da tudi ta lastnost je posebnega tipa, v tem primeru `RangeIndex`, ki ga lahko z uporabo metode `tolist()` pretvorimo v navaden seznam.

Kot smo povedali zgoraj so indeksi elementov zaporedja enaki prvim petim naravnim številom. Če želimo imeti poimenovane elemente, jim lahko imena dodamo na več načinov. En način, ki nam omogoča sprotno spreminjanje indeksov, je neposredno prirejanje, kot kaže ta primer:

In [5]:
s2 = s1.copy()
s2.index = list('abcde')
# Lahko tudi s2 = pd.Series(range(10, 51, 10), index = list('abcde'))
print(s2)

a    10
b    20
c    30
d    40
e    50
dtype: int64


Izpis nazorno pokaže, da so indeksi zadaj enaki prvim petim črkam angleške abecede:

In [6]:
print(type(s2.index))
print(s2.index)
print(s2.index.tolist())

<class 'pandas.core.indexes.base.Index'>
Index(['a', 'b', 'c', 'd', 'e'], dtype='object')
['a', 'b', 'c', 'd', 'e']


## Indeksiranje zaporedij

Posamezne elemente zaporedij lahko dobimo z uporabo običajnega indeksiranja, enakega tistemu za navadne Pythonovske sezname:

In [7]:
print(s1[1])
print(s2[1])

20
20


  print(s2[1])


Bodite pozorni na opozorilo pri drugem indeksiranju. Namreč, izraz `s2[1]` nima ravno smisla, saj ima zaporedje `s2` poimenovane indekse in bi bilo pravilno uporabiti ustrezni indeks:

In [8]:
print(s2['b'])

20


Opozorila ni več. Če želimo dobiti vrednost *drugega elementa* zaporedja `s2`, kjer npr. ne poznamo njegovega indeksa, to lahko storimo na dva načina:

In [9]:
print(s2[s2.index[1]])
print(s2.iloc[1])

20
20


Prvi sloni na očitni uporabi lastnosti `s2.index`: z indeksiranjem tega seznama indeksov dobimo pravi, poimenovani indeks drugega elementa zaporedja `s2`. Drugi način sloni na uporabi še enega načina indeksiranja zaporedij skozi lastnost `iloc`. Spoznajmo to lastnost bolj podrobno.

## Lastnosti zaporedij `iloc` in `loc`

Zaporedja imajo dve lastnosti, ki so nam lahko v pomoč pri njihovem indeksiranju.

Lastnost `iloc` uporabljamo za izbiranje elementov zaporedja `s` na podlagi njihovih *pozicij*, t.j., zaporednih celoštevilskih indeksov iz `range(s.size)` oz. seznama `[0, 1, ..., s.size]`.

In [10]:
print(s2.iloc[0])
print(s2.iloc[1:3])
print(s2.iloc[1:-2])
print(s2.iloc[:])

10
b    20
c    30
dtype: int64
b    20
c    30
dtype: int64
a    10
b    20
c    30
d    40
e    50
dtype: int64


Lastnost nam torej omogoča, da indeksiramo elemente zaporedja na enak način, kot smo vajeni indeksiranja elementov navadnega Pythonovskega seznama. Tako npr. indeks `[1:3]` nam indeksira drugi in tretji element seznama (ne pa četrtega, ker, *pozor*, indeks `3` ne sodi v območje `1:3`).

Bodite tudi pozorni na razliko med prvim rezultatom, ki je enostavnega celoštevilskega tipa, ker smo pač indeksirali zgolj en element zaporedja in ostalih treh. Slednji so vsi tipa zaporedje. Za vajo premisli kako bi rezultat indeksiranja spremenil v navaden seznam.

Lastnost `loc` je podobna `iloc` s pomembno razliko: omogoča nam indeksiranje zaporedij na osnovi **poimenovanih indeksov** in ne pozicijskih indeksov:

In [11]:
print(s2.loc['a'])
print(s2.loc['b':'d'])
print(s2.loc[:])

10
b    20
c    30
d    40
dtype: int64
a    10
b    20
c    30
d    40
e    50
dtype: int64


Čeprav se zdijo rezultati samoumevni, naj opozorim na eno stvar. Območje `'b':'d'` vključuje tudi zadnji indeks območja, `'d'`. *Pozor*: to je drugače kot pri številskem območju `1:3`, kjer indeks `3`, t.j., zgornja meja območja, ni vključen v seznam zahtevanih indeksov.

## O tipih elementov zaporedja

Elementi zaporedja so lahko mešanih tipov. Za tvorjenje takega zaporedja, bomo uporabili funkcijo `concat`, ki elemente večjega števila zaporedij iz podanega nabora združi skupaj v eno zaporedje:

In [12]:
s_int = pd.Series(range(3))
s_chr = pd.Series(list('abc'))
s_cuden = pd.concat((s_int, s_chr))
print(s_cuden)

0    0
1    1
2    2
0    a
1    b
2    c
dtype: object


Dobljeni seznam je čuden na več načinov. Najprej, med združevanjem dveh seznamov s celoštevilskimi elementi in nizi znakov, poenoti tipe elementov tako, da celoštevilski elementi dobijo nove vrednosti splošnega tipa `object`. Še bolj nenavadno je, da se indeksi v novem zaporedju ponavljajo. Pogljemo kako poteka indeksiranje z uporabo lastnosti `loc` v takem seznamu:

In [13]:
print(s_cuden.loc[0])

0    0
0    a
dtype: object


Hecno je, da indeksiranje z enim samim indeksom vrne zaporedje dveh elementov. Seveda se temu lahko izognemo tako, da uporabljamo pozicijski indeks:

In [14]:
print(s_cuden.iloc[3])

a


Za vajo popravi indekse zaporedja `s_cuden` tako, da se ne ponavljajo.

A pomemben nauk zgodbe je, da elementi zaporedja, tako kot elementi seznama, morajo biti istega tipa. Tip elementov nam pove lastnost zaporedja `dtype`: pogosto ta podatkovni tip imenujemo **tip zaporedja**. Poglejmo zdaj nekaj tipov zaporedij, ki pridejo prav pri podatkovni analizi.


## Kategorije (angl. _categories_)

V vseh dosedanjih primerih smo tvorili zaporedja celoštevilskega tipa ali zaporedja nizov znakov. Kategorije so posebni tip zaporedij, katerih vrednosti elementov so iz omejene množice možnih vrednosti. Primer takega zaporedja zapisuje barve opazovanih objektov, pri čemer je posamezen objekt lahko rdeče, zelene ali modre barve.

Tako zaporedje bi seveda lahko zapisali kot navadno zaporedje nizov znakov:

In [15]:
from random import seed, sample

seed(42)

barve = ['rdeča', 'zelena', 'modra']
s_barve = pd.Series(sample(barve, counts = [10, 10, 10], k = 10))
print(s_barve)

0     modra
1     rdeča
2     rdeča
3     modra
4     rdeča
5     rdeča
6     modra
7     rdeča
8     modra
9    zelena
dtype: object


Slabost tega zaporedja je v tem, da pri spreminjanju vrednosti obstoječih elementov nimamo kontrole nad množico dovoljenih vrednosti. Lahko naredimo napako pri poimenovanju barve in pri tem ne dobimo nobenega opozorila:

In [16]:
s_barve[9] = 'rdeca'
print(s_barve)

0    modra
1    rdeča
2    rdeča
3    modra
4    rdeča
5    rdeča
6    modra
7    rdeča
8    modra
9    rdeca
dtype: object


Če pa ustvarimo kategorijo:

In [17]:
s_barve = pd.Series(sample(barve, counts = [10, 10, 10], k = 10), dtype="category")
print(s_barve)

0     rdeča
1    zelena
2    zelena
3     rdeča
4     rdeča
5     modra
6     rdeča
7     rdeča
8    zelena
9    zelena
dtype: category
Categories (3, object): ['modra', 'rdeča', 'zelena']


dobi ustvarjeno zaporedje lastnost, ki določa množico možnih vrednosti (glej zadnjo vrstico izpisa). Poskus prirejanja vrednosti elementa, ki ni v množici možnih vrednosti kategorije, se konča z napako `TypeError` takole:

In [18]:
s_barve[9] = "rdeca"
print(s_barve)

TypeError: Cannot setitem on a Categorical with a new category (rdeca), set the categories first

Za razliko od tega, prirejanje vrednosti iz množice možnih vrednosti je uspešno:

In [19]:
print(s_barve.cat.categories.tolist())
s_barve[9] = "rdeča"
print(s_barve)

['modra', 'rdeča', 'zelena']
0     rdeča
1    zelena
2    zelena
3     rdeča
4     rdeča
5     modra
6     rdeča
7     rdeča
8    zelena
9     rdeča
dtype: category
Categories (3, object): ['modra', 'rdeča', 'zelena']


### Dodatne prednosti kategorij

Poleg kontrole nad množico možnih vrednosti, imajo kategorije še dve pomembni lastnosti, ki še posebej pridejo do izraza pri obdelavi in analizi podatkov.
   * Zmanjšanje porabe pomnilnika: kategorije zasedajo manj pomnilnika kot nizi ali števila, saj se vsaka možna vrednost shrani samo enkrat, in nato se uporabijo celoštevilski indeksi za sklicevanje nanje.
   * Hitrejše delovanje: ker so kategorije predhodno določene, so operacije, kot je iskanje ali filtriranje, običajno hitrejše v primerjavi z nizi znakov.
   * Bolj pregledne statistične obdelave in vizualizacijo: lahko npr. izračunamo porazdelitev vrednosti zaporedja po kategorijah ali pa izračunamo povprečne vrednosti neke druge spremenljivke za različne kategorije in podobno.

*Pozor*: v zadnji alineji zgoraj smo besedo kategorije uporabili kot okrajšavo za `možne vrednosti kategorije`. To se dogaja pogosto v obdelavi podatkov, beseda kategorija bo včasih uporabljena za določanje tipa zaporedja, včasih pa za eno možno vrednost elementov zaporedja. Običajno je iz konteksta razviden specifičen pomen besede.
   

### Dodajanje novih možnih vrednosti

Kot smo videli v zgornjem primeru, je seznam možnih kategorij dosegljiv čez lastnost `cat` zaporedja tipa kategorije. Spomnimo se:

In [20]:
print(s_barve.cat.categories.tolist())

['modra', 'rdeča', 'zelena']


Isto lastnost lahko uporabimo tudi za spreminjanje nabora možnih vrednosti. Lahko dodamo novo barvo, ali zbrišemo obstoječo:

In [21]:
s_barve = s_barve.cat.add_categories("rumena")
print(s_barve)
s_barve = s_barve.cat.remove_categories("rdeča")
print(s_barve)

0     rdeča
1    zelena
2    zelena
3     rdeča
4     rdeča
5     modra
6     rdeča
7     rdeča
8    zelena
9     rdeča
dtype: category
Categories (4, object): ['modra', 'rdeča', 'zelena', 'rumena']
0       NaN
1    zelena
2    zelena
3       NaN
4       NaN
5     modra
6       NaN
7       NaN
8    zelena
9       NaN
dtype: category
Categories (3, object): ['modra', 'rumena', 'zelena']


Pojasni pojav neznanih vrednosti `NaN` v zadnjem zaporedju.

### Urejene kategorije

Možne vrednosti kategorije so v splošnem neurejene. V zgornjem primeru z barvami je to seveda prav, saj ne poznamo relacije urejenost med barvami, a pri kakšnih kategorijah je smiselno imeti urejenost možnih vrednosti. Vzemimo za primer starostne skupine:

In [22]:
from pandas.api.types import CategoricalDtype

starostne_skupine = ["otrok", "najstnica", "mladostnica", "odrasla"]
kat_ss = CategoricalDtype(starostne_skupine, ordered = True)
starost = pd.Series(sample(starostne_skupine, counts = [10 for _ in range(len(starostne_skupine))], k = 10))
s_starost = starost.astype(kat_ss)
print(s_starost)

0          otrok
1        odrasla
2      najstnica
3        odrasla
4    mladostnica
5      najstnica
6    mladostnica
7      najstnica
8          otrok
9    mladostnica
dtype: category
Categories (4, object): ['otrok' < 'najstnica' < 'mladostnica' < 'odrasla']


Znaki `<` v seznamu kategorij na koncu izpisa nakazujejo, da je kategorija starostna skupina urejena ter hkrati nakazujejo urejenost možnih vrednosti kategorije.

Urejene kategorije pogosto tvorimo z *diskretizacijo* numeričnih vrednosti. Diskretizacija pomeni, da numerično spremenljivko (zaporedje) spremenimo v zaporedje diskretnih, običajno urejenih, vrednosti. V primeru starosti, pri osebah običajno opazujemo starost v letih. Z uporabo funkcije `cut` lahko starost podano v letih pretvorimo v starostne skupine iz prejšnjega primera:

In [23]:
starost_v_letih = pd.Series(sample(range(100), k = 10))
print(starost_v_letih)
starostne_meje = [-100, 12, 19, 27, 1000]
starost_kat = pd.cut(starost_v_letih, starostne_meje, labels = starostne_skupine)
print(starost_kat)

0    20
1    89
2    54
3    43
4    35
5    19
6    27
7    97
8    13
9    11
dtype: int64
0    mladostnica
1        odrasla
2        odrasla
3        odrasla
4        odrasla
5      najstnica
6    mladostnica
7        odrasla
8      najstnica
9          otrok
dtype: category
Categories (4, object): ['otrok' < 'najstnica' < 'mladostnica' < 'odrasla']


Rezultat funkcije `cut` je torej urejena kategorija, nabor določenih vrednosti pa sledi vrednosti argumenta `labels`. Drugi argument funkcije določa seznam mej med starostnimi skupinami in mora biti torej z ena daljši od argumenta `labels`. Prvi argument funkcije je pa originalno zaporedje z numeričnimi vrednostmi.

## Datum in čas

V podatkovni analizi pogosto srečujemo časovna zaporedja, ki jih knjižnica `pandas` podpira s tremi podatkovnimi tipi:
    * *Časovna točka* (angl. _Date times_) je tipa `Timestamp`,
    * *Časovna razlika* (angl. _Time deltas_) je tipa `Timedelta`, in
    * *Časovno obdobje* (angl. _Period_) je tipa `Period`.

### Časovne točke

Časovno zaporedje lahko ustvarimo iz seznama nizov znakov, ki vsebuje datume zapisane v različnih formatih, s funkcijo `pd.to_datetime`:

In [24]:
s_datumi = pd.to_datetime(pd.Series(["Jul 31, 2009", "Jan 10, 2010", "10-Oct-2023", None]), format = "mixed")

Ko izhodiščni seznam vključuje datume različnih formatov, je ključnega pomena, da pri pretvorbi nastavimo vrednost argumenta `format = "mixed"`.

Drugi, zelo pogosto način ustvarjanja časovnih zaporedij je z uporabo funkcije `pd.date_range`:

In [25]:
s_ct1 = pd.Series(pd.date_range("2023-10", freq = "D", periods = 10))
print(s_ct1)
s_ct2 = pd.Series(pd.date_range("2022-09", freq = "W-Mon", periods = 10))
print(s_ct2)

0   2023-10-01
1   2023-10-02
2   2023-10-03
3   2023-10-04
4   2023-10-05
5   2023-10-06
6   2023-10-07
7   2023-10-08
8   2023-10-09
9   2023-10-10
dtype: datetime64[ns]
0   2022-09-05
1   2022-09-12
2   2022-09-19
3   2022-09-26
4   2022-10-03
5   2022-10-10
6   2022-10-17
7   2022-10-24
8   2022-10-31
9   2022-11-07
dtype: datetime64[ns]


V prvem primeru smo ustvarili zaporedje desetih zaporednih dni na začetku oktobra 2023. V drugem primeru pa zaporedje desetih ponedeljkov od začetka septembra 2022.

Časovno zaporedje lahko uporabimo tudi kot indeks za neko drugo zaporedje opazovanih vrednosti, pravzaprav časovno vrsto opazovanih vrednosti:

In [26]:
cv = pd.Series([i / 10 for i in range(10)], index = s_ct2)
print(cv)

2022-09-05    0.0
2022-09-12    0.1
2022-09-19    0.2
2022-09-26    0.3
2022-10-03    0.4
2022-10-10    0.5
2022-10-17    0.6
2022-10-24    0.7
2022-10-31    0.8
2022-11-07    0.9
dtype: float64


Indeksiranje v takih primerih zelo prilagodljivo upošteva podan datum, tudi kot časovno obdobje. Tako na primer, zelo enostavno zajamemo del časovne vrste izmerjen v oktobru 2022:

In [27]:
cv_oktobra_22 = cv["2022-10"]
print(cv_oktobra_22)

2022-10-03    0.4
2022-10-10    0.5
2022-10-17    0.6
2022-10-24    0.7
2022-10-31    0.8
dtype: float64


Časovna zaporedja imajo lastnost `dt`, ki ima veliko različnih metod za računanje različnih datumskih funkcij:

In [28]:
print(s_ct1.dt.day_of_week)
print(s_ct1.dt.day_name())

0    6
1    0
2    1
3    2
4    3
5    4
6    5
7    6
8    0
9    1
dtype: int32
0       Sunday
1       Monday
2      Tuesday
3    Wednesday
4     Thursday
5       Friday
6     Saturday
7       Sunday
8       Monday
9      Tuesday
dtype: object


Lahko torej za podan datum dobimo dan v tednu z indeksom ali imenom v angleščini. Indeks je na mojem računalniku izračunan tako, da vrednost `0` ustreza ponedeljku, `6` pa nedelji.

Preveri indekse dneva v tednu na svojem računalniki. Za vajo napiši funkcijo, ki za podano datumsko zaporedje vrne zaporedje imen dni v tednu v slovenščini. Pri tem lahko seveda uporabiš zgornjo funkcijo, ki vrne indeks dneva v tednu.

S pomočjo lastnosti časovne točke `dt` lahko izračunamo še veliko drugih časovnih in datumskih funkcij, na primer:

In [29]:
print(s_ct2.dt.isocalendar().week)
print(s_ct2.dt.day_of_year)

0    36
1    37
2    38
3    39
4    40
5    41
6    42
7    43
8    44
9    45
Name: week, dtype: UInt32
0    248
1    255
2    262
3    269
4    276
5    283
6    290
7    297
8    304
9    311
dtype: int32


### Časovne razlike

Časovna razlika nastane npr. z odštevanjem časovnih točk:

In [30]:
s_ct1 - s_ct2

0   391 days
1   385 days
2   379 days
3   373 days
4   367 days
5   361 days
6   355 days
7   349 days
8   343 days
9   337 days
dtype: timedelta64[ns]

Lahko jo tudi ustvarimo s funkcijami `pd.Timedelta`:

In [31]:
s_cr1 = pd.Series([pd.Timedelta(i, unit = "d") for i in range(1, 11)])
print(s_cr1)

0    1 days
1    2 days
2    3 days
3    4 days
4    5 days
5    6 days
6    7 days
7    8 days
8    9 days
9   10 days
dtype: timedelta64[ns]


ali pa `pd.to_timedelta`:

In [32]:
s_cv = pd.Series(range(10), index = pd.to_timedelta(range(1, 11), unit="s"))
print(s_cv)

0 days 00:00:01    0
0 days 00:00:02    1
0 days 00:00:03    2
0 days 00:00:04    3
0 days 00:00:05    4
0 days 00:00:06    5
0 days 00:00:07    6
0 days 00:00:08    7
0 days 00:00:09    8
0 days 00:00:10    9
dtype: int64


Časovne razlike torej, tako kot časovne točke, lahko uporabljamo kot indekse zaporedja.

### Časovna obdobja

Morebiti manj uporaben podatkovni tip kot prejšnja dva je še časovno obdobje. Poglejmo uporabo funkcije `period_range` za ustvarjanje časovnih obdobij:

In [33]:
s_co1 = pd.Series(pd.period_range("2023-10", freq = "D", periods = 10))
print(s_co1)
s_co2 = pd.Series(pd.period_range("2022-09", freq = "W-Mon", periods = 10))
print(s_co2)

0    2023-10-01
1    2023-10-02
2    2023-10-03
3    2023-10-04
4    2023-10-05
5    2023-10-06
6    2023-10-07
7    2023-10-08
8    2023-10-09
9    2023-10-10
dtype: period[D]
0    2022-08-30/2022-09-05
1    2022-09-06/2022-09-12
2    2022-09-13/2022-09-19
3    2022-09-20/2022-09-26
4    2022-09-27/2022-10-03
5    2022-10-04/2022-10-10
6    2022-10-11/2022-10-17
7    2022-10-18/2022-10-24
8    2022-10-25/2022-10-31
9    2022-11-01/2022-11-07
dtype: period[W-MON]


Primerjaj rezultat s primeri časovnih točk zgoraj. Delo s časovnimi obdobji je podobno delu s časovnimi točkami.

## Naloge za vajo

1. Denimo, da smo Alešu, Barbari, Cirilu in Darji izmerili višine v centimetrih (180, 165, 160, 193) in teže v kilogramih (87, 58, 65, 100). Naredi dve zaporedji `v` in `t` z izmerjenimi podatki. Indeks telesne mase (ITM) izračunamo po formuli

    $$ \text{ITM} = \frac{\text{teža v kilogramih}}{(\text{višina v metrih})^2}. $$

    Izračunaj zaporedje vrednosti ITM s poimenovanimi indeski za štiri osebe, kjer so indeksi elementov dejanska imena oseb (Aleš, Barbara, Ciril in Darja). Nato izračunaj zaporedje naravnih logaritmov vrednosti ITM. Na koncu izpiši zaporedje imen oseb, ki imajo ITM večji od 25, ter izračunaj njihov povprečni ITM.

1. Sestavi zaporedja z naslednjimi elementi:

    * $3^1/1, 3^2/2, \ldots, 3^{50}/50$;
    * "A1", "A2", $\ldots$, "A50";
    * $e^x \sin x$ izračunanimi v točkah $x = 3, 3.1, 3.2, \ldots, 6$.<br><br>

1. Z uporabo zaporedij definiraj funkcijo, ki kot argument sprejme naravno število `x > 2`, vrne rezultat `True`, če je `x` praštevilo, in `False` sicer. Namig: zaporedje gradi postopoma. Najprej izračunaj zaporedje ostankov deljenja `x` z vsemi števili od `2` do `x - 1`. Nato preveri, če je `0` element tega zaporedja.

1. Izračunaj dve zaporedji `x` in `y` dolžine 250 tako, da s ponavljanjem naključno izbiraš naravna števila iz intervala $[0, 999]$. Označimo z $x_1, x_2, \ldots, x_{250}$ in $y_1, y_2, \ldots, y_{250}$ elemente zaporedij `x` in `y`. Izračunaj:

    * Zaporedje z elementi $y_2 - x_1, y_3 - x_2, \ldots, y_{250} - x_{249}$.
    * Vsoto $\sum_{i=1}^{249} e^{- x_{i+1}} / (x_i + 10)$.<br><br>
