# Zbirka *string*

U ovoj bilježnici nalazi se detaljniji pregled svega što se može raditi sa stringovima kao tipom podataka u Pythonu. Dio stvari koji se ovdje spominje se jednako ponaša i u drugim zbirkama (eng. collections) i ti dijelovi će biti napomenuti.

## Svojstva *stringa* kao zbirke

String je složeni tip podataka, tj. zbirka, koja se sastoji od niza znakova. Svi znakovi imaju svoj određeni redoslijed koji je utvrđen **indeksom**. Npr. string:

> `prizma`

>  `012345`

Prvo slovo počinje na broju nula. Detaljniji primjeri s indeksiranjem će biti pokazani kasnije, a npr. *liste* također imaju indekse koji se ponašaju identično kao ovi od stringova.

Unutar pythona svi stringovi su zamišljeni kao **nemutirajući** - ovo znači da niti jedna od metoda i funkcija koje rade sa stringovima *ne mijenjaju originalni string*, već ako želimo raditi promjene na stringu radimo novu kopiju stringa koji će sadržavati te promjene.

## Indeksiranje

Indeksiranje radi jednako sa svim zbirkama koje ga podržavaju (npr. stringovi i liste), tako da ćemo ovdje proći sve detalje, a način korištenja će biti isti i kod zbirki koje ćemo raditi kasnije.

In [None]:
# hint: pritisni ▶ pored ćelije da bi se kod izvršio
s = "prizma"
print(s[0]) # dohvaćanje jednog znaka
print(s[-1]) # postoje i indeksi unazad

Kada gledamo indekse s lijeva na desno (od početka stringa) počinju s 0 i povećavaju se. No postoji i indeksiranje s desna na lijevo, tj. od kraja stringa. Koji oblik ćemo koristiti ovisi o problemu koji rješavamo. Na gornjem primjeru oba tipa indeksa bi izgledala ovako:

|p|r|i|z|m|a|
|-|-|-|-|-|-|
|0|1|2|3|4|5|
|-6|-5|-4|-3|-2|-1|

Važno je da indeksi koje koristimo zapravo odgovaraju indeksima koji postoje u danom stringu. Ako izađemo iz raspona indeksa Python će nam za takvu situaciju javiti grešku:

In [None]:
s[12] #najveći indeks je 5 tako da ovo ne može raditi

### Rasponi indeksa

Neki puta želimo odabrati ne samo jedan od znakova iz stringa već raspon od više znakova. Rasponi se označavaju sa dvotočkom `[početak : kraj>` i početni indeks je uključen u raspon dok kraj nije.

In [None]:
s = "može i neka rečenica"
print(s[0:3]) # ovo dohvaća znakove s indeksa 0-2
print(s[:5]) # 0 možemo izostaviti ako krećemo od početka stringa
print(s[3:]) # ako izostavimo krajnji indeks onda se podrazumjeva da raspon ide do kraja
print(s[1:10:2]) # raspon može imati i korak. ovo uzima svaki drugi znak na indeksima 1-9
print(s[:11:-1]) # ako stavimo negativan korak raspon ide u suprotnom smjeru

**1. Primjer**

Napiši program koji od korisnika traži upis jedne riječi, a na ekranu ispisuje novu riječ koja se sastoji od prva dva i zadnja dva znaka te riječi. Ako je riječ duga 4 ili manje znakova onda bi se trebala ispisati originalno upisana riječ.

*Rješenje:*

In [None]:
unos = input("Upiši jednu riječ: ")
print("Upisana riječ:", unos)
if len(unos) <= 4:
    print("Nova riječ je:", unos)
else:
    print("Nova riječ je:", unos[:2]+unos[-2:])

### Operatori za stringove

Za stringove je definirano nekoliko operatora koji se mogu koristiti za direktno manipuliranje:

In [None]:
s1 = "zec"
s2 = "gadiš mi se"

print(s1+" "+s2) # zbrajanje stringova ih spaja zajedno
print(3*s1) # ako string množimo sa integerom to će umnožiti string toliko puta
print("patak" in s2) # in operator se koristi za provjeru je li neki string sadržan u nekom drugom stringu
print("patak" not in s2) # not in je negirana verzija, oboje vraćaju logičku vrijednost

### Funkcije i metode za stringove

Za početak ćemo proći nekoliko funkcija koje općenito rade sa zbirkama (pa tako i sa stringovima), no koje su često korisne za stringove:
|Ime funkcije|Što funkcija radi|
|:-|:-|
|`len(zbirka)`|Rezultat je broj elemenata zbirke. Za stringove će ovo vratiti broj znakova|
|`min(zbirka)`|Vraća element zbirke s najmanjom vrijednosti|
|`max(zbirka)`|Vraća element zbirke s najvećom vrijednosti|

In [None]:
s = "Ovo je primjer rečenice."
print("Duljina stringa:",len(s))
print("Element s najmanjom vrijednosti:", min(s))
print("Element s najvećom vrijednosti:", max(s))

Za stringove minimalna i maksimalna vrijednost se utvrđuje prema brojčanoj vrijednosti koju svaki znak ima u UNICODE kodnoj tablici. Iz ovog razloga za stringove imano nekoliko funkcija koje specifično rade sa znakovima:
|Ime funkcije|Što funkcija radi|
|:-|:-|
|`ord(znak)`|ord kao argument uzima string koji se sastoji od točno jednog znaka i daje nam brojčanu vrijednost tog znaka|
|`chr(vrijednost)`|chr kao argument uzima integer vrijednost i ispisuje nam koji znak odgovara toj vrijednosti prema UNICODE tablici|
|`str(objekt)`|Pretvara neki drugi tip podataka u string|

In [None]:
print(ord(" ")) #interpunkcijski znakovi i znamenke imaju male vrijednosti
print(ord("a")) #mala slova zapravo imaju veće vrijednosti od velikih
print(ord("A"))
print(ord("š")) #"naši" znakovi ne spadaju isti redoslijed po vrijednosti kao ovi za englesku abecedu
print(ord("❤")) #emoji isto imaju svoje vrijednosti

In [None]:
print(chr(65)) # veliko slovo A u engleskoj abecedi
print(chr(ord("A")+3)) # A+3 = D jer je D za tri znaka dalje u engleskoj abecedi
print(chr(0x1F602)) # ovako se može unositi heksadecimalne vrijednosti direktno s unicode-table.com

In [None]:
print(str(65)) # pretvara broj u string
print(str([1,2,3,4])) # i lista se može pretvoriti u string

Osim ovih funkcija stringovi imaju cijeli niz metoda. Metodama se kao i za sve ostale objekte pristupa pomoću točka operatora pa ih nije nužno pamtiti napamet jer će vam se u bilo kojem okruženju za programiranje nakon što unesete `.` prikazati popis metoda (ako se slučajno zatvorio uvijek ga možete vratiti pomoću Ctrl+Space). Metode ćemo raditi na odvojenim primjerima onda kako će nam trebati.

**2. primjer**

Napišite program koji korisniku omogućava unos riječi i indeksa zajedno, odvojene zarezom. Npr:

> `informatika,6`

Program treba ispisati riječ bez slova koje se nalazi na indeksu, a ako je uneseni indeks nevažeći onda se ne radi ništa.

Rješenje:

In [None]:
unos = input("Upiši riječ i indeks odvojen zarezom")
print("Upisana riječ:", unos)
# metoda .split() razdvaja string u listu prema znaku koji odaberemo
# ovdje se razdvaja po zarezu pa će za unos "informatika,6" nakon .split(",") biti ["informatika","6"]
riječ, indeks = unos.split(",")[0] , int(unos.split(",")[1])
if indeks >= len(riječ):
    print("Indeks ne odgovara unesenom stringu, najveći indeks je",len(riječ)-1)
else:
    print("Riječ bez slova na indeksu "+str(indeks)+": "+riječ[:indeks]+riječ[indeks+1:])

### Formatiranje stringova

U ranijem primjeru koristili smo operator + za kombiniranje više stringova zajedno u poruku. Makar je operacija dopuštena ovakav način pisanja nije najpregledniji i pritom uvijek trebamo paziti da podatke koji nisu string pretvorimo ispravno. U starijim verzijama Pythona je zato napravljena `.format()` metoda koja je služila za uređivanje stringova koji se šalju u print() funkciju. U novijim verzijama Pythona su uvedeni tzv. *f-stringovi* koji rade istu stvar, ali na još pregledniji način:

In [None]:
# posljednji print 2. primjera:
riječ, indeks = "informatika",6
# bez formatiranja
print("Riječ bez slova na indeksu "+str(indeks)+": "+riječ[:indeks]+riječ[indeks+1:])
# sa .format() metodom se varijable ubacuju na mjesto {}
print("Riječ bez slova na indeksu {}: {}".format(indeks, riječ[:indeks]+riječ[indeks+1:]))
# ista stvar sa f-stringovima, samo ispred "" dodamo f ili F da bi napravili f-string
print(f"Riječ bez slova na indeksu {indeks}: {riječ[:indeks]+riječ[indeks+1:]}")

Svi ovi primjeri rade istu stvar, ali generalno f-stringovi nam daju najpregledniji kod i najviše fleksibilnosti. Kompletni primjer opcija koje se mogu koristiti sa .format() ili sa f-stringovima se nalazi <a href="https://www.w3schools.com/python/ref_string_format.asp">ovdje</a>.

**3. Primjer**

Napiši program koji omogućava unos više rezultata mjerenja duljine (svako odvojeno zarezom), a računa srednju vrijednost i apsolutnu maksimalnu grešku, te na kraju ispisuje rezultat zaokružen na najveću pouzdanu znamenku u formatu: *srednja vrijednost±greška*

Rješenje:

In [17]:
from math import abs

unos = input("Upiši rezultate mjerenja duljine u cm, svaki broj neka je odvojen zarezom:")
rezultati = unos.split(",")

# prvo računamo srednju vrijednost
zbroj = 0
for broj in rezultati:
    zbroj = zbroj + float(broj)
srednja = zbroj / len(rezultati)

# maksimalna apsolutna greška
greška = 0
for broj in rezultati:
    razlika = abs(srednja-float(broj)) # apsolutna razlika nam računa trenutnu grešku
    if razlika >= greška: # ako je trenutna razlika veća od prethodno spremljene greške onda je to maksimalna greška
        greška = razlika

greška%1

ImportError: cannot import name 'abs' from 'math' (unknown location)