# Szótárak (Dictionaries)

Újabb beépített adattípussal ismerkedünk meg.



## A szótár mint leképezés

A tömböknél az elemek elérése **egész szám** indexekkel történik, a szótáraknál szinte bármi használható. Nevezik néha *asszociatív tömb*nek, *map*nek is.<br>

Az indexek összességét **kulcs**oknak a hozzájuk tartozó dolgok összességét **érték**eknek nevezzük. Ha hangsúlyozni akarjuk egy kulcs és érték összetartozását akkor a **kulcs-érték pár** 
kifejezést használhatjuk. Röviden **pár**ként is hivatkozunk rájuk.<br>

Matematikai nyelven fogalmazva: a szótár egy **leképezés, függvény**, melynek értemezési tartománya a kulcsok, értékkészlete az értékek halmaza. <br>

## Létrehozás, lekérdezések

In [107]:
eng2hun=Dict(); 
eng2hun["apple"]="alma"; eng2hun["circle"]="kör"; eng2hun["dog"]="kutya"; 
eng2hun["big"]="nagy"; eng2hun["large"]="nagy";

@show eng2hun
eng2hunMásik=Dict("apple"=>"alma", "circle"=>"kör"); 
@show eng2hunMásik
# @show eng2hun["banana"]
@show length(eng2hun);
ks=keys(eng2hun); vs=values(eng2hun);
@show ks, vs, typeof(ks) ;
@show haskey(eng2hun,"apple") ;
@show get(eng2hun,"apple",""), get(eng2hun,"cider","hiba!") ;


eng2hun = Dict{Any,Any}("circle"=>"kör","big"=>"nagy","large"=>"nagy","apple"=>"alma","dog"=>"kutya")
eng2hunMásik = Dict("circle"=>"kör","apple"=>"alma")
length(eng2hun) = 5
(ks, vs, typeof(ks)) = (Any["circle", "big", "large", "apple", "dog"], Any["kör", "nagy", "nagy", "alma", "kutya"], Base.KeySet{Any,Dict{Any,Any}})
haskey(eng2hun, "apple") = true
(get(eng2hun, "apple", ""), get(eng2hun, "cider", "hiba!")) = ("alma", "hiba!")


### Magyarázatok
- a `Dict()` visszaad egy üres szótárat. Ha nem specifikáljuk, a típus **Any,Any** lesz. 
- a kulcs-érték párok egymáshoz rendelése ugyanaz mint a tömböknél az értékadás.
- ha már létrhozáskor megadjuk az elemeket akkor "konkrétabb" típusú lesz a szótár - jelen esetben 
`String,String`
- ha a szótárban nincs olyan kulcs amire hivatkozunk `KeyError` kivételt kapunk.
- használhatjuk a `length` függvényt a szótárban levő párok lekérésére
- a kulcsok illetve értékek kollekcióját a `keys` és `values` fv. adja meg. Ezek iterálható kollekciók.
- ha egy kulcs létezésére vagyunk kíváncsiak: `haskey`
- ha egy kulcshoz tartozó értékre vagyunk kíváncsiak: `get`.  A harmadik paraméter kötelező. <br>Előnye, hogy nem kell külön tesztelni a kulcs létezését.

## Használat

### Hisztogram
Tegyük fel hogy egy sztringben szereplő karakterek gyakoriságát akarjuk kiszámolni. Ekkor egy `Dict{Char,Int}`-et használhatunk:

In [108]:
function histogram(s)
  d=Dict{Char,Int}()
  for c in s
    if haskey(d,c) 
      d[c]=d[c]+1 
    else
      d[c]=1
    end
  end
  d
end
@show histogram("káposztástészta") ;
# if nélküli változat:
function histogram2(s)
  d=Dict{Char,Int}()
  for c in s
    d[c]=get(d,c,0)+1
  end
  d
end
@show histogram2("káposztástészta") ;

histogram("káposztástészta") = Dict('á'=>2,'s'=>3,'a'=>1,'k'=>1,'p'=>1,'o'=>1,'t'=>3,'é'=>1,'z'=>2)
histogram2("káposztástészta") = Dict('á'=>2,'s'=>3,'a'=>1,'k'=>1,'p'=>1,'o'=>1,'t'=>3,'é'=>1,'z'=>2)


### Bejárás

A szótárban levő pároknak nincs meghatározott sorrendje, de mégis lehetőségünk van 
- sorra venni a párokat, kulcsokat, értékeket
- megkeresni egy értékhez tartozó kulcsot/kulcsokat
- a szótár által meghatározott leképezés inverzét kiszámolni. (ez nem mindig függvény!)


In [109]:
for (k,v) in eng2hun # tuple, pár -> lásd következő fejezet
  println(k, " -> ", v)
end


for k in keys(eng2hun)
  println(k, " -> ?")
end

function revSearch(d, v)
  for (k,dk) in d
    if dk==v
      return k,true
    end
  end
  nothing, false
end

function revSearch2(d, v)
  ret=[]
  for (t,dt) in d
    if dt==v
      push!(ret,t)
    end
  end
  ret
end  


@show revSearch(eng2hun, "kutya");  
@show revSearch(eng2hun, "cica");
@show revSearch2(eng2hun, "nagy");  
@show revSearch2(eng2hun, "cica");

function revDict(d)
  rd=Dict()
  for (k,dk) in d
    rd[dk]=push!(get(rd,dk,[]),k)
  end
  rd
end  
@show revDict(eng2hun)
@show revDict(histogram2("káposztástészta"))


circle -> kör
big -> nagy
large -> nagy
apple -> alma
dog -> kutya
circle -> ?
big -> ?
large -> ?
apple -> ?
dog -> ?
revSearch(eng2hun, "kutya") = ("dog", true)
revSearch(eng2hun, "cica") = (nothing, false)
revSearch2(eng2hun, "nagy") = Any["big", "large"]
revSearch2(eng2hun, "cica") = Any[]
revDict(eng2hun) = Dict{Any,Any}("kör"=>Any["circle"],"alma"=>Any["apple"],"kutya"=>Any["dog"],"nagy"=>Any["big", "large"])
revDict(histogram2("káposztástészta")) = Dict{Any,Any}(2=>Any['á', 'z'],3=>Any['s', 't'],1=>Any['a', 'k', 'p', 'o', 'é'])


Dict{Any,Any} with 3 entries:
  2 => Any['á', 'z']
  3 => Any['s', 't']
  1 => Any['a', 'k', 'p', 'o', 'é']

### Memoizáció - cachelés

Kissé mesterkélt példa következik - de remélhetőleg rávilágít a módszer lényegére.

Tekintsük a következő (naív) Fibonacci-sorozat számoló függvényt:

In [113]:
function fib(n)
  ((n==0)||(n==1))&&return 1
  return fib(n-1)+fib(n-2)
end
@time fib(43)

  2.302959 seconds (5.37 k allocations: 299.960 KiB)


701408733

Könnyen átgondolhatjuk, hogy ugyanazt az értéket többször is kiszámolja - emiatt lassú. <br>
Természetesen ez orvosolható űgy is hogy nem rekurzív megvalósítást haszálunk,<br> 
de itt egy más problémák esetén is használható, **memoizáció, cachelés** nevű technikát szeretnénk bemutatni. <br>
A már egyszer kiszámolt értéket egy szótárban `Int,Int` szótárban tároljuk. 

In [116]:
function makeFib()
  d=Dict(0=>1,1=>1)
  function fib(n)
    if !haskey(d,n)
      d[n]=fib(n-1)+fib(n-2)
    end
    d[n]
  end
end
fib2=makeFib()
@time fib2(43)
show(a)

  0.008568 seconds (5.95 k allocations: 296.398 KiB)
701408733

## Feladatok

### Anagram
[Ezt](words.eng) a szólistát bontsuk anagram-osztályokra. Írjuk ki a 
legalább 3 nagyságú osztályokat.<br>
Anagram-osztályokra bontás: <br>
**Input:**
```
tab
abc
ab
bc
c
cba
bat
ba
acb
```

**Output:**
```
tab bat
abc cba acb
ab ba
bc
c
```


## Megoldások

### Anagram


In [5]:
d=Dict{String,String}()
for li in eachline("words.eng")
    d[li]=string(sort(collect(li)))
end

function revDict(d)
  rd=Dict()
  for (k,dk) in d
    rd[dk]=push!(get(rd,dk,[]),k)
  end
  rd
end  

function wArr(arr)
  for v in arr
    print(v," ")
  end
  println()
end    

for (k,v) in revDict(d)
  if length(v)>6
    wArr(v)
  end
end


pares pears rapes parse spear reaps spare 
caters caster reacts recast traces crates carets 
