# 2-4 データ構造

#### 木・二分木
    木とは、ノードとエッジからなるダイアグラム。全てのノードについて、下に生えているエッジが2本以下であるような木を、二分木と呼ぶ。また、上流にあるノードを親と呼び、そこから下流にあり、エッジで繋がっているノードをその子と呼ぶ。
#### プライオリティキューとヒープ
    プライオリティキューとは、次のような操作を行えるデータ構造。
    ・ 数を追加する
    ・　最小の値を取り出す(値を取得し、削除する)
    これを二分木を用いて効率的に実現するのが、ヒープと呼ばれるデータ構造。
    ヒープでは、必ず子が親より大きい数になるよう、上から下へ、左から右へ詰めて構成される。。 
    ヒープに数を追加する場合、まず新たな数字を最後尾に追加する。すなわち、一番下の世代の空いているノードのうち一番左に新たな数を追加する。もし各世代が埋まっている場合は、新たな世代の一番左に追加する。
    さらに、逆転がなくなるまで上に上げていく。
    ヒープから最小値を削除するには、まず一番上流のノードを削除し、一番下流のノードをコピーする。その後、逆転がなくなるまでノードをより小さい値の子と入れ替えていく。
    ヒープを用いた計算では、深さに比例した計算量となるのでlog(n)の計算量で探索できる。

In [21]:
# import
import numpy as np
import networkx as nx
import math
import random as rn
import itertools

In [22]:
# ヒープの実装例
N=100
sz=0
heap=[ 10000 for i in range(N)]

def push(x):
    i=sz+1
    while i>0:
        p=int((i-1)/2)
        if heap[p]<=x:
            break
        heap[i] = heap[p]
        i=p
    heap[i]=x
    return True

def pop():
    ret=hep[0]
    x=hep[sz-1]
    i=0
    while ( i*2+1<sz):
        a=i*2+1
        b=i*2+2
        if b<sz and heap[b]<heap[a]:
            a=b
        if heap[a] >= b:
            break
        heap[i]=heap[a]
        i=a
    heap[i]=x
    return ret

テキストのコードをpythonに翻訳したはいいけど、理解しきれていない。  
頻繁に使うデータ構造はライブラリで用意されていることが多いので、それを使うと良いようだ。特にC++はそのようなライブラリが豊富なので、競プロでは有利らしい。ただpythonでも調べれば使えるのがありそう。例えば、

In [32]:
import heapq

def heapsort(iterable):
    h = []
    for value in iterable:
        heapq.heappush(h, value)
    return [heapq.heappop(h) for i in range(len(h))]

heapsort([1, 3, 5, 7, 9, 2, 4, 6, 8, 0])

a = [3,0,2,6]

heapq.heapify(a)
print(a)

heapq.heappush(a,3)
print(a)

print(heapq.heappop(a))
print(a)

[0, 3, 2, 6]
[0, 3, 2, 6, 3]
0
[2, 3, 3, 6]


### 問題( POJ 2431)
    トラックで距離 Lの道を移動する。はじめトラックにはガソリンがP積まれており、燃費は 1。途中にN個のガソリンスタンドがあるが、その場所は距離A_iの地点にあり、ガソリンをB_iだけ補給できる。トラックが距離をLを完走できる場合は、必要な最小補給回数を、完走できない場合は-1を出力せよ。
    1<= N <=10^5
    1<= L,P <= 10**6
    1<= A_i < L 
    1<= B_i <= 100
考え方：ヒープの応用の仕方がわからないので、とりあえず解説を読む。<u>1. ガソリンスタンドiを通過したときに、heapにB_iを追加する</u>、<u>2. 燃料がきれたときに、ヒープから最大値を取り出し、補給したことにする</u> という考え方らしい。エレガントやね。コードは見ずに解いてみましょう。

In [46]:
# 入力　ランダム
N=rn.randint(1,10**5)
L,P=rn.randint(1,10**6),rn.randint(1,10**6)
As=[ rn.randint(1,L-1) for _ in range(N*10)]
As=list(set(As))[:N]
Bs=[rn.randint(1,100) for _ in range(N)]

print(As[1:min(100,N)])
print(Bs[1:min(100,N)])

[2, 3, 5, 7, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 23, 24, 25, 27, 29, 30, 31, 32, 33, 34, 35, 37, 38, 39, 40, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 60, 61, 62, 63, 64, 65, 66, 68, 69, 70, 71, 72, 73, 74, 77, 78, 79, 80, 81, 86, 87, 88, 89, 91, 92, 93, 94, 95, 96, 97, 99, 100, 101, 102, 103, 104, 105, 106, 107, 108, 109, 110, 111, 112, 114, 115, 118, 119, 120, 121, 122]
[40, 9, 38, 93, 90, 32, 60, 59, 86, 34, 21, 9, 92, 97, 62, 86, 38, 56, 19, 86, 14, 93, 74, 93, 85, 82, 2, 52, 25, 80, 19, 100, 53, 53, 12, 65, 92, 78, 65, 19, 22, 59, 23, 74, 41, 47, 55, 85, 25, 46, 7, 70, 50, 20, 49, 54, 14, 74, 12, 98, 90, 67, 42, 24, 100, 98, 55, 29, 35, 33, 27, 28, 99, 18, 90, 8, 72, 83, 50, 15, 71, 67, 82, 100, 61, 52, 94, 47, 27, 31, 37, 57, 80, 85, 78, 26, 72, 25, 59]


In [88]:
# 入力　サンプル
N=20
L,P=100,10
while True:
    As=list(set([rn.randint(1,99) for _ in range(N)]))
    if len(As)==N:
        break
    else:
        for i in range(N-len(As)):
            As.append(rn.randint(1,99))
As.sort()    
Bs=[rn.randint(1,20) for _ in range(N)]
print("N={0}, L={1}, P={2}".format(N,L,P))
print("As={0}".format(As))
print("Bs={0}".format(Bs))

N=20, L=100, P=10
As=[4, 8, 18, 22, 25, 27, 30, 35, 37, 45, 63, 66, 68, 71, 73, 78, 79, 87, 90, 93]
Bs=[20, 7, 8, 4, 7, 14, 13, 9, 18, 10, 12, 17, 15, 5, 19, 5, 4, 6, 2, 12]


In [89]:
now=0
reach=P
h=[]
ans=0
flag=True

while True:
    for i in range(now,reach+1):
        if i in As:
            heapq.heappush(h,-Bs[As.index(i)])
    print(h)
    if len(h)==0:
        flag=False
        break
    now=reach
    reach+=-heapq.heappop(h)
    ans+=1
    if reach>=L:
        break
print(ans) if flag else print("-1")

[-20, -7]
[-14, -8, -13, -7, -7, -4]
[-18, -13, -13, -8, -7, -4, -9, -7]
[-13, -13, -9, -10, -7, -4, -7, -8]
[-19, -15, -17, -12, -13, -9, -7, -8, -10, -7, -5, -4]
[-17, -15, -9, -12, -13, -5, -7, -12, -10, -7, -5, -4, -4, -6, -2, -8]
6


#### 二分探索木
    とは、次のような操作を効率的に行えるデータ構造。
    ・ 数値を追加する
    ・　ある数値が含まれているか調べる
    ・　ある数値を削除する
    具体的には2分探索木は、左の子以下の数は自分よりも小さく、右の子以下の数は自分よりも大きくなるように構成される。ある数Aが2分探索木に含まれるか調べるためには、最上流から初めて、ノードの値とAを比べ、Aの方が大きければ右の子と比較し、小さければ右の子と比べていけば良い。
    数の追加は、その数を探索するつもりでたどれば、追加すべき位置がわかる。
    数の削除は、次の場合わけによって行われる：
    ・ 削除したいノードが左の子を持たない場合は、右の子をコピーする
    ・ 削除したいノードの左の子が右の子を持っていない場合は、左の子をコピーする
    ・　どちらでもない場合、左の子以下で最も大きいノードをコピーする。
    どの操作も、理想的にはO(logN)で計算できるが、極端な形の木になる場合はこの限りではない。
二分探索木の実装をやるべきだが、ひとまず飛ばしてライブラリを利用する。と思ったが、pythonには2分探索木のライブラリがなさそう。2分探索のライブラリはありそう。実際のところ、2分探索さえできれば、別に2分探索木を構成しなくても良いんじゃないか？ それ以外の用途で2分探索木が必要になることはあるのか？

In [97]:
import bisect
a=[23,15,5,7,13,19,11,17,9,3,1]
a.sort()
x=4

insert_index = bisect.bisect_left(a,x)
print(insert_index)

a.insert(insert_index,x)
bisect.insort(a,14)

print(a)

a=[1,2,2,2,3] 

print(bisect.bisect_left(a,2))

print(bisect.bisect_right(a,2))

print(bisect.bisect(a,2))

2
[1, 3, 4, 5, 7, 9, 11, 13, 14, 15, 17, 19, 23]
1
4
4


#### Union-Find 木
    とは、グループ分けを管理するデータ構造。次の操作が効率的に行える。
    ・　要素Aと要素Bが同じグループに属するかを調べる
    ・　要素Aのグループと要素Bのグループを合併する
    ただし、合併はできても分割はできない。
    これを木として表現するためには、グループごとに非連結な木を用意する。この場合、それぞれの木において上流・下流の関係はもはや重要ではない。
    ただし、実装する場合には、「木の深さ」すなわち世代数に注意しないと十分に計算量を抑えられない。ただし、下にまとめるような工夫をして実装した場合、上述の操作は平均的にはO(logN)よりも少ない計算量で計算できる。
#### Union-Find 木の実装の工夫
    ・　各木の深さ(rank)を記憶しておく。合併の際に、2つの木のrankの小さいものから大きいものへエッジを伸ばす。
    ・　エッジの縮約・・・各ノードについて、一度根を辿ったら、エッジを直接根から伸ばし直す。
下で実装してみる。これもpythonにはライブラリがない。

In [102]:
# 初期化
N=10
rank=[0 for _ in range(N)]
par=[i for i in range(N)]
#実装
def find(x):
    if par[x]==x:
        return x
    else:
        par[x] = find(par[x])
        return par[x]
def unite(x,y):
    x=find(x)
    y=find(y)
    if x==y:
        return
    if rank[x]<rank[y]:
        par[x]=y
    else:
        par[y]=x
        if rank[x]==rank[y]:
            rank[x]+=1
def same(x,y):
    return find(x)==find(y)
    

In [105]:
#例
unite(1,3)
unite(1,5)
unite(2,4)
unite(4,6)
unite(6,8)
print(par)
print(same(8,4),same(9,1))

[0, 1, 2, 1, 2, 1, 2, 7, 2, 9]
True False


### 問題 ( POJ 1182, 食物連鎖 )
    ラベルiがつけれれたN匹の動物がいる。動物はすべて種類A,B,Cのいずれかである。AはBを食べ、BはCを食べ、CはAを食べる。次のような2種類の情報が順番にk個与えられる。
    ・ タイプ1 : xとyは同じ種類
    ・　タイプ2 : xはyを食べる
    このとき、k個の情報のうち、前の情報と矛盾する情報と、x>Nのような正しくない情報がある。このような情報の個数を出力せよ。
    1<=N<=5000
    1<=K<=10^5
考え方：問題の意味が汲み取りづらいが、わかれば簡単か。まず全ての動物のタイプを-1とかで初期化して、情報に応じて1,2,3の根にuniteしていけば良い。

In [115]:
#入力　サンプル
N=10
K=7
types=[1,2,2,2,1,2,1]
inf=[(101,2),(1,2),(2,3),(3,3),(1,3),(3,1),(5,5)]


In [121]:
ans=0
par=[-1 for _ in range(N)]
rank=[0 for _ in range(N)]

for i in range(K):
    #print(par)
    t=types[i]
    x,y=map(int, inf[i])
    if x>N or y>N:
        ans+=1
        print(i+1)
    else:
        px=par[x]
        py=par[y]
        if t==1:
            if px==-1 and py==-1:
                par[x]=1
                par[y]=1
            elif px==-1 and py!=-1:
                par[x]=y
            elif px!=-1 and py==-1:
                par[y]=x
            elif px!=py:
                ans+=1
                print(i+1)
        else:
            if px==-1 and py==-1:
                par[x]=1
                par[y]=2
            elif px==-1 and py!=-1:
                par[x]=(y+1)%3+1
            elif px!=-1 and py==-1:
                par[y]=x%3+1
            elif (px,py) not in [(1,2),(2,3),(3,1)]:
                ans+=1
                print(i+1)
print(ans)

1
4
5
3


union-treeを使ったとは言えない解法になってしまった。