# Install wikibase

### Requirements
* [docker](https://www.docker.com/)
* [docker-compose](https://docs.docker.com/compose/install/)

### Get the files
For Wikibase to start with Japanese settings the following files need to downloaded.
* Choose or create a directory to store the following two files:
* [LocalSettings.php.template](https://raw.githubusercontent.com/andrawaag/wikibase_languages/master/wikibase_jp/LocalSettings.php.template)
* [docker-compose.yml](https://raw.githubusercontent.com/andrawaag/wikibase_languages/master/wikibase_jp/docker-compose.yml)
[changes made](changes.MD)

### Run docker-compose
```
docker-compuse up
```
Depending on the OS you might need to use sudo
```
sudo docker-compuse up
```

### Setup the initial account
For this exercise the account (username/password) Test/test2 is needed. The python script below assumes its existance. This account can be created [here](http://127.0.0.1:7171/w/index.php?title=特別:アカウント作成&2).

Once create run the python script below. The individual libraries might need to be installed by running pip or pip3. e.g. 
```pip3 install wikidataintegrator```



# Create the properties

In [61]:
import requests
import pandas as pd
import numpy as np
from wikidataintegrator import wdi_core, wdi_login

mediawiki_api_url = "http://127.0.0.1:7171/w/api.php"
sparql_endpoint_url = "http://127.0.0.1:7272/proxy/wdqs/bigdata/namespace/wdq/sparql"
username = "Test"
password = "test2"
login = wdi_login.WDLogin(username, password, mediawiki_api_url=mediawiki_api_url)

def createProperty(login, label, description, property_datatype, lang="en"):
  s = []
  localEntityEngine = wdi_core.WDItemEngine.wikibase_item_engine_factory(mediawiki_api_url,sparql_endpoint_url)
  item = localEntityEngine(data=s)
  item.set_label(label, lang=lang)
  item.set_description(description, lang=lang)
  print(item.write(login, entity_type="property", property_datatype=property_datatype))


## Properties accorind to: https://docs.google.com/spreadsheets/d/1RhxhzRW_Id10uOXiaFeubIG0z6b0I7k9VN6Sg2KqZG8/edit#gid=0
new_props = dict()
new_props["instance of"] = createProperty(login, "instance of", "is a", "wikibase-item", lang="en")
new_props["subclass of"] = createProperty(login, "subclass of", "subclass of", "wikibase-item", lang="en")
new_props["same as"] = createProperty(login, "same as", "external IRI mapping", "url", lang="en")
new_props["coordinate location"] = createProperty(login, "coordinate location", "latitude and longitude", "globe-coordinate", lang="en")
new_props["施設名"] = createProperty(login, "施設名", "", "string", lang="ja")
new_props["施設名かな"] = createProperty(login, "施設名かな", "", "string", lang="ja")
new_props["所在地"] = createProperty(login, "所在地", "", "wikibase-item", lang="ja")
new_props["地区名"] = createProperty(login, "地区名", "", "wikibase-item", lang="ja")
new_props["tel"] = createProperty(login, "tel", "phone number", "string", lang="en")
new_props["fax"] = createProperty(login, "fax", "fax number", "string", lang="en")
new_props["詳細情報"] = createProperty(login, "詳細情報", "", "string", lang="ja")
new_props["開館時間"] = createProperty(login, "開館時間", "", "string", lang="ja")
new_props["url"] = createProperty(login, "url", "", "url", lang="en")
new_props["バリアフリー情報"] = createProperty(login, "バリアフリー情報", "", "url", lang="ja")
new_props["駐輪場 PC版詳細情報"] = createProperty(login, "駐輪場 PC版詳細情報", "", "string", lang="ja")
new_props["駐輪場 携帯電話版詳細情報"] = createProperty(login, "駐輪場 携帯電話版詳細情報", "", "string", lang="ja")
new_props["大分類"] = createProperty(login, "大分類", "", "wikibase-item", lang="ja")
new_props["小分類"] = createProperty(login, "小分類", "", "wikibase-item", lang="ja")
new_props["カテゴリ"] = createProperty(login, "カテゴリ", "", "wikibase-item", lang="ja")
new_props["アイコン番号"] = createProperty(login, "アイコン番号", "", "external-id", lang="ja")
new_props["施設ID"] = createProperty(login, "施設ID", "", "external-id", lang="ja")



http://127.0.0.1:7171/w/api.php
Successfully logged in as Test
P1
P2
P3
P4
P5
P6
P7
P8
P9
P10
P11
P12
P13
P14
P15
P16
P17
P18
P19
P20
P21


It is best to wait a few minutes before continueing with the next steps for the WBQS to pick up the changes. Run the step below until the props dictionary is not empty and reflects the number of properties from the step above

In [65]:
props = dict()
results = wdi_core.WDItemEngine.execute_sparql_query("SELECT * WHERE { ?item rdf:type wikibase:Property ; rdfs:label ?label }", endpoint=sparql_endpoint_url)
for result in results["results"]["bindings"]:
    print(result["item"]["value"], result["label"]["value"])
    props[result["label"]["value"]]=result["item"]["value"].replace("http://wikibase.svc/entity/", "")
props

{}

# Run the script

In [16]:
csv = "https://data.city.osaka.lg.jp/upload/data-00000428/20190806_mapnavoskdat_shisetsuall.csv"
df = pd.read_csv(csv)
df


Unnamed: 0,X,Y,施設名,施設名かな,施設名（施設名かな）,所在地,地区名,TEL,FAX,詳細情報,開館時間,URL,バリアフリー情報,駐輪場 PC版詳細情報,駐輪場 携帯電話版詳細情報,大分類,小分類,カテゴリ,アイコン番号,施設ID
0,135.499064,34.702983,大阪新卒応援ハローワーク(18F)、大阪わかものハローワーク(18F)、大阪外国人雇用サービ...,おおさかしんそつおうえんはろーわーく、おおさかがいこくじんこようさーびすせんたー、おおさかが...,大阪新卒応援ハローワーク(18F)、大阪わかものハローワーク(18F)、大阪外国人雇用サービ...,北区角田町８丁目８－7 阪急グランドビル,北区,,,,,,,,,官公庁,国の機関,官公庁/国の機関,111,96228
1,135.511018,34.646529,ハローワーク阿倍野職業紹介コーナー、あべのわかものハローワーク,はろーわーくしょくぎょうしょうかいこーなー、あべのわかものはろーわーく,ハローワーク阿倍野職業紹介コーナー、あべのわかものハローワーク（はろーわーくしょくぎょうしょ...,阿倍野区阿倍野筋１丁目５－１ あべのルシアス西棟,阿倍野区,,,,,,,,,官公庁,国の機関,官公庁/国の機関,111,96229
2,135.499787,34.667611,ハローワークプラザ難波、大阪マザーズハローワーク,はろーわーくぷらざなんば、おおさかまざーずはろーわーく,ハローワークプラザ難波、大阪マザーズハローワーク（はろーわーくぷらざなんば、おおさかまざーず...,中央区難波２丁目２－３ 御堂筋グランドビル,中央区,,,,,,,,,官公庁,国の機関,官公庁/国の機関,111,96218
3,135.513132,34.689958,0SAKAしごとフィールド,おおさかしごとふぃーるど,0SAKAしごとフィールド（おおさかしごとふぃーるど）,中央区北浜東３－１４ エル・おおさか府立労働センター本館,中央区,,,,,,,,,官公庁,国の機関,官公庁/国の機関,118,96227
4,135.496756,34.636745,しごと情報ひろば天下茶屋阿倍野ハローワークコーナー,しごとじょうほうひろばてんがちゃやあべのはろーわーくこーなー,しごと情報ひろば天下茶屋阿倍野ハローワークコーナー（しごとじょうほうひろばてんがちゃやあべの...,西成区岸里１丁目１－１０ 大阪市交通局 堺筋線 天下茶屋駅,西成区,,,,,,,,,官公庁,国の機関,官公庁/国の機関,111,96220
5,135.512995,34.689960,OSAKAしごとフィールド大阪東ハローワークコーナー,おおさかしごとふぃーるどおおさかひがしはろーわーくこーなー,OSAKAしごとフィールド大阪東ハローワークコーナー（おおさかしごとふぃーるどおおさかひがし...,中央区北浜東３－１４ エル・おおさか府立労働センター本館,中央区,,,,,,,,,官公庁,国の機関,官公庁/国の機関,111,96219
6,135.456378,34.711403,ハローワークin西淀川,はろーわーくいんにしよどがわ,ハローワークin西淀川（はろーわーくいんにしよどがわ）,西淀川区御幣島１丁目２－１０,西淀川区,06-7668-0150,,,,,,,,官公庁,国の機関,官公庁/国の機関,111,95472
7,135.497992,34.725942,淀川年金事務所,よどがわねんきんじむしょ,淀川年金事務所（よどがわねんきんじむしょ）,淀川区西中島4-1-1日清食品ビル2･3階,淀川区,06-6305-1881,06-6305-4838,,,http://www.nenkin.go.jp/n/www/section/detail.j...,,,,官公庁,国の機関,官公庁/国の機関,104,2473
8,135.496878,34.672998,大阪西労働基準監督署,おおさかにしろうどうきじゅんかんとくしょ,大阪西労働基準監督署（おおさかにしろうどうきじゅんかんとくしょ）,西区北堀江1-2-19,西区,06-6531-0801,,,,,,,,官公庁,国の機関,官公庁/国の機関,104,4799
9,135.438211,34.616494,軽自動車検査協会大阪主管事務所,けいじどうしゃけんさきょうかいおおさかしゅかんじむしょ,軽自動車検査協会大阪主管事務所（けいじどうしゃけんさきょうかいおおさかしゅかんじむしょ）,住之江区南港東3-4-62,住之江区,06-6612-1565,,（軽自動車の登録・廃止等）,,,http://www.osaka-bfmap.jp/sisetu_data/data/201...,,,官公庁,国の機関,官公庁/国の機関,104,158


In [23]:
list(df)

['X',
 'Y',
 '施設名',
 '施設名かな',
 '施設名（施設名かな）',
 '所在地',
 '地区名',
 'TEL',
 'FAX',
 '詳細情報',
 '開館時間',
 'URL',
 'バリアフリー情報',
 '駐輪場 PC版詳細情報',
 '駐輪場 携帯電話版詳細情報',
 '大分類',
 '小分類',
 'カテゴリ',
 'アイコン番号',
 '施設ID']

In [None]:
headers = list(df) 
for index, row in df.iterrows():
    data=[]
    # store the coordinate locations
    data.append(wdi_core.WDGlobeCoordinate(latitude=row[1], longitude=row[0], prop_nr=props["coordinate location"], precision=0.00001))
    # store 施設名 -> string
    data.append(wdi_core.WDString(value=row[2], prop_nr=props["施設名"]))
    # store 施設名かな -> string
    data.append(wdi_core.WDString(value=row[3], prop_nr=props["施設名かな"]))
    # store 所在地 -> item. translates to place
    if len(wdi_core.WDItemEngine.get_wd_search_results(search_string='所在地', 
                                                       mediawiki_api_url=mediawiki_api_url)) == 0:
        wbPageP8 = wdi_core.WDItemEngine(new_item=True, mediawiki_api_url=mediawiki_api_url, sparql_endpoint_url=sparql_endpoint_url)
        wbPageP8.set_label(row["所在地"], lang="ja")
        qid=wbPageP8.write(login)
    data.append(wdi_core.WDItemID(value=qid, prop_nr=props["所在地"]))
    # store 地区名 -> item 
    if len(wdi_core.WDItemEngine.get_wd_search_results(search_string='地区名', 
                                                       mediawiki_api_url=mediawiki_api_url)) == 0:
        wbPageP9 = wdi_core.WDItemEngine(new_item=True, mediawiki_api_url=mediawiki_api_url, sparql_endpoint_url=sparql_endpoint_url)
        wbPageP9.set_label(row["地区名"], lang="ja")
        qid=wbPageP9.write(login)
    data.append(wdi_core.WDItemID(value=qid, prop_nr=props["地区名"]))
    # store tel -> string
    if not pd.isnull(row["TEL"]):
        data.append(wdi_core.WDString(value=row["TEL"], prop_nr=props["tel"]))
    # store fax -> string
    if not pd.isnull(row["FAX"]):
        data.append(wdi_core.WDString(value=row["FAX"], prop_nr=props["fax"]))
    # store 詳細情報 -> string
    if not pd.isnull(row["詳細情報"]):
        data.append(wdi_core.WDString(value=row["詳細情報"], prop_nr=props["詳細情報"]))
    # store 開館時間 -> string
    if not pd.isnull(row["開館時間"]):
        data.append(wdi_core.WDString(value=row["開館時間"], prop_nr=props["開館時間"]))
    # store url
    if not pd.isnull(row["URL"]):
        data.append(wdi_core.WDUrl(value=row["URL"], prop_nr=props["url"]))
    # store バリアフリー情報
    if not pd.isnull(row["バリアフリー情報"]):
        data.append(wdi_core.WDUrl(value=row["バリアフリー情報"], prop_nr=props["バリアフリー情報"]))
    # store 駐輪場 PC版詳細情報 -> string
    if not pd.isnull(row["駐輪場 PC版詳細情報"]):
        data.append(wdi_core.WDString(value=row["駐輪場 PC版詳細情報"], prop_nr=props["駐輪場 PC版詳細情報"]))
    # store 駐輪場 携帯電話版詳細情報 -> string
    if not pd.isnull(row["駐輪場 携帯電話版詳細情報"]):
        data.append(wdi_core.WDString(value=row["駐輪場 携帯電話版詳細情報"], prop_nr=props["駐輪場 携帯電話版詳細情報"]))
    # store 大分類 -> item 
    if not pd.isnull(row["大分類"]):
        if len(wdi_core.WDItemEngine.get_wd_search_results(search_string=row["大分類"], 
                                                       mediawiki_api_url=mediawiki_api_url)) == 0:
            wbPageP18 = wdi_core.WDItemEngine(new_item=True, data=data, mediawiki_api_url=mediawiki_api_url, sparql_endpoint_url=sparql_endpoint_url)
            wbPageP18.set_label(row["大分類"], lang="ja")
            qid=wbPageP18.write(login)
        data.append(wdi_core.WDItemID(value=qid, prop_nr=props["大分類"]))
    # store 小分類 -> item 
    if not pd.isnull(row["小分類"]):
        if len(wdi_core.WDItemEngine.get_wd_search_results(search_string=row["小分類"], 
                                                       mediawiki_api_url=mediawiki_api_url)) == 0:
            wbPageP19 = wdi_core.WDItemEngine(new_item=True, mediawiki_api_url=mediawiki_api_url, sparql_endpoint_url=sparql_endpoint_url)
            wbPageP19.set_label(row["小分類"], lang="ja")
            qid=wbPageP19.write(login)
        data.append(wdi_core.WDItemID(value=qid, prop_nr=props["小分類"]))
    
    # store カテゴリ -> item 
    if not pd.isnull(row["カテゴリ"]):
        if len(wdi_core.WDItemEngine.get_wd_search_results(search_string='カテゴリ', 
                                                       mediawiki_api_url=mediawiki_api_url)) == 0:
            wbPageP20 = wdi_core.WDItemEngine(new_item=True, mediawiki_api_url=mediawiki_api_url, sparql_endpoint_url=sparql_endpoint_url)
            wbPageP20.set_label(row["カテゴリ"], lang="ja")
            qid=wbPageP20.write(login)
        data.append(wdi_core.WDItemID(value=qid, prop_nr=props["カテゴリ"]))
    #store アイコン番号
    if not pd.isnull(row["アイコン番号"]):
        data.append(wdi_core.WDExternalID(value=str(row["アイコン番号"]), prop_nr=props["アイコン番号"]))
    #store 施設ID
    if not pd.isnull(row["施設ID"]):
        data.append(wdi_core.WDExternalID(value=str(row["施設ID"]), prop_nr=props["施設ID"]))    
    
    wdPage = wdi_core.WDItemEngine(new_item=True, data=data, mediawiki_api_url=mediawiki_api_url, sparql_endpoint_url=sparql_endpoint_url)
    wdPage.set_label(row[2], lang='ja')
    print(wdPage.write(login))
    

Q6
Q12
Q18
Q24
Q30
Q36
Q42
Q48


In [24]:
wdi_core.WDItemEngine.get_wd_search_results(search_string='北区角田町８丁目８－7 阪急グランドビル', mediawiki_api_url=mediawiki_api_url)

[]

http://wikibase.svc/entity/P1 instance of
http://wikibase.svc/entity/P2 subclass of
http://wikibase.svc/entity/P3 same as
http://wikibase.svc/entity/P4 coordinate location
http://wikibase.svc/entity/P5 施設名
http://wikibase.svc/entity/P6 施設名かな
http://wikibase.svc/entity/P7 所在地
http://wikibase.svc/entity/P8 地区名
http://wikibase.svc/entity/P9 tel
http://wikibase.svc/entity/P10 fax
http://wikibase.svc/entity/P11 詳細情報
http://wikibase.svc/entity/P12 開館時間
http://wikibase.svc/entity/P13 url
http://wikibase.svc/entity/P14 バリアフリー情報
http://wikibase.svc/entity/P15 駐輪場 PC版詳細情報
http://wikibase.svc/entity/P16 駐輪場 携帯電話版詳細情報
http://wikibase.svc/entity/P17 大分類
http://wikibase.svc/entity/P18 小分類
http://wikibase.svc/entity/P19 カテゴリ
http://wikibase.svc/entity/P20 アイコン番号
http://wikibase.svc/entity/P21 施設ID


{'instance of': 'P1',
 'subclass of': 'P2',
 'same as': 'P3',
 'coordinate location': 'P4',
 '施設名': 'P5',
 '施設名かな': 'P6',
 '所在地': 'P7',
 '地区名': 'P8',
 'tel': 'P9',
 'fax': 'P10',
 '詳細情報': 'P11',
 '開館時間': 'P12',
 'url': 'P13',
 'バリアフリー情報': 'P14',
 '駐輪場 PC版詳細情報': 'P15',
 '駐輪場 携帯電話版詳細情報': 'P16',
 '大分類': 'P17',
 '小分類': 'P18',
 'カテゴリ': 'P19',
 'アイコン番号': 'P20',
 '施設ID': 'P21'}

In [40]:
import numpy as np