<a href="https://colab.research.google.com/github/project-ccap/ccap/blob/master/notebooks/2020importing_ccap_from_GitHub.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

In [None]:
# 各画像の画面表示時に日本語キャプションを付与する準備
import matplotlib.pyplot as plt
%matplotlib inline
!pip install japanize-matplotlib
import japanize_matplotlib

#  ImageNet の各ラベルの WordNet ID 処理用
import nltk
nltk.download('wordnet')
nltk.download('omw')

# ライブラリのインストール
!git clone https://github.com/project-ccap/ccap.git

In [None]:
# 画像データ，設定データを Google Drive から入手
# このセルを実行するとブラウザの別タブで Google アカウントへの認証が求められる
# Google アカウントを選択するとクリデンシャルキーが表示されるので，そのキーを
# コピーして，このセルの出力欄にある空欄に貼り付けてエンターキー (リターンキー) を押下する

# Import PyDrive and associated libraries.
# This only needs to be done once per notebook.
from pydrive.auth import GoogleAuth
from pydrive.drive import GoogleDrive
from google.colab import auth
from oauth2client.client import GoogleCredentials

# Authenticate and create the PyDrive client.
# This only needs to be done once per notebook.
auth.authenticate_user()
gauth = GoogleAuth()
gauth.credentials = GoogleCredentials.get_application_default()
drive = GoogleDrive(gauth)

# 以下実際のデータの情報
#https://drive.google.com/file/d/1xKXbovkEQwdJefzCuaS_a351LUIuRz-1/view?usp=sharing 
#for Gdrive cis.twcu.ac.jp/GitHub_shared/ccap_data.tgz
file_id = '1xKXbovkEQwdJefzCuaS_a351LUIuRz-1'
downloaded = drive.CreateFile({'id': file_id})
downloaded.GetContentFile('ccap_data.tgz')

# 入手したデータの解凍
!tar xzf ccap_data.tgz

In [None]:
# 以下は動作確認，ImageNet の利用
# ただし本来 ImageNet の画像利用には登録が必要である
# そのため，利用時には各ユーザの責任において ImageNet への登録申請を行うこと
# 参照 URL: http://image-net.org/download-images
# 文献: J. Deng, W. Dong, R. Socher, L.-J. Li, K. Li and L. Fei-Fei, ImageNet: A Large-Scale Hierarchical Image Database,
#       IEEE Computer Vision and Pattern Recognition (CVPR), 2009.
from ccap import imagenetDataset
imagenet = imagenetDataset()

# 最初のデータの表示
print(imagenet(0))

# 4 番目のデータ 0 から始まるので 3 が 4 番目のデータを表す
print(imagenet.data[3])

# 最後の画像データをランダムサンプリングして一枚だけ表示
# 実行するたび表示されるデータは異なる
imagenet.sample_and_show(999)

In [None]:
# TLPA データの利用
# 文献: 藤田郁代 他, 2000, 「失語症語彙検査」の開発, 音声言語医学 42:179-202
from ccap import tlpaDataset
tlpa = tlpaDataset()

# 最初のデータの表示
print(tlpa(0))

# 図版画像の表示
tlpa.show_an_image('桜')

# 総データ数の表示
print(tlpa.__len__())

In [None]:
# SALA の利用
# SALA失語症検査マニュアル (Sophia Analysis of Language in Aphasia), 2004, 上智大学SALAプロジェクトチーム, 藤林眞理子他
from ccap import salaDataset
sala = salaDataset()

# 最初のデータの画像ファイル名と対応するラベルの表示
print(sala(0))

# 総データ数の表示
print(sala.__len__())

# 4 番目の画像の表示
sala.show_an_image(3)

In [None]:
# PNT の利用
# 文献: Roach et. al, (1996) The Philadelphia Naming Test: Scoring and Rationale, Clinical Aphasiology, Vol. 24, 1996, pp. 121-133
from ccap import pntDataset
pnt = pntDataset()

# 最初のデータの画像ファイル名と対応するラベルの表示
print(pnt(0))

# 総データ数の表示
print(pnt.__len__())

# 4 番目の画像の表示
pnt.show_an_image(3)

In [None]:
# Snodgrass and Vanderwart の利用
from ccap import snodgrassDataset
snodgrass = snodgrassDataset()

# 最初のデータの画像ファイル名と対応するラベルの表示
print(snodgrass(0))

# 総データ数の表示
print(snodgrass.__len__())

# 4 番目の画像の表示
snodgrass.show_an_image(4)