# day 2

---

## 1. SageMaker Studio Lab の使い方

> 引用元: ''Getting Started with Amazon SageMaker Studio Lab''

### 1.1 SageMaker Studio Lab とは

SageMaker Studio Lab は、15GBの永続的なストレージとCPUまたはGPUランタイムにアクセスできるノートブック開発環境です。プロジェクトに関するすべてのもの(ノートブック、ソースコードファイル、データセット、クローンした Git リポジトリ、Conda 環境、JupyterLab 拡張機能など)は自動的に保存されるので、プロジェクトを起動するたびに、中断した場所から再開することができます。SageMaker Studio LabはオープンソースのJupyterLab をベースにしているため、プロジェクトでオープンソースのJupyter拡張機能を利用することができます。

### 1.1 Python コードを実行する

このドキュメントは、[Jupyter notebook](https://jupyter.org/)です。ノートブックでは、ライブコード、数式、Markdown、画像、視覚化、その他のコンテンツを1つのドキュメントにまとめ、他の人と共有することができます。

以下のPythonコードを実行するには、セルをクリックして選択し、キーボードで`Shift-Enter`を入力するか、ドキュメントの上部にあるノートブックツールバーの再生ボタンをクリックします。

In [1]:
a = 10
b = 20
c = a + b
print(a, b, c)

10 20 30


Pythonについて詳しく知りたい方は、[Python早見表](https://chokkan.github.io/python/)などが参考になります。

### 1.2 基本操作

ノートブックの作成、ソースコードファイルの作成、ターミナルへのアクセス

SageMaker Studio Lab では、ノートブックの作成、ソースコードファイルの作成、内蔵ターミナルへのアクセスが可能です。左パネルのファイルブラウザの上部にある「+」ボタンをクリックしてLauncherを開くことで行えます:

![ランチャーボタン](images/launcher_button.png)

ランチャーには、さまざまな環境でノートブックを起動したり、ソースコードファイルを作成したり、ターミナルにアクセスしたりするためのカードが用意されています:

![Launcher Cards](images/launcher_cards.png)

作成したノートブック、ファイル、データセットはすべて永続的なプロジェクトディレクトリに保存され、プロジェクトを開くと利用できるようになります。ヘルプを入手したり、ドキュメントにアクセスするには、ページ上部のメニューバーにある **Help** メニューをクリックします。

### 1.2 Python パッケージをインストールするには

Pythonのパッケージは、他のプログラムから再利用できるようにPythonのコードをまとめたファイルです. Pythonのパッケージをインストールする最も簡単な方法は、ノートブックのコードセルで次のいずれかのマジックコマンドを使用することです:

`%conda install <package>`

`%pip install <package>`

これらのコマンドは、常にノートブックで使用されている環境にパッケージをインストールし、インストールしたパッケージは、永続的なプロジェクトディレクトリに保存されます。注意: `!pip` or `!conda` を使うことはお勧めしません。複数の環境がある場合、これらのコマンドは予期せぬ動作をすることがあるためです。(Jypyter notebookでは`%`で始まるコマンドを「マジックコマンド」と呼びます)

以下は、このノートブックで使用する環境に **NumPy** と呼ばれるパッケージをインストールする方法を示す例です:

In [None]:
%conda install numpy

これで **NumPy** が使えるようになりました:

In [2]:
import numpy as np
np.random.rand(10)

array([0.33928159, 0.75584376, 0.0559167 , 0.35698812, 0.05793997,
       0.27860511, 0.44758925, 0.18289235, 0.46074772, 0.34738805])

### (参考) SageMaker Studio Lab のサンプルノートブック

#### Python早見表

[Python早見表](https://chokkan.github.io/python/)は、東京工業大学の岡崎直観先生が作成された Python の入門教材です。プログラムと実行例をカタログ的に提示しながら、Pythonの言語仕様やライブラリを紹介しています。Pythonの基礎を素早く習得したり、ライブラリやオブジェクトの使い方を確認することができます。教材にある以下のボタンをクリクすることで、SageMaker上にノートブックを開くことができます。

![Open In SageMaker Studio Lab](https://studiolab.sagemaker.aws/studiolab.svg)

---

## 2. 環境構築

### 2.1 MeCab のインストール

In [3]:
!bash ../scripts/install_mecab.sh > install_mecab.log 2>&1

### 2.2 CaboCha のインストール

In [None]:
!bash ../scripts/install_cabocha.sh > install_cabocha.log 2>&1

### 2.3 Kernel のリスタート

In [None]:
import os
os._exit(0)

---

## 3. 形態素解析

### 3.1 MeCab を使う

In [None]:
import MeCab

tagger = MeCab.Tagger("-r ../tools/usr/local/etc/mecabrc")
print(tagger.parse("今日はいい天気です"))

---

## 4. 係り受け解析

### 4.1 CaboCha を使う

In [None]:
import CaboCha

cp = CaboCha.Parser("-r ../tools/usr/local/etc/cabocharc")
tree = cp.parse("今日はいい天気です")
print(tree.toString(CaboCha.FORMAT_LATTICE))