# HuggingfaceからMicrosoftのPhi-1.5を使ってみよう

https://huggingface.co/microsoft/phi-1_5

### Google Colab
https://drive.google.com/file/d/1UwTu5I6HW1mOnxMZmVPgvofrlB_zv35q/view?usp=sharing


# #01 ライブラリのインポート

In [None]:
import torch
from transformers import AutoModelForCausalLM, AutoTokenizer


# #02 GPU / MPS / CPUの選択

In [None]:
if torch.cuda.is_available():
    device = 'cuda'
elif torch.backends.mps.is_available():
    device = 'mps'
else:
    device = 'cpu'
device

# #03 トークナイザーとモデルのダウンロード

In [None]:
torch.set_default_device(device)

model = AutoModelForCausalLM.from_pretrained("microsoft/phi-1_5", torch_dtype="auto")
tokenizer = AutoTokenizer.from_pretrained("microsoft/phi-1_5")

# #04 推論させてみる
## #04-1 トークナイザーを使って、文章をトークンIDに変換する

In [None]:

inputs = tokenizer('please tell me how to play a fiddle.', return_tensors="pt", return_attention_mask=False)
inputs

In [None]:
inputs.input_ids[0]

## #04-2 トークンIDを文章に戻して確認する

In [None]:
tokenizer.decode(inputs.input_ids[0])

## #04-3 モデルにトークンIDを渡して、出力を確認する

In [None]:
outputs = model.generate(**inputs, max_length=200)
outputs

## #04-4 モデルから出てきたトークンIDを文章に戻す

In [None]:
text = tokenizer.batch_decode(outputs)[0]
print(text)


# #05 DXクエストについて聞いてみよう

In [None]:
inputs = tokenizer('Please tell me about manabi-DX-Quest.', return_tensors="pt", return_attention_mask=False)

In [None]:
outputs = model.generate(**inputs, max_length=200)
text = tokenizer.batch_decode(outputs)[0]
print(text)

# #06 プログラムを書かせてみよう

In [None]:
# まず、関数の例
def add_num(a, b):
    '''引数の二つの値を足す。   <- Docstringsという
    '''
    return a + b

In [None]:
add_num(4, 5)

In [None]:
text = '''
def print_prime(n):
    """Print all primes between 1 and n
    """
'''

# 1からnまでの数字で素数をプリントする関数

In [None]:
text = '''
def check_division_type(a, b):
    """When performing a/b, return "integer" if the result is an integer, and "float" if the result has a decimal point.
    """
'''

# a/bをした時に整数ならinteger、小数点があるならfloatと返す関数


In [None]:
inputs = tokenizer(text, return_tensors='pt', return_attention_mask=False)
inputs

In [None]:
inputs.input_ids.size()

In [None]:
tokenizer.decode(inputs.input_ids[0])

In [None]:
outputs = model.generate(**inputs, max_length=400)
text = tokenizer.batch_decode(outputs)[0]
print(text)

# #07 ファインチューニングに向けて、モデルの設定を確認する

In [None]:
from transformers import AutoConfig

phi15_config = AutoConfig.from_pretrained("microsoft/phi-1_5")
phi15_config