# pipelineの使い方

In [None]:
# GPUが使える環境なら
!pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu118


In [None]:
!pip install transformers[torch] ipywidgets datasets

In [None]:
from transformers import pipeline
import torch

# pipelineではモデルの指定をしなくても利用可能。
# 最低限のコードで様々なモデルが利用可能。


for i in range(torch.cuda.device_count()):
    print(f"GPU {i}: {torch.cuda.get_device_name(i)}")


## テキスト生成

In [None]:
# "When I lost my wallet" のような文の続きを生成します。


generator = pipeline("text-generation")
result = generator("When I lost my wallet,", max_length=50, num_return_sequences=1)
print(result[0]['generated_text'])

## 感情分析

In [None]:
# 与えられた文がポジティブかネガティブかを判定します。

classifier = pipeline("sentiment-analysis")
result = classifier("I love using Transformers!")
print(result)


## 固有表現抽出



In [None]:
# 文章中の人名、地名、組織名などを抽出します。

from transformers import pipeline

ner = pipeline("ner", grouped_entities=True)
result = ner("My name is Sarah and I live in London.")
print(result)

## 要約

In [None]:
# 長い文章を要約して短くします。

summarizer = pipeline("summarization")

text = """Transformers are models that process sequential input data by using attention mechanisms.
They have become the model of choice for natural language processing tasks."""

summary = summarizer(text, max_length=50, min_length=20)

print(summary)

## 質問応答（Question Answering）


In [None]:
# 文脈を与えて、それに対する質問に答えさせる形式です。

qa = pipeline("question-answering")
result = qa({
    "question": "Where do I live?",
    "context": "My name is Sarah and I live in London."
})
print(result)

## 特定のモデルを読み込む方法

最近登場したQwen3の場合

https://huggingface.co/Qwen/Qwen3-0.6B

https://huggingface.co/Qwen/Qwen3-8B

llama3 8bの場合は30GBくらいあった。

In [None]:
# ノートで動かすなら 0.6Bがおすすめ

messages = [
    {"role": "user", "content": "おはよう！"},
]
generator = pipeline("text-generation", model="Qwen/Qwen3-0.6B")


In [None]:
text=generator(messages,max_length=250, num_return_sequences=1)

print(text[0]["generated_text"][1]["content"])

### モデルを直接読み込んだ後にpipelineを作成する方法

In [None]:
from transformers import AutoTokenizer, AutoModelForCausalLM, pipeline

# モデルとトークナイザーを先に読み込む
model_name = "Qwen/Qwen3-0.6B"
tokenizer = AutoTokenizer.from_pretrained(model_name)
model = AutoModelForCausalLM.from_pretrained(model_name)

# 読み込んだモデル・トークナイザーから pipeline を作成
generator = pipeline("text-generation", model=model, tokenizer=tokenizer)



In [None]:
# 推論

messages = [
    {"role": "system", "content": "あなたは親切で賢い日本語アシスタントです。"},
    {"role": "user",   "content": "おはよう！"}
]


result = generator(messages, max_new_tokens=250)
print(result[0]["generated_text"][2]["content"])