<a href="https://colab.research.google.com/github/devacomputer56/Better-TextField-with-animation-SwiftUI/blob/main/%E6%97%A5%E6%9C%AC%E8%AA%9E%E8%A8%80%E8%AA%9E%E3%83%A2%E3%83%87%E3%83%AB%E3%81%AE%E3%82%B5%E3%83%B3%E3%83%97%E3%83%AB%E3%82%B3%E3%83%BC%E3%83%89.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

In [None]:
# 必要なライブラリをインポートします。
# transformers: 言語モデルを扱うためのライブラリ
# torch: モデルの実行に必要な深層学習フレームワーク (TensorFlowでも可)
try:
    from transformers import AutoModelForCausalLM, AutoTokenizer
    import torch
except ImportError:
    print("必要なライブラリ(transformers, torch)がインストールされていません。")
    print("以下のコマンドでインストールしてください:")
    print("pip install transformers torch")
    exit()

# 使用する日本語の事前学習済みモデルを指定します。
# rinna/japanese-gpt2-medium は、日本語のテキスト生成に適したモデルです。
model_name = "rinna/japanese-gpt2-medium"

try:
    # Tokenizerとモデルをロードします。
    # Tokenizerはテキストをモデルが理解できる形式に変換します。
    # AutoTokenizer.from_pretrained() でモデル名に対応するTokenizerを自動的にロードします。
    tokenizer = AutoTokenizer.from_pretrained(model_name)

    # AutoModelForCausalLM.from_pretrained() でモデル名に対応するモデルを自動的にロードします。
    # CausalLM (Causal Language Model) は、前の単語から次の単語を予測するモデルで、テキスト生成に用いられます。
    model = AutoModelForCausalLM.from_pretrained(model_name)

    # GPUが利用可能であればGPUにモデルを移動します。
    # GPUを使用すると計算が高速になります。
    if torch.cuda.is_available():
        model.to("cuda")
        print("GPUを使用します。")
    else:
        print("CPUを使用します。")

except Exception as e:
    print(f"モデルまたはTokenizerのロード中にエラーが発生しました: {e}")
    print("モデル名が正しいか、インターネット接続があるか確認してください。")
    exit()


# テキスト生成のプロンプト（開始となるテキスト）を設定します。
prompt_text = "昔々あるところに、"
print(f"プロンプト: {prompt_text}")

try:
    # プロンプトテキストをTokenizerでエンコード（数値IDに変換）します。
    # return_tensors="pt" でPyTorchのテンソル形式で返却します。
    input_ids = tokenizer.encode(prompt_text, return_tensors="pt")

    # GPUを使用している場合は、入力テンソルもGPUに移動します。
    if torch.cuda.is_available():
        input_ids = input_ids.to("cuda")

    # モデルを使ってテキストを生成します。
    # generate() メソッドは、与えられた入力IDからテキストを生成します。
    # max_length: 生成するテキストの最大長（入力テキストを含む）
    # num_return_sequences: 生成するテキストの候補数
    # no_repeat_ngram_size: 指定したサイズのngramの繰り返しを防ぎます。
    # top_k, top_p, temperature: 生成されるテキストの多様性を制御するパラメータ
    output_sequences = model.generate(
        input_ids,
        max_length=100,  # 生成するテキストの最大長
        num_return_sequences=1, # 1つの候補を生成
        no_repeat_ngram_size=2, # 2-gramの繰り返しを防ぐ
        # その他の生成パラメータの例 (必要に応じて調整)
        # top_k=50,
        # top_p=0.95,
        # temperature=0.7,
    )

    # 生成された各シーケンスをTokenizerでデコード（テキストに戻す）します。
    print("\n--- 生成結果 ---")
    for i, generated_sequence in enumerate(output_sequences):
        # skip_special_tokens=True で、特殊トークン（例: [CLS], [SEP]）を除外します。
        generated_text = tokenizer.decode(generated_sequence, skip_special_tokens=True)
        print(f"生成テキスト {i+1}: {generated_text}")

except Exception as e:
    print(f"テキスト生成中にエラーが発生しました: {e}")

The secret `HF_TOKEN` does not exist in your Colab secrets.
To authenticate with the Hugging Face Hub, create a token in your settings tab (https://huggingface.co/settings/tokens), set it as secret in your Google Colab and restart your session.
You will be able to reuse this secret in all of your notebooks.
Please note that authentication is recommended but still optional to access public models or datasets.


tokenizer_config.json:   0%|          | 0.00/282 [00:00<?, ?B/s]

spiece.model:   0%|          | 0.00/806k [00:00<?, ?B/s]

special_tokens_map.json:   0%|          | 0.00/153 [00:00<?, ?B/s]

You are using the default legacy behaviour of the <class 'transformers.models.t5.tokenization_t5.T5Tokenizer'>. This is expected, and simply means that the `legacy` (previous) behavior will be used so nothing changes for you. If you want to use the new behaviour, set `legacy=False`. This should only be set if you understand what it means, and thoroughly read the reason why this was added as explained in https://github.com/huggingface/transformers/pull/24565


config.json:   0%|          | 0.00/799 [00:00<?, ?B/s]

model.safetensors:   0%|          | 0.00/1.37G [00:00<?, ?B/s]

The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.
The attention mask is not set and cannot be inferred from input because pad token is same as eos token. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.


CPUを使用します。
プロンプト: 昔々あるところに、

--- 生成結果 ---
生成テキスト 1: 昔々あるところに、貧乏な家に生まれた 貧乏神 という 神様がいました。 お金持ちの 家に生まれ、 貧しい暮らしを 送っていましたが、 ある時、貧乏神の 家に 遊びに行った 男の子が、 「お金が欲しい」 と言いました。 「貧乏神様」は、 その男の子に こう言いました 「おまえは 何でも できるんだ。 おまえのおかげで、 おれは おかげさまで、


In [None]:
pip install transformers torch

Collecting nvidia-cuda-nvrtc-cu12==12.4.127 (from torch)
  Downloading nvidia_cuda_nvrtc_cu12-12.4.127-py3-none-manylinux2014_x86_64.whl.metadata (1.5 kB)
Collecting nvidia-cuda-runtime-cu12==12.4.127 (from torch)
  Downloading nvidia_cuda_runtime_cu12-12.4.127-py3-none-manylinux2014_x86_64.whl.metadata (1.5 kB)
Collecting nvidia-cuda-cupti-cu12==12.4.127 (from torch)
  Downloading nvidia_cuda_cupti_cu12-12.4.127-py3-none-manylinux2014_x86_64.whl.metadata (1.6 kB)
Collecting nvidia-cudnn-cu12==9.1.0.70 (from torch)
  Downloading nvidia_cudnn_cu12-9.1.0.70-py3-none-manylinux2014_x86_64.whl.metadata (1.6 kB)
Collecting nvidia-cublas-cu12==12.4.5.8 (from torch)
  Downloading nvidia_cublas_cu12-12.4.5.8-py3-none-manylinux2014_x86_64.whl.metadata (1.5 kB)
Collecting nvidia-cufft-cu12==11.2.1.3 (from torch)
  Downloading nvidia_cufft_cu12-11.2.1.3-py3-none-manylinux2014_x86_64.whl.metadata (1.5 kB)
Collecting nvidia-curand-cu12==10.3.5.147 (from torch)
  Downloading nvidia_curand_cu12-10.3.5