In [1]:
!pip install --upgrade transformers
!pip install google-colab-selenium
!pip install bitsandbytes
!pip install -U openai
!pip install htmlrag

[0mCollecting bitsandbytes
  Using cached bitsandbytes-0.45.5-py3-none-manylinux_2_24_x86_64.whl.metadata (5.0 kB)
Collecting nvidia-cudnn-cu12==9.1.0.70 (from torch<3,>=2.0->bitsandbytes)
  Using cached nvidia_cudnn_cu12-9.1.0.70-py3-none-manylinux2014_x86_64.whl.metadata (1.6 kB)
Collecting nvidia-cusolver-cu12==11.6.1.9 (from torch<3,>=2.0->bitsandbytes)
  Using cached nvidia_cusolver_cu12-11.6.1.9-py3-none-manylinux2014_x86_64.whl.metadata (1.6 kB)
Using cached bitsandbytes-0.45.5-py3-none-manylinux_2_24_x86_64.whl (76.1 MB)
Using cached nvidia_cudnn_cu12-9.1.0.70-py3-none-manylinux2014_x86_64.whl (664.8 MB)
Using cached nvidia_cusolver_cu12-11.6.1.9-py3-none-manylinux2014_x86_64.whl (127.9 MB)
[0mInstalling collected packages: nvidia-cudnn-cu12, nvidia-cusolver-cu12, bitsandbytes
  Attempting uninstall: nvidia-cusolver-cu12
[0m    Found existing installation: nvidia-cusolver-cu12 11.6.3.83
    Uninstalling nvidia-cusolver-cu12-11.6.3.83:
      Successfully uninstalled nvidia-cu

In [2]:
!git clone https://github.com/Uminchu618/lecture-ai-engineering.git

Cloning into 'lecture-ai-engineering'...
remote: Enumerating objects: 114, done.[K
remote: Counting objects: 100% (52/52), done.[K
remote: Compressing objects: 100% (39/39), done.[K
remote: Total 114 (delta 31), reused 26 (delta 13), pack-reused 62 (from 1)[K
Receiving objects: 100% (114/114), 570.45 KiB | 4.53 MiB/s, done.
Resolving deltas: 100% (46/46), done.


In [3]:
import warnings
warnings.filterwarnings('ignore')

In [4]:
# HuggingFace Login
from google.colab import userdata
from huggingface_hub import login

login(token=userdata.get('HUGGINGFACE_HUB_TOKEN'))

In [5]:
# CUDAが利用可能ならGPUを、それ以外ならCPUをデバイスとして設定
import torch
device = torch.device("cuda" if torch.cuda.is_available() else "cpu")

In [6]:
import random
random.seed(0)

In [7]:
# モデル(Llama3)の読み込み

from transformers import AutoModelForCausalLM, AutoTokenizer, BitsAndBytesConfig

model_name = "meta-llama/Meta-Llama-3-8B-Instruct"
tokenizer = AutoTokenizer.from_pretrained(model_name)

bnb_config = BitsAndBytesConfig(
    load_in_4bit=True,
    bnb_4bit_compute_dtype=torch.float16,
    bnb_4bit_quant_type="nf4",
    bnb_4bit_use_double_quant=False,
)

model = AutoModelForCausalLM.from_pretrained(
            model_name,
            device_map="auto",
            quantization_config=bnb_config,
            torch_dtype=torch.bfloat16,
        )

tokenizer_config.json:   0%|          | 0.00/51.0k [00:00<?, ?B/s]

tokenizer.json:   0%|          | 0.00/9.09M [00:00<?, ?B/s]

special_tokens_map.json:   0%|          | 0.00/73.0 [00:00<?, ?B/s]

config.json:   0%|          | 0.00/654 [00:00<?, ?B/s]

model.safetensors.index.json:   0%|          | 0.00/23.9k [00:00<?, ?B/s]

Fetching 4 files:   0%|          | 0/4 [00:00<?, ?it/s]

model-00002-of-00004.safetensors:   0%|          | 0.00/5.00G [00:00<?, ?B/s]

model-00004-of-00004.safetensors:   0%|          | 0.00/1.17G [00:00<?, ?B/s]

model-00003-of-00004.safetensors:   0%|          | 0.00/4.92G [00:00<?, ?B/s]

model-00001-of-00004.safetensors:   0%|          | 0.00/4.98G [00:00<?, ?B/s]

Loading checkpoint shards:   0%|          | 0/4 [00:00<?, ?it/s]

generation_config.json:   0%|          | 0.00/187 [00:00<?, ?B/s]

In [8]:
# 質問のリスト
questions = [
    "すでに構築したクラウド環境を IaC に変換する機能はありますか？",
    "大量の機械学習トレーニングデータはどこに保管すべきですか？その理由も含めて説明してください。",
    "SageMakerのトレーニングジョブが S3 にアクセスするには IAM ユーザーが必要ですか？",
    "SageMakerのトレーニング費用を抑える方法はありますか？",
    "Notebook Instance と SageMaker Studio はどう使い分けるべきですか？",
    "BedrockでDeepSeek-R1を使った場合、どのくらいの推論コストがかかりますか？"
]

# 回答のリスト
answers = [
    "はい。AWS CloudFormation の IaC ジェネレーター機能では、既存リソースからテンプレートを生成することができます。Terraform でも `terraform import` コマンドを使い、状態ファイルに既存リソースを登録できます。",
    "Amazon S3 が推奨です。オブジェクトを自動で冗長化し、11 ナイン (99.999999999 %) の耐久性を提供します。データレイクや SageMaker とネイティブ統合され、ペタバイト級でもスケールを意識せずに利用できます。S3 イベントで Lambda を呼び出せば、取込直後の前処理やメタデータ登録も自動化できます。",
    "IAM ユーザーは不要です。SageMaker には **IAM 実行ロール** を付与し、そのロールに `s3:*` など必要なポリシーをアタッチします。ジョブ実行時、SageMaker はこのロールを引き受けて S3 や CloudWatch などのサービス API を呼び出します。",
    "Amazon SageMaker **Managed Spot Training** を有効にすると、オンデマンド比で最大 90 % のコスト削減が可能です。Spot 中断に備えてチェックポイントを S3 に保存する仕組みがあり、再開時に自動で引き継げます。学習時間よりコスト優先のワークロードで効果が高いベストプラクティスです。",
    "Studio Classic ノートブックは起動が Notebook Instance より 5–10 倍速く、インスタンス種別もブラウザから即変更できます。Notebook Instance はシングルユーザーで完全に分離した環境が欲しい場合や、従来の CLI/SDK 手順を重視するケースに向きます。いずれも従量課金ですが、Studio はアイドル状態の EFS ストレージ料金、Instance は EC2 実行料金の最小化がポイントです。",
    "1,000 入力トークンあたりの料金は 0.00135 USD、1,000 出力トークンあたりの料金は 0.0054 USDです。これは、他のオープンモデル（Llama 3.3 など）に対して比較的高い料金となっています。"
]


In [9]:
def generate_output(query, system_prompt=None):
  if system_prompt is None:
    messages = [
        {"role": "user", "content": query},
    ]
  else:
    messages = [
        {"role": "system", "content": system_prompt},
        {"role": "user", "content": query},
    ]
  input_ids = tokenizer.apply_chat_template(
      messages,
      add_generation_prompt=True,
      return_tensors="pt"
  ).to(model.device)

  terminators = [
      tokenizer.eos_token_id,
      tokenizer.convert_tokens_to_ids("<|eot_id|>")
  ]

  outputs = model.generate(
      input_ids,
      max_new_tokens=256,
      eos_token_id=terminators,
      do_sample=False,
      # temperature=0.6, # If do_sample=True
      # top_p=0.9,  # If do_sample=True
  )

  response = outputs[0][input_ids.shape[-1]:]
  return tokenizer.decode(response, skip_special_tokens=True)

In [10]:
# システムプロンプト
system_prompt = "質問に回答してください。必ず「日本語で回答」すること。１００文字以内で回答すること。"
responses = []
# 各質問に回答を生成
for i, q in enumerate(questions, start=1):
    print(f"### {i}. {q}")
    response = generate_output(q, system_prompt)
    print("**回答**")
    print(response)
    print("\n" + "---" + "\n")
    responses.append(response)

The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:128009 for open-end generation.
The attention mask is not set and cannot be inferred from input because pad token is same as eos token. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.


### 1. すでに構築したクラウド環境を IaC に変換する機能はありますか？


The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:128009 for open-end generation.


**回答**
はい、すでに構築したクラウド環境を Infrastructure as Code (IaC) に変換する機能はあります。例えば、AWS CloudFormation、Azure Resource Manager (ARM)、Google Cloud Deployment Manager などのクラウドプロバイダーが提供するツールや、third-party のソフトウェアとして、Cloudify、Terraform、Ansible などがあります。これらのツールを使用することで、既に構築されたクラウド環境を IaC に変換し、自動化されたインフラストラクチャーの管理を実現することができます。

---

### 2. 大量の機械学習トレーニングデータはどこに保管すべきですか？その理由も含めて説明してください。


The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:128009 for open-end generation.


**回答**
大量の機械学習トレーニングデータは、セキュアでアクセス制限のあるストレージに保管すべきです。理由は、以下の通りです。

1. データのセキュリティー：機械学習トレーニングデータには、個人情報や商業機密情報などが含まれることがあります。セキュアなストレージでデータを保管することで、不正アクセスやデータ漏洩を防ぐことができます。
2. データの整合性：大量のトレーニングデータを保管するには、ストレージの容量や性能が必要です。セキュアなストレージでは、データの整合性を保つことができます。
3. データのアクセス制限：機械学習トレーニングデータは、特定のチームや個人にのみアクセスする必要があります。セキュアなストレージでは、アクセス制限を設定することができます。

日本の企業では、以下のようなストレージを使用することが多いです。

* Amazon S3：クラウドベースのストレージサービスで

---

### 3. SageMakerのトレーニングジョブが S3 にアクセスするには IAM ユーザーが必要ですか？


The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:128009 for open-end generation.


**回答**
はい、SageMakerのトレーニングジョブがS3にアクセスするには、IAMユーザーが必要です。SageMakerは、IAMを使用してS3にアクセスするための認証を行います。SageMakerのIAMロールには、S3にアクセスするための権限が必要です。特に、S3バケットに書き込みや読み取りを行う権限が必要です。SageMakerの設定で、IAMロールを指定することで、SageMakerがS3にアクセスするための認証を行うことができます。

---

### 4. SageMakerのトレーニング費用を抑える方法はありますか？


The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:128009 for open-end generation.


**回答**
はい、SageMakerのトレーニング費用を抑える方法はいくつかあります。以下はその一例です。

1. ハイパーパラメーターのチューニング：適切なハイパーパラメーターを選択することで、モデルがより効率的に学習することができます。
2. モデルの圧縮：モデルを圧縮することで、ストレージやネットワークの使用量を減らすことができます。
3. 並列化：複数のGPUやインスタンスに分散して計算を実行することで、トレーニング時間を短縮することができます。
4. 低コストのインスタンスの使用：低コストのインスタンスを使用することで、トレーニング費用を抑えることができます。
5.  Early Stopping：モデルが過学習するのを防ぐために、早期に停止することができます。

これらの方法を組み合わせることで、SageMakerのトレーニング費用を抑えることができます。

---

### 5. Notebook Instance と SageMaker Studio はどう使い分けるべきですか？


The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:128009 for open-end generation.


**回答**
Notebook InstanceとSageMaker Studioは、AWS SageMakerの2つのサービスです。Notebook Instanceは、Jupyter NotebookやApache Zeppelinなどのnotebook環境を提供し、データサイエンティストや機械学習エンジニアがコードを実行するための環境を提供します。SageMaker Studioは、統合された開発環境で、データサイエンティストや機械学習エンジニアが、データの探索、特徴量の作成、モデル開発、デプロイメントなど、機械学習の全プロセスを一元化して実行することができます。

Notebook Instanceは、個々のnotebook環境を提供し、各々のプロジェクトに特化した環境を提供します。SageMaker Studioは、複数のnotebook環境を統合し、プロジェクト全体のビューを提供します。したがって、Notebook Instanceは、個々のnotebook環境を提供し、SageMaker Studioは、プロジェクト全体のビューを提供するという使い分けが適切です。

---

### 6. BedrockでDeepSeek-R1を使った場合、どのくらいの推論コストがかかりますか？
**回答**
BedrockのDeepSeek-R1は、推論コストを最小化するために設計された。具体的には、推論コストは、DeepSeek-R1のモデルサイズ、推論の精度、ハードウェアの性能などに依存します。

しかし、Bedrockの公式ドキュメントによると、DeepSeek-R1の推論コストは、通常の推論コストの1/10から1/100程度に抑えられます。例えば、1秒あたり100万回の推論を実行する場合、DeepSeek-R1では1秒あたり1万回から10万回の推論を実行することができます。

ただし、実際の推論コストは、ハードウェアの性能、モデルサイズ、推論の精度などに依存するため、実際の推論コストは異なる可能性があります。

---



In [11]:
from openai import OpenAI

client = OpenAI(api_key=userdata.get("OPENAI_API_KEY"), max_retries=5, timeout=60)

def openai_generator(query):

        messages = [
                    {
                        "role": "user",
                        "content": query
                    }
                ]

        response = client.chat.completions.create(
            model="gpt-4o-mini",
            messages=messages
        )
        return response.choices[0].message.content

def evaluate_answer_accuracy(query, response, reference):

    template_accuracy1 = (
          "Instruction: You are a world class state of the art assistant for rating "
          "a User Answer given a Question. The Question is completely answered by the Reference Answer.\n"
          "Say 4, if User Answer is full contained and equivalent to Reference Answer"
          "in all terms, topics, numbers, metrics, dates and units.\n"
          "Say 2, if User Answer is partially contained and almost equivalent to Reference Answer"
          "in all terms, topics, numbers, metrics, dates and units.\n"
          "Say 0, if User Answer is not contained in Reference Answer or not accurate in all terms, topics,"
          "numbers, metrics, dates and units or the User Answer do not answer the question.\n"
          "Do not explain or justify your rating. Your rating must be only 4, 2 or 0 according to the instructions above.\n"
          "Even small discrepancies in meaning, terminology, directionality, or implication must result in a lower score. Only rate 4 if the User Answer is a complete and precise match to the Reference Answer in every aspect.\n"
          "### Question: {query}\n"
          "### {answer0}: {sentence_inference}\n"
          "### {answer1}: {sentence_true}\n"
          "The rating is:\n"
      )
    template_accuracy2 = (
          "I will rate the User Answer in comparison to the Reference Answer for a given Question.\n"
          "A rating of 4 indicates that the User Answer is entirely consistent with the Reference Answer, covering all aspects, topics, numbers, metrics, dates, and units.\n"
          "A rating of 2 signifies that the User Answer is mostly aligned with the Reference Answer, with minor discrepancies in some areas.\n"
          "A rating of 0 means that the User Answer is either inaccurate, incomplete, or unrelated to the Reference Answer, or it fails to address the Question.\n"
          "I will provide the rating without any explanation or justification, adhering to the following scale: 0 (no match), 2 (partial match), 4 (exact match).\n"
          "Even minor inconsistencies in meaning, terminology, emphasis, or factual detail should prevent a rating of 4. Only assign a 4 if the User Answer exactly and unambiguously matches the Reference Answer in every respect."
          "Do not explain or justify my rating. My rating must be only 4, 2 or 0 only.\n\n"
          "Question: {query}\n\n"
          "{answer0}: {sentence_inference}\n\n"
          "{answer1}: {sentence_true}\n\n"
          "Rating: "
      )

    score1 = openai_generator(
                template_accuracy1.format(
                      query=query,
                      answer0="User Answer",
                      answer1="Reference Answer",
                      sentence_inference=response,
                      sentence_true=reference,
                    )
                )
    try:
      score1 = int(score1)
    except:
      print("Failed")
      score1 = 0

    score2 = openai_generator(
                template_accuracy2.format(
                        query=query,
                        answer0="Reference Answer",
                        answer1="User Answer",
                        sentence_inference=reference,
                        sentence_true=response,
                    )
                  )

    try:
      score2 = int(score2)
    except:
      print("Failed")
      score2 = 0


    return (score1 + score2) / 2

In [12]:
print("| 評価番号 | スコア |")
print("|:--------:|:------:|")

# Iterate and print each row with only index and score
for i, (question, gold_answer, response) in enumerate(zip(questions, answers, responses), start=1):
    score = evaluate_answer_accuracy(question, response, gold_answer)
    print(f"| {i} | {score:.2f} |")


| 評価番号 | スコア |
|:--------:|:------:|
| 1 | 2.00 |
| 2 | 1.00 |
| 3 | 0.00 |
| 4 | 0.00 |
| 5 | 0.00 |
| 6 | 0.00 |


In [13]:
import htmlrag
import re
import glob

file_paths = glob.glob('/content/lecture-ai-engineering/day3/homework_data/*.html')
documents = []
for path in file_paths:
  html=open(path).read()
  simplified_html=htmlrag.clean_html(html)
  block_tree, simplified_html= htmlrag.build_block_tree(simplified_html, max_node_words=512)
  blocks = [
      re.sub(r'<[^>]+>', '', str(node[0])).split("\n")
      for node in block_tree
  ]
  documents.extend( [x for x in sum(blocks,[]) if len(x) > 20] )# 短い断片はゴミなので削除した


In [14]:
print("ドキュメントサイズ: ", len(documents))
print("ドキュメントの例: \n", documents[100])

ドキュメントサイズ:  1441
ドキュメントの例: 
 SageMaker AI コンソール、「https://https://console.aws.amazon.com/sagemaker/://www.


In [15]:
from sentence_transformers import SentenceTransformer

emb_model = SentenceTransformer("infly/inf-retriever-v1-1.5b", trust_remote_code=True)
# In case you want to reduce the maximum length:
emb_model.max_seq_length = 8192

modules.json:   0%|          | 0.00/349 [00:00<?, ?B/s]

config_sentence_transformers.json:   0%|          | 0.00/284 [00:00<?, ?B/s]

README.md:   0%|          | 0.00/19.8k [00:00<?, ?B/s]

sentence_bert_config.json:   0%|          | 0.00/55.0 [00:00<?, ?B/s]

config.json:   0%|          | 0.00/918 [00:00<?, ?B/s]

modeling_qwen.py:   0%|          | 0.00/65.2k [00:00<?, ?B/s]

A new version of the following files was downloaded from https://huggingface.co/infly/inf-retriever-v1-1.5b:
- modeling_qwen.py
. Make sure to double-check they do not contain any added malicious code. To avoid downloading new versions of the code file, you can pin a revision.


model.safetensors:   0%|          | 0.00/3.09G [00:00<?, ?B/s]

tokenizer_config.json:   0%|          | 0.00/1.33k [00:00<?, ?B/s]

tokenization_qwen.py:   0%|          | 0.00/10.8k [00:00<?, ?B/s]

A new version of the following files was downloaded from https://huggingface.co/infly/inf-retriever-v1-1.5b:
- tokenization_qwen.py
. Make sure to double-check they do not contain any added malicious code. To avoid downloading new versions of the code file, you can pin a revision.


vocab.json:   0%|          | 0.00/2.78M [00:00<?, ?B/s]

merges.txt:   0%|          | 0.00/1.67M [00:00<?, ?B/s]

tokenizer.json:   0%|          | 0.00/7.03M [00:00<?, ?B/s]

added_tokens.json:   0%|          | 0.00/80.0 [00:00<?, ?B/s]

special_tokens_map.json:   0%|          | 0.00/370 [00:00<?, ?B/s]

config.json:   0%|          | 0.00/297 [00:00<?, ?B/s]

In [16]:
responses = []
for i, question in enumerate(questions):
  print(f"### {i+1}. {question}")
  query_embeddings = emb_model.encode([question], prompt_name="query")
  document_embeddings = emb_model.encode(documents)

  # 各ドキュメントの類似度スコア
  scores = (query_embeddings @ document_embeddings.T) * 100
  topk = 5
  for i, index in enumerate(scores.argsort()[0][::-1][:topk]):
    references = []
    for ref in ["\n".join(documents[max(0, i-1): min(i+1, len(documents))]).strip() for i in scores.argsort()[0][::-1][:topk]]:

      system_prompt = "与えられた参考資料が質問に直接関連しているか？'yes''no'で答えること。ただし、余計なテキストを生成しないこと。"
      user_prompt =  f"[参考資料]\n{ref}\n\n[質問] {question}"
      response = generate_output(user_prompt, system_prompt)

      if "yes" in response.lower():
        print("\n\n対象となるドキュメント:\n", ref.replace("。", "。\n"))
        references.append(ref)

      print("\n\n")

  system_prompt = "質問に回答してください。必ず「日本語で回答」すること。また、与えられる資料を参考にして回答すること。"
  user_prompt =  f"[参考資料]\n{references}\n\n[質問] {question}"
  response = generate_output(user_prompt, system_prompt)
  print("**回答**")
  print(response)
  print("\n" + "---" + "\n")
  responses.append(response)


### 1. すでに構築したクラウド環境を IaC に変換する機能はありますか？


The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:128009 for open-end generation.
The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:128009 for open-end generation.
The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:128009 for open-end generation.










The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:128009 for open-end generation.
The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:128009 for open-end generation.




対象となるドキュメント:
 IaC ジェネレーターの機能は、すべての商用リージョンで利用可能で、多くの一般的な AWS リソースタイプをサポートしています。
サポートされているリソースの一覧については、「リソースタイプのサポート」を参照してください。
トピック考慮事項リソースのスキャンに必要な IAM アクセス許可テンプレートの生成、管理、削除によく使用されるコマンドテンプレートを AWS CDK に移行するCloudFormation IaC ジェネレーターを使用してリソーススキャンを開始するCloudFormation コンソールでスキャンの概要を表示するIaC ジェネレーターを使用してスキャンされたリソースから CloudFormation テンプレートを作成するスキャンしたリソースから CloudFormation スタックを作成する書き込み専用プロパティを解決する
読み取り権限のある AWS リソースであれば、JSON テンプレートまたは YAML テンプレートを生成できます。
IaC ジェネレーターの機能のテンプレートは、リソースプロパティをプロパティごとに記述することなく、クラウドリソースを確実かつ迅速にモデル化します。






対象となるドキュメント:
 読み取り権限のある AWS リソースであれば、JSON テンプレートまたは YAML テンプレートを生成できます。
IaC ジェネレーターの機能のテンプレートは、リソースプロパティをプロパティごとに記述することなく、クラウドリソースを確実かつ迅速にモデル化します。

次の表は、IaC の生成機能に使用できるクォータの一覧です。






The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:128009 for open-end generation.
The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:128009 for open-end generation.










The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:128009 for open-end generation.
The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:128009 for open-end generation.







対象となるドキュメント:
 IaC ジェネレーターの機能は、すべての商用リージョンで利用可能で、多くの一般的な AWS リソースタイプをサポートしています。
サポートされているリソースの一覧については、「リソースタイプのサポート」を参照してください。
トピック考慮事項リソースのスキャンに必要な IAM アクセス許可テンプレートの生成、管理、削除によく使用されるコマンドテンプレートを AWS CDK に移行するCloudFormation IaC ジェネレーターを使用してリソーススキャンを開始するCloudFormation コンソールでスキャンの概要を表示するIaC ジェネレーターを使用してスキャンされたリソースから CloudFormation テンプレートを作成するスキャンしたリソースから CloudFormation スタックを作成する書き込み専用プロパティを解決する
読み取り権限のある AWS リソースであれば、JSON テンプレートまたは YAML テンプレートを生成できます。
IaC ジェネレーターの機能のテンプレートは、リソースプロパティをプロパティごとに記述することなく、クラウドリソースを確実かつ迅速にモデル化します。






The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:128009 for open-end generation.
The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:128009 for open-end generation.




対象となるドキュメント:
 読み取り権限のある AWS リソースであれば、JSON テンプレートまたは YAML テンプレートを生成できます。
IaC ジェネレーターの機能のテンプレートは、リソースプロパティをプロパティごとに記述することなく、クラウドリソースを確実かつ迅速にモデル化します。

次の表は、IaC の生成機能に使用できるクォータの一覧です。









The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:128009 for open-end generation.
The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:128009 for open-end generation.










The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:128009 for open-end generation.
The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:128009 for open-end generation.




対象となるドキュメント:
 IaC ジェネレーターの機能は、すべての商用リージョンで利用可能で、多くの一般的な AWS リソースタイプをサポートしています。
サポートされているリソースの一覧については、「リソースタイプのサポート」を参照してください。
トピック考慮事項リソースのスキャンに必要な IAM アクセス許可テンプレートの生成、管理、削除によく使用されるコマンドテンプレートを AWS CDK に移行するCloudFormation IaC ジェネレーターを使用してリソーススキャンを開始するCloudFormation コンソールでスキャンの概要を表示するIaC ジェネレーターを使用してスキャンされたリソースから CloudFormation テンプレートを作成するスキャンしたリソースから CloudFormation スタックを作成する書き込み専用プロパティを解決する
読み取り権限のある AWS リソースであれば、JSON テンプレートまたは YAML テンプレートを生成できます。
IaC ジェネレーターの機能のテンプレートは、リソースプロパティをプロパティごとに記述することなく、クラウドリソースを確実かつ迅速にモデル化します。






対象となるドキュメント:
 読み取り権限のある AWS リソースであれば、JSON テンプレートまたは YAML テンプレートを生成できます。
IaC ジェネレーターの機能のテンプレートは、リソースプロパティをプロパティごとに記述することなく、クラウドリソースを確実かつ迅速にモデル化します。

次の表は、IaC の生成機能に使用できるクォータの一覧です。






The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:128009 for open-end generation.
The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:128009 for open-end generation.










The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:128009 for open-end generation.
The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:128009 for open-end generation.







対象となるドキュメント:
 IaC ジェネレーターの機能は、すべての商用リージョンで利用可能で、多くの一般的な AWS リソースタイプをサポートしています。
サポートされているリソースの一覧については、「リソースタイプのサポート」を参照してください。
トピック考慮事項リソースのスキャンに必要な IAM アクセス許可テンプレートの生成、管理、削除によく使用されるコマンドテンプレートを AWS CDK に移行するCloudFormation IaC ジェネレーターを使用してリソーススキャンを開始するCloudFormation コンソールでスキャンの概要を表示するIaC ジェネレーターを使用してスキャンされたリソースから CloudFormation テンプレートを作成するスキャンしたリソースから CloudFormation スタックを作成する書き込み専用プロパティを解決する
読み取り権限のある AWS リソースであれば、JSON テンプレートまたは YAML テンプレートを生成できます。
IaC ジェネレーターの機能のテンプレートは、リソースプロパティをプロパティごとに記述することなく、クラウドリソースを確実かつ迅速にモデル化します。






The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:128009 for open-end generation.
The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:128009 for open-end generation.




対象となるドキュメント:
 読み取り権限のある AWS リソースであれば、JSON テンプレートまたは YAML テンプレートを生成できます。
IaC ジェネレーターの機能のテンプレートは、リソースプロパティをプロパティごとに記述することなく、クラウドリソースを確実かつ迅速にモデル化します。

次の表は、IaC の生成機能に使用できるクォータの一覧です。









The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:128009 for open-end generation.
The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:128009 for open-end generation.










The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:128009 for open-end generation.
The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:128009 for open-end generation.




対象となるドキュメント:
 IaC ジェネレーターの機能は、すべての商用リージョンで利用可能で、多くの一般的な AWS リソースタイプをサポートしています。
サポートされているリソースの一覧については、「リソースタイプのサポート」を参照してください。
トピック考慮事項リソースのスキャンに必要な IAM アクセス許可テンプレートの生成、管理、削除によく使用されるコマンドテンプレートを AWS CDK に移行するCloudFormation IaC ジェネレーターを使用してリソーススキャンを開始するCloudFormation コンソールでスキャンの概要を表示するIaC ジェネレーターを使用してスキャンされたリソースから CloudFormation テンプレートを作成するスキャンしたリソースから CloudFormation スタックを作成する書き込み専用プロパティを解決する
読み取り権限のある AWS リソースであれば、JSON テンプレートまたは YAML テンプレートを生成できます。
IaC ジェネレーターの機能のテンプレートは、リソースプロパティをプロパティごとに記述することなく、クラウドリソースを確実かつ迅速にモデル化します。






対象となるドキュメント:
 読み取り権限のある AWS リソースであれば、JSON テンプレートまたは YAML テンプレートを生成できます。
IaC ジェネレーターの機能のテンプレートは、リソースプロパティをプロパティごとに記述することなく、クラウドリソースを確実かつ迅速にモデル化します。

次の表は、IaC の生成機能に使用できるクォータの一覧です。






The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:128009 for open-end generation.





**回答**
日本語で回答します。

IaC ジェネレーターには、すでに構築したクラウド環境を IaC に変換する機能があります。具体的には、リソーススキャン機能を使用して、既に存在する AWS リソースを IaC テンプレートに変換することができます。リソーススキャン機能では、読み取り権限のある AWS リソースをスキャンし、JSON テンプレートや YAML テンプレートに変換することができます。これにより、すでに構築したクラウド環境を IaC に変換することができます。

---

### 2. 大量の機械学習トレーニングデータはどこに保管すべきですか？その理由も含めて説明してください。


The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:128009 for open-end generation.
The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:128009 for open-end generation.
The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:128009 for open-end generation.










The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:128009 for open-end generation.
The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:128009 for open-end generation.










The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:128009 for open-end generation.
The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:128009 for open-end generation.










The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:128009 for open-end generation.
The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:128009 for open-end generation.










The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:128009 for open-end generation.
The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:128009 for open-end generation.










The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:128009 for open-end generation.
The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:128009 for open-end generation.










The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:128009 for open-end generation.
The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:128009 for open-end generation.










The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:128009 for open-end generation.
The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:128009 for open-end generation.










The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:128009 for open-end generation.
The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:128009 for open-end generation.










The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:128009 for open-end generation.
The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:128009 for open-end generation.










The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:128009 for open-end generation.
The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:128009 for open-end generation.










The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:128009 for open-end generation.
The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:128009 for open-end generation.










The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:128009 for open-end generation.





**回答**
大量の機械学習トレーニングデータの保管について、以下のような考慮点を踏まえて回答します。

1. **セキュリティ**: トレーニングデータには、機密情報や個人情報が含まれる可能性があります。したがって、安全な環境で保管することが重要です。
2. **スケーラビリティ**: トレーニングデータの量が増えるにつれて、ストレージの容量や処理能力が必要です。したがって、スケーラビリティの高いストレージやクラウドサービスを選択することが重要です。
3. **アクセス制御**: トレーニングデータにアクセスする権限を持つユーザーの数が増えるにつれて、権限の管理やアクセス制御が必要です。
4. **バックアップ**: トレーニングデータのバックアップを regularly することが重要です。これにより、データの失敗や破損に対処することができます。

以上の考慮点を踏まえて、以下のような保管方法を提案します。

* **Cloud Storage**: Amazon S3, Google

---

### 3. SageMakerのトレーニングジョブが S3 にアクセスするには IAM ユーザーが必要ですか？


The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:128009 for open-end generation.
The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:128009 for open-end generation.
The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:128009 for open-end generation.










The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:128009 for open-end generation.
The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:128009 for open-end generation.










The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:128009 for open-end generation.
The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:128009 for open-end generation.










The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:128009 for open-end generation.
The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:128009 for open-end generation.










The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:128009 for open-end generation.
The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:128009 for open-end generation.










The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:128009 for open-end generation.
The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:128009 for open-end generation.










The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:128009 for open-end generation.
The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:128009 for open-end generation.










The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:128009 for open-end generation.
The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:128009 for open-end generation.










The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:128009 for open-end generation.
The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:128009 for open-end generation.










The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:128009 for open-end generation.
The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:128009 for open-end generation.










The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:128009 for open-end generation.
The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:128009 for open-end generation.










The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:128009 for open-end generation.
The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:128009 for open-end generation.










The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:128009 for open-end generation.





**回答**
はい、SageMakerのトレーニングジョブがS3にアクセスするには、IAMユーザーが必要です。

SageMakerは、AWSのサービスであり、S3にアクセスするためにIAMユーザーが必要です。SageMakerは、IAMロールを使用して、S3にアクセスする権限を設定することができます。

特に、SageMakerのトレーニングジョブでは、S3に保存されたデータを読み込み、モデルをトレーニングするために、IAMユーザーが必要です。IAMユーザーは、S3にアクセスする権限を設定することで、SageMakerがS3にアクセスできるようにします。

また、SageMakerのトレーニングジョブでは、IAMロールを使用して、S3にアクセスする権限を設定することができます。例えば、SageMakerのトレーニングジョブに使用するIAMロールには、S3にアクセスする権限を設定することができます。

したがって、SageMakerのトレーニングジョブがS3にアクセ

---

### 4. SageMakerのトレーニング費用を抑える方法はありますか？


The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:128009 for open-end generation.
The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:128009 for open-end generation.
The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:128009 for open-end generation.




対象となるドキュメント:
 SageMaker Unified Studio での Amazon Bedrock のスムーズなオンボーディングエクスペリエンスを促進するために、「ユーザーガイド」で詳細なドキュメントをご覧いただけます。
追加の質問がある場合やさらにサポートが必要な場合は、担当の AWS アカウントチームに遠慮なくお問い合わせください。

Amazon SageMaker AI でのマネージドスポットトレーニング - Amazon SageMaker AIAmazon SageMaker AI でのマネージドスポットトレーニング - Amazon SageMaker AIドキュメントAmazon SageMakerデベロッパーガイド翻訳は機械翻訳により提供されています。
提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。
Amazon SageMaker AI でのマネージドスポットトレーニングAmazon SageMaker AI を使用すると、マネージド Amazon EC2 スポットインスタンスを使用して機械学習モデルを簡単にトレーニングできます。
マネージド型のスポットトレーニングでは、オンデマンドインスタンスと比較して、トレーニングモデルのコストを最大 90% 抑えることができます。
SageMaker AI は、ユーザーに代わってスポットの中断を管理します。
マネージドスポットトレーニングでは、オンデマンドインスタンスではなく Amazon EC2 スポットインスタンスを使用してトレーニングジョブを実行します。
スポットインスタンスを使用するトレーニングジョブと、SageMaker AI が Amazon EC2 スポットインスタンスを使用してジョブの実行を待機する時間を指定する停止条件を指定できます。
トレーニングの実行中に生成されたメトリクスとログは、CloudWatch にあります。
Amazon SageMaker AI 自動モデル調整は、ハイパーパラメータ調整とも呼ばれ、マネージドスポットトレーニングを使用できます。
自動モデルチューニングの詳細については、「SageMaker AI による自動モデル調整」を参照してください。
スポットインスタンスは中断されることがあります。
その場合、ジョ

The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:128009 for open-end generation.
The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:128009 for open-end generation.










The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:128009 for open-end generation.
The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:128009 for open-end generation.







対象となるドキュメント:
 SageMaker Unified Studio での Amazon Bedrock のスムーズなオンボーディングエクスペリエンスを促進するために、「ユーザーガイド」で詳細なドキュメントをご覧いただけます。
追加の質問がある場合やさらにサポートが必要な場合は、担当の AWS アカウントチームに遠慮なくお問い合わせください。

Amazon SageMaker AI でのマネージドスポットトレーニング - Amazon SageMaker AIAmazon SageMaker AI でのマネージドスポットトレーニング - Amazon SageMaker AIドキュメントAmazon SageMakerデベロッパーガイド翻訳は機械翻訳により提供されています。
提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。
Amazon SageMaker AI でのマネージドスポットトレーニングAmazon SageMaker AI を使用すると、マネージド Amazon EC2 スポットインスタンスを使用して機械学習モデルを簡単にトレーニングできます。
マネージド型のスポットトレーニングでは、オンデマンドインスタンスと比較して、トレーニングモデルのコストを最大 90% 抑えることができます。
SageMaker AI は、ユーザーに代わってスポットの中断を管理します。
マネージドスポットトレーニングでは、オンデマンドインスタンスではなく Amazon EC2 スポットインスタンスを使用してトレーニングジョブを実行します。
スポットインスタンスを使用するトレーニングジョブと、SageMaker AI が Amazon EC2 スポットインスタンスを使用してジョブの実行を待機する時間を指定する停止条件を指定できます。
トレーニングの実行中に生成されたメトリクスとログは、CloudWatch にあります。
Amazon SageMaker AI 自動モデル調整は、ハイパーパラメータ調整とも呼ばれ、マネージドスポットトレーニングを使用できます。
自動モデルチューニングの詳細については、「SageMaker AI による自動モデル調整」を参照してください。
スポットインスタンスは中断されることがあります。
その場合

The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:128009 for open-end generation.
The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:128009 for open-end generation.




対象となるドキュメント:
 Amazon SageMaker AI でのマネージドスポットトレーニング - Amazon SageMaker AIAmazon SageMaker AI でのマネージドスポットトレーニング - Amazon SageMaker AIドキュメントAmazon SageMakerデベロッパーガイド翻訳は機械翻訳により提供されています。
提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。
Amazon SageMaker AI でのマネージドスポットトレーニングAmazon SageMaker AI を使用すると、マネージド Amazon EC2 スポットインスタンスを使用して機械学習モデルを簡単にトレーニングできます。
マネージド型のスポットトレーニングでは、オンデマンドインスタンスと比較して、トレーニングモデルのコストを最大 90% 抑えることができます。
SageMaker AI は、ユーザーに代わってスポットの中断を管理します。
マネージドスポットトレーニングでは、オンデマンドインスタンスではなく Amazon EC2 スポットインスタンスを使用してトレーニングジョブを実行します。
スポットインスタンスを使用するトレーニングジョブと、SageMaker AI が Amazon EC2 スポットインスタンスを使用してジョブの実行を待機する時間を指定する停止条件を指定できます。
トレーニングの実行中に生成されたメトリクスとログは、CloudWatch にあります。
Amazon SageMaker AI 自動モデル調整は、ハイパーパラメータ調整とも呼ばれ、マネージドスポットトレーニングを使用できます。
自動モデルチューニングの詳細については、「SageMaker AI による自動モデル調整」を参照してください。
スポットインスタンスは中断されることがあります。
その場合、ジョブの開始または終了に時間がかかる場合があります。
チェックポイントを使用するように、マネージドスポットトレーニングジョブを設定できます。
SageMaker AI はチェックポイントデータをローカルパスから Amazon S3 にコピーします。
ジョブが再起動されると、SageMaker AI は Amazon S3 からロー

The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:128009 for open-end generation.
The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:128009 for open-end generation.










The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:128009 for open-end generation.
The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:128009 for open-end generation.




対象となるドキュメント:
 SageMaker Unified Studio での Amazon Bedrock のスムーズなオンボーディングエクスペリエンスを促進するために、「ユーザーガイド」で詳細なドキュメントをご覧いただけます。
追加の質問がある場合やさらにサポートが必要な場合は、担当の AWS アカウントチームに遠慮なくお問い合わせください。

Amazon SageMaker AI でのマネージドスポットトレーニング - Amazon SageMaker AIAmazon SageMaker AI でのマネージドスポットトレーニング - Amazon SageMaker AIドキュメントAmazon SageMakerデベロッパーガイド翻訳は機械翻訳により提供されています。
提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。
Amazon SageMaker AI でのマネージドスポットトレーニングAmazon SageMaker AI を使用すると、マネージド Amazon EC2 スポットインスタンスを使用して機械学習モデルを簡単にトレーニングできます。
マネージド型のスポットトレーニングでは、オンデマンドインスタンスと比較して、トレーニングモデルのコストを最大 90% 抑えることができます。
SageMaker AI は、ユーザーに代わってスポットの中断を管理します。
マネージドスポットトレーニングでは、オンデマンドインスタンスではなく Amazon EC2 スポットインスタンスを使用してトレーニングジョブを実行します。
スポットインスタンスを使用するトレーニングジョブと、SageMaker AI が Amazon EC2 スポットインスタンスを使用してジョブの実行を待機する時間を指定する停止条件を指定できます。
トレーニングの実行中に生成されたメトリクスとログは、CloudWatch にあります。
Amazon SageMaker AI 自動モデル調整は、ハイパーパラメータ調整とも呼ばれ、マネージドスポットトレーニングを使用できます。
自動モデルチューニングの詳細については、「SageMaker AI による自動モデル調整」を参照してください。
スポットインスタンスは中断されることがあります。
その場合、ジョ

The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:128009 for open-end generation.
The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:128009 for open-end generation.










The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:128009 for open-end generation.
The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:128009 for open-end generation.







対象となるドキュメント:
 SageMaker Unified Studio での Amazon Bedrock のスムーズなオンボーディングエクスペリエンスを促進するために、「ユーザーガイド」で詳細なドキュメントをご覧いただけます。
追加の質問がある場合やさらにサポートが必要な場合は、担当の AWS アカウントチームに遠慮なくお問い合わせください。

Amazon SageMaker AI でのマネージドスポットトレーニング - Amazon SageMaker AIAmazon SageMaker AI でのマネージドスポットトレーニング - Amazon SageMaker AIドキュメントAmazon SageMakerデベロッパーガイド翻訳は機械翻訳により提供されています。
提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。
Amazon SageMaker AI でのマネージドスポットトレーニングAmazon SageMaker AI を使用すると、マネージド Amazon EC2 スポットインスタンスを使用して機械学習モデルを簡単にトレーニングできます。
マネージド型のスポットトレーニングでは、オンデマンドインスタンスと比較して、トレーニングモデルのコストを最大 90% 抑えることができます。
SageMaker AI は、ユーザーに代わってスポットの中断を管理します。
マネージドスポットトレーニングでは、オンデマンドインスタンスではなく Amazon EC2 スポットインスタンスを使用してトレーニングジョブを実行します。
スポットインスタンスを使用するトレーニングジョブと、SageMaker AI が Amazon EC2 スポットインスタンスを使用してジョブの実行を待機する時間を指定する停止条件を指定できます。
トレーニングの実行中に生成されたメトリクスとログは、CloudWatch にあります。
Amazon SageMaker AI 自動モデル調整は、ハイパーパラメータ調整とも呼ばれ、マネージドスポットトレーニングを使用できます。
自動モデルチューニングの詳細については、「SageMaker AI による自動モデル調整」を参照してください。
スポットインスタンスは中断されることがあります。
その場合

The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:128009 for open-end generation.
The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:128009 for open-end generation.




対象となるドキュメント:
 Amazon SageMaker AI でのマネージドスポットトレーニング - Amazon SageMaker AIAmazon SageMaker AI でのマネージドスポットトレーニング - Amazon SageMaker AIドキュメントAmazon SageMakerデベロッパーガイド翻訳は機械翻訳により提供されています。
提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。
Amazon SageMaker AI でのマネージドスポットトレーニングAmazon SageMaker AI を使用すると、マネージド Amazon EC2 スポットインスタンスを使用して機械学習モデルを簡単にトレーニングできます。
マネージド型のスポットトレーニングでは、オンデマンドインスタンスと比較して、トレーニングモデルのコストを最大 90% 抑えることができます。
SageMaker AI は、ユーザーに代わってスポットの中断を管理します。
マネージドスポットトレーニングでは、オンデマンドインスタンスではなく Amazon EC2 スポットインスタンスを使用してトレーニングジョブを実行します。
スポットインスタンスを使用するトレーニングジョブと、SageMaker AI が Amazon EC2 スポットインスタンスを使用してジョブの実行を待機する時間を指定する停止条件を指定できます。
トレーニングの実行中に生成されたメトリクスとログは、CloudWatch にあります。
Amazon SageMaker AI 自動モデル調整は、ハイパーパラメータ調整とも呼ばれ、マネージドスポットトレーニングを使用できます。
自動モデルチューニングの詳細については、「SageMaker AI による自動モデル調整」を参照してください。
スポットインスタンスは中断されることがあります。
その場合、ジョブの開始または終了に時間がかかる場合があります。
チェックポイントを使用するように、マネージドスポットトレーニングジョブを設定できます。
SageMaker AI はチェックポイントデータをローカルパスから Amazon S3 にコピーします。
ジョブが再起動されると、SageMaker AI は Amazon S3 からロー

The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:128009 for open-end generation.
The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:128009 for open-end generation.










The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:128009 for open-end generation.
The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:128009 for open-end generation.




対象となるドキュメント:
 SageMaker Unified Studio での Amazon Bedrock のスムーズなオンボーディングエクスペリエンスを促進するために、「ユーザーガイド」で詳細なドキュメントをご覧いただけます。
追加の質問がある場合やさらにサポートが必要な場合は、担当の AWS アカウントチームに遠慮なくお問い合わせください。

Amazon SageMaker AI でのマネージドスポットトレーニング - Amazon SageMaker AIAmazon SageMaker AI でのマネージドスポットトレーニング - Amazon SageMaker AIドキュメントAmazon SageMakerデベロッパーガイド翻訳は機械翻訳により提供されています。
提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。
Amazon SageMaker AI でのマネージドスポットトレーニングAmazon SageMaker AI を使用すると、マネージド Amazon EC2 スポットインスタンスを使用して機械学習モデルを簡単にトレーニングできます。
マネージド型のスポットトレーニングでは、オンデマンドインスタンスと比較して、トレーニングモデルのコストを最大 90% 抑えることができます。
SageMaker AI は、ユーザーに代わってスポットの中断を管理します。
マネージドスポットトレーニングでは、オンデマンドインスタンスではなく Amazon EC2 スポットインスタンスを使用してトレーニングジョブを実行します。
スポットインスタンスを使用するトレーニングジョブと、SageMaker AI が Amazon EC2 スポットインスタンスを使用してジョブの実行を待機する時間を指定する停止条件を指定できます。
トレーニングの実行中に生成されたメトリクスとログは、CloudWatch にあります。
Amazon SageMaker AI 自動モデル調整は、ハイパーパラメータ調整とも呼ばれ、マネージドスポットトレーニングを使用できます。
自動モデルチューニングの詳細については、「SageMaker AI による自動モデル調整」を参照してください。
スポットインスタンスは中断されることがあります。
その場合、ジョ

The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:128009 for open-end generation.
The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:128009 for open-end generation.










The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:128009 for open-end generation.





**回答**
SageMakerのトレーニング費用を抑える方法として、以下のような方法があります。

1. マネージドスポットトレーニング：マネージドスポットトレーニングを使用することで、オンデマンドインスタンスと比較して、トレーニングモデルのコストを最大 90% 抑えることができます。
2. チェックポイントの使用：チェックポイントを使用することで、トレーニングジョブが中断された場合、最後のチェックポイントから再開することができます。
3. 自動モデル調整：自動モデル調整を使用することで、ハイパーパラメータ調整を自動化し、トレーニングの効率を向上させることができます。
4. トレーニングジョブの最適化：トレーニングジョブの最適化を行うことで、トレーニングの時間を短縮し、コストを抑えることができます。
5. Spot Instance の使用：Spot Instance を使用することで、トレーニングジョブを実行するインスタンスのコストを抑えることができます。

また、SageMaker AI のド

---

### 5. Notebook Instance と SageMaker Studio はどう使い分けるべきですか？


The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:128009 for open-end generation.
The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:128009 for open-end generation.
The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:128009 for open-end generation.




対象となるドキュメント:
 ブラウザで JavaScript が無効になっているか、使用できません。
AWS ドキュメントを使用するには、JavaScript を有効にする必要があります。
手順については、使用するブラウザのヘルプページを参照してください。
ドキュメントの表記規則グループの削除ドメイン内の SageMaker AI リソースを表示するこのページは役に立ちましたか? - はいページが役に立ったことをお知らせいただき、ありがとうございます。
お時間がある場合は、何が良かったかお知らせください。
今後の参考にさせていただきます。
このページは役に立ちましたか? - いいえこのページは修正が必要なことをお知らせいただき、ありがとうございます。
ご期待に沿うことができず申し訳ありません。
お時間がある場合は、ドキュメントを改善する方法についてお知らせください。

Amazon SageMaker Studio Classic ノートブックとノートブックインスタンスはどのように違いますか? - Amazon SageMaker AIAmazon SageMaker Studio Classic ノートブックとノートブックインスタンスはどのように違いますか? - Amazon SageMaker AIドキュメントAmazon SageMakerデベロッパーガイド翻訳は機械翻訳により提供されています。
提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。
Amazon SageMaker Studio Classic ノートブックとノートブックインスタンスはどのように違いますか?重要2023 年 11 月 30 日以降、従来の Amazon SageMaker Studio のエクスペリエンスは Amazon SageMaker Studio Classic と名前が変更されました。
以下のセクションは、Studio Classic アプリケーションの使用を前提とした内容です。
更新後の Studio エクスペリエンスを使用する場合は、「Amazon SageMaker Studio」を参照してください。
新しいノートブックを起動する場合は、Amazon SageMaker AI コンソールからノートブックインスタンスを起動する

The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:128009 for open-end generation.
The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:128009 for open-end generation.










The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:128009 for open-end generation.
The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:128009 for open-end generation.




対象となるドキュメント:
 直接アクセス: IAM アイデンティティセンターを使用する場合、固有の URL を通じて IAM アイデンティティセンターの認証情報を使用して Studio Classic に直接アクセスできます。
ノートブック AWS Management Console を実行するために を操作する必要はありません。

最適化されたイメージ: Studio Classic ノートブックには、あらかじめ定義された一連の SageMaker イメージ設定が用意されており、すぐに使用を開始することができます。






対象となるドキュメント:
 ブラウザで JavaScript が無効になっているか、使用できません。
AWS ドキュメントを使用するには、JavaScript を有効にする必要があります。
手順については、使用するブラウザのヘルプページを参照してください。
ドキュメントの表記規則グループの削除ドメイン内の SageMaker AI リソースを表示するこのページは役に立ちましたか? - はいページが役に立ったことをお知らせいただき、ありがとうございます。
お時間がある場合は、何が良かったかお知らせください。
今後の参考にさせていただきます。
このページは役に立ちましたか? - いいえこのページは修正が必要なことをお知らせいただき、ありがとうございます。
ご期待に沿うことができず申し訳ありません。
お時間がある場合は、ドキュメントを改善する方法についてお知らせください。

Amazon SageMaker Studio Classic ノートブックとノートブックインスタンスはどのように違いますか? - Amazon SageMaker AIAmazon SageMaker Studio Classic ノートブックとノートブックインスタンスはどのように違いますか? - Amazon SageMaker AIドキュメントAmazon SageMakerデベロッパーガイド翻訳は機械翻訳により提供されています。
提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。
Amazon SageMaker Studio Classic ノートブックとノートブックインスタンスはどのように違いますか?重要2023 年 11

The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:128009 for open-end generation.
The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:128009 for open-end generation.










The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:128009 for open-end generation.
The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:128009 for open-end generation.







対象となるドキュメント:
 直接アクセス: IAM アイデンティティセンターを使用する場合、固有の URL を通じて IAM アイデンティティセンターの認証情報を使用して Studio Classic に直接アクセスできます。
ノートブック AWS Management Console を実行するために を操作する必要はありません。

最適化されたイメージ: Studio Classic ノートブックには、あらかじめ定義された一連の SageMaker イメージ設定が用意されており、すぐに使用を開始することができます。






The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:128009 for open-end generation.
The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:128009 for open-end generation.




対象となるドキュメント:
 ブラウザで JavaScript が無効になっているか、使用できません。
AWS ドキュメントを使用するには、JavaScript を有効にする必要があります。
手順については、使用するブラウザのヘルプページを参照してください。
ドキュメントの表記規則グループの削除ドメイン内の SageMaker AI リソースを表示するこのページは役に立ちましたか? - はいページが役に立ったことをお知らせいただき、ありがとうございます。
お時間がある場合は、何が良かったかお知らせください。
今後の参考にさせていただきます。
このページは役に立ちましたか? - いいえこのページは修正が必要なことをお知らせいただき、ありがとうございます。
ご期待に沿うことができず申し訳ありません。
お時間がある場合は、ドキュメントを改善する方法についてお知らせください。

Amazon SageMaker Studio Classic ノートブックとノートブックインスタンスはどのように違いますか? - Amazon SageMaker AIAmazon SageMaker Studio Classic ノートブックとノートブックインスタンスはどのように違いますか? - Amazon SageMaker AIドキュメントAmazon SageMakerデベロッパーガイド翻訳は機械翻訳により提供されています。
提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。
Amazon SageMaker Studio Classic ノートブックとノートブックインスタンスはどのように違いますか?重要2023 年 11 月 30 日以降、従来の Amazon SageMaker Studio のエクスペリエンスは Amazon SageMaker Studio Classic と名前が変更されました。
以下のセクションは、Studio Classic アプリケーションの使用を前提とした内容です。
更新後の Studio エクスペリエンスを使用する場合は、「Amazon SageMaker Studio」を参照してください。
新しいノートブックを起動する場合は、Amazon SageMaker AI コンソールからノートブックインスタンスを起動する

The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:128009 for open-end generation.
The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:128009 for open-end generation.










The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:128009 for open-end generation.
The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:128009 for open-end generation.




対象となるドキュメント:
 直接アクセス: IAM アイデンティティセンターを使用する場合、固有の URL を通じて IAM アイデンティティセンターの認証情報を使用して Studio Classic に直接アクセスできます。
ノートブック AWS Management Console を実行するために を操作する必要はありません。

最適化されたイメージ: Studio Classic ノートブックには、あらかじめ定義された一連の SageMaker イメージ設定が用意されており、すぐに使用を開始することができます。






対象となるドキュメント:
 ブラウザで JavaScript が無効になっているか、使用できません。
AWS ドキュメントを使用するには、JavaScript を有効にする必要があります。
手順については、使用するブラウザのヘルプページを参照してください。
ドキュメントの表記規則グループの削除ドメイン内の SageMaker AI リソースを表示するこのページは役に立ちましたか? - はいページが役に立ったことをお知らせいただき、ありがとうございます。
お時間がある場合は、何が良かったかお知らせください。
今後の参考にさせていただきます。
このページは役に立ちましたか? - いいえこのページは修正が必要なことをお知らせいただき、ありがとうございます。
ご期待に沿うことができず申し訳ありません。
お時間がある場合は、ドキュメントを改善する方法についてお知らせください。

Amazon SageMaker Studio Classic ノートブックとノートブックインスタンスはどのように違いますか? - Amazon SageMaker AIAmazon SageMaker Studio Classic ノートブックとノートブックインスタンスはどのように違いますか? - Amazon SageMaker AIドキュメントAmazon SageMakerデベロッパーガイド翻訳は機械翻訳により提供されています。
提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。
Amazon SageMaker Studio Classic ノートブックとノートブックインスタンスはどのように違いますか?重要2023 年 11

The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:128009 for open-end generation.
The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:128009 for open-end generation.










The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:128009 for open-end generation.
The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:128009 for open-end generation.







対象となるドキュメント:
 直接アクセス: IAM アイデンティティセンターを使用する場合、固有の URL を通じて IAM アイデンティティセンターの認証情報を使用して Studio Classic に直接アクセスできます。
ノートブック AWS Management Console を実行するために を操作する必要はありません。

最適化されたイメージ: Studio Classic ノートブックには、あらかじめ定義された一連の SageMaker イメージ設定が用意されており、すぐに使用を開始することができます。






The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:128009 for open-end generation.
The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:128009 for open-end generation.




対象となるドキュメント:
 ブラウザで JavaScript が無効になっているか、使用できません。
AWS ドキュメントを使用するには、JavaScript を有効にする必要があります。
手順については、使用するブラウザのヘルプページを参照してください。
ドキュメントの表記規則グループの削除ドメイン内の SageMaker AI リソースを表示するこのページは役に立ちましたか? - はいページが役に立ったことをお知らせいただき、ありがとうございます。
お時間がある場合は、何が良かったかお知らせください。
今後の参考にさせていただきます。
このページは役に立ちましたか? - いいえこのページは修正が必要なことをお知らせいただき、ありがとうございます。
ご期待に沿うことができず申し訳ありません。
お時間がある場合は、ドキュメントを改善する方法についてお知らせください。

Amazon SageMaker Studio Classic ノートブックとノートブックインスタンスはどのように違いますか? - Amazon SageMaker AIAmazon SageMaker Studio Classic ノートブックとノートブックインスタンスはどのように違いますか? - Amazon SageMaker AIドキュメントAmazon SageMakerデベロッパーガイド翻訳は機械翻訳により提供されています。
提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。
Amazon SageMaker Studio Classic ノートブックとノートブックインスタンスはどのように違いますか?重要2023 年 11 月 30 日以降、従来の Amazon SageMaker Studio のエクスペリエンスは Amazon SageMaker Studio Classic と名前が変更されました。
以下のセクションは、Studio Classic アプリケーションの使用を前提とした内容です。
更新後の Studio エクスペリエンスを使用する場合は、「Amazon SageMaker Studio」を参照してください。
新しいノートブックを起動する場合は、Amazon SageMaker AI コンソールからノートブックインスタンスを起動する

The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:128009 for open-end generation.
The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:128009 for open-end generation.










The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:128009 for open-end generation.




対象となるドキュメント:
 直接アクセス: IAM アイデンティティセンターを使用する場合、固有の URL を通じて IAM アイデンティティセンターの認証情報を使用して Studio Classic に直接アクセスできます。
ノートブック AWS Management Console を実行するために を操作する必要はありません。

最適化されたイメージ: Studio Classic ノートブックには、あらかじめ定義された一連の SageMaker イメージ設定が用意されており、すぐに使用を開始することができます。




**回答**
Amazon SageMaker Studio Classic ノートブックとノートブックインスタンスは、異なる概念です。以下は、両者を使用する際の注意点です。

* ノートブックインスタンス：Amazon SageMaker AI コンソールから直接アクセスすることができます。新しいノートブックを起動する場合は、ノートブックインスタンスを起動する代わりに、Amazon SageMaker Studio Classic でノートブックを作成することをお勧めします。
* SageMaker Studio：2023 年 11 月 30 日以降、従来の Amazon SageMaker Studio のエクスペリエンスは Amazon SageMaker Studio Classic と名前が変更されました。新しいノートブックを起動する場合は、「Amazon SageMaker Studio」を参照してください。

したがって、ノートブックインスタンスは、Amazon SageMaker AI コンソールから直接アクセスすることができるノートブックのインスタンスです。一方、SageMaker Studioは、Amazon SageMaker Studio Classic の名前変更後の新しいノートブックのエクスペリエンスです。

両者を使用する際には、注意

---

### 6. BedrockでDeepSeek-R1を使った場合、どのくらいの推論コストがかかりますか？


The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:128009 for open-end generation.
The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:128009 for open-end generation.
The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:128009 for open-end generation.




対象となるドキュメント:
 料金の例 6: Bedrock データオートメーション標準出力を使用して、組織内の 15,000 分間の会議の音声録音を処理するとします。
15,000 分すべての音声処理にかかる合計コストは 90 USD です。
  合計処理時間 = 15,000 分 合計料金 = 15,000 分 × 0.006 USD = 90 USD
アプリケーションデベロッパーは、時間単位で、Amazon Bedrock に対して次の API コールを実行します: 入力テキストの 2K トークンの入力を 1K トークン (推論トークンを含む) の出力に要約する、DeepSeek-R1 モデルに対するリクエスト:








The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:128009 for open-end generation.
The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:128009 for open-end generation.










The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:128009 for open-end generation.
The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:128009 for open-end generation.







対象となるドキュメント:
 料金の例 6: Bedrock データオートメーション標準出力を使用して、組織内の 15,000 分間の会議の音声録音を処理するとします。
15,000 分すべての音声処理にかかる合計コストは 90 USD です。
  合計処理時間 = 15,000 分 合計料金 = 15,000 分 × 0.006 USD = 90 USD
アプリケーションデベロッパーは、時間単位で、Amazon Bedrock に対して次の API コールを実行します: 入力テキストの 2K トークンの入力を 1K トークン (推論トークンを含む) の出力に要約する、DeepSeek-R1 モデルに対するリクエスト:





The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:128009 for open-end generation.
The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:128009 for open-end generation.










The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:128009 for open-end generation.
The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:128009 for open-end generation.










The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:128009 for open-end generation.
The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:128009 for open-end generation.




対象となるドキュメント:
 料金の例 6: Bedrock データオートメーション標準出力を使用して、組織内の 15,000 分間の会議の音声録音を処理するとします。
15,000 分すべての音声処理にかかる合計コストは 90 USD です。
  合計処理時間 = 15,000 分 合計料金 = 15,000 分 × 0.006 USD = 90 USD
アプリケーションデベロッパーは、時間単位で、Amazon Bedrock に対して次の API コールを実行します: 入力テキストの 2K トークンの入力を 1K トークン (推論トークンを含む) の出力に要約する、DeepSeek-R1 モデルに対するリクエスト:








The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:128009 for open-end generation.
The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:128009 for open-end generation.










The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:128009 for open-end generation.
The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:128009 for open-end generation.







対象となるドキュメント:
 料金の例 6: Bedrock データオートメーション標準出力を使用して、組織内の 15,000 分間の会議の音声録音を処理するとします。
15,000 分すべての音声処理にかかる合計コストは 90 USD です。
  合計処理時間 = 15,000 分 合計料金 = 15,000 分 × 0.006 USD = 90 USD
アプリケーションデベロッパーは、時間単位で、Amazon Bedrock に対して次の API コールを実行します: 入力テキストの 2K トークンの入力を 1K トークン (推論トークンを含む) の出力に要約する、DeepSeek-R1 モデルに対するリクエスト:





The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:128009 for open-end generation.
The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:128009 for open-end generation.










The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:128009 for open-end generation.
The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:128009 for open-end generation.










The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:128009 for open-end generation.
The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:128009 for open-end generation.




対象となるドキュメント:
 料金の例 6: Bedrock データオートメーション標準出力を使用して、組織内の 15,000 分間の会議の音声録音を処理するとします。
15,000 分すべての音声処理にかかる合計コストは 90 USD です。
  合計処理時間 = 15,000 分 合計料金 = 15,000 分 × 0.006 USD = 90 USD
アプリケーションデベロッパーは、時間単位で、Amazon Bedrock に対して次の API コールを実行します: 入力テキストの 2K トークンの入力を 1K トークン (推論トークンを含む) の出力に要約する、DeepSeek-R1 モデルに対するリクエスト:








The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:128009 for open-end generation.
The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:128009 for open-end generation.










The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:128009 for open-end generation.





**回答**
参考資料に基づいて、BedrockでDeepSeek-R1を使用した場合、1Kトークンの出力に要約するために必要な推論コストは、0.006 USD per 2K input tokensです。

したがって、15,000分間の会議の音声録音を処理するために必要な推論コストは、15,000分 × 0.006 USD = 90 USDとなります。

---



In [17]:
print("| 評価番号 | スコア |")
print("|:--------:|:------:|")

# Iterate and print each row with only index and score
for i, (question, gold_answer, response) in enumerate(zip(questions, answers, responses), start=1):
    score = evaluate_answer_accuracy(question, response, gold_answer)
    print(f"| {i} | {score:.2f} |")

| 評価番号 | スコア |
|:--------:|:------:|
| 1 | 2.00 |
| 2 | 1.00 |
| 3 | 0.00 |
| 4 | 2.00 |
| 5 | 1.00 |
| 6 | 0.00 |


In [19]:
import csv

with open('documents.csv', 'w', newline='', encoding='utf-8') as csvfile:
    writer = csv.writer(csvfile)
    writer.writerow(['index', 'document'])
    for index, document in enumerate(documents):
        writer.writerow([index, document])