# 1週目のエクササイズ

Openai APIとOllamaに精通していることを示すために、技術的な質問をするツールを作成する、説明で応答します。これは、コース中に自分自身を使用できるツールです！

https://github.com/ed-donner/llm_engineering/blob/main/week1/community-contributions/week1_EXERCISE.ipynb

In [1]:
# imports

import os
import requests
import json
from typing import List
from dotenv import load_dotenv
from bs4 import BeautifulSoup
from IPython.display import Markdown, display, update_display
from openai import OpenAI
import ollama

In [2]:
# constants

MODEL_GPT = 'gpt-4o-mini'
MODEL_LLAMA = 'llama3.2:1b'

In [3]:
# set up environment

load_dotenv()
api_key = os.getenv('OPENAI_API_KEY')

if api_key and api_key.startswith('sk-proj-') and len(api_key)>10:
    print("API key looks good so far")
else:
    print("There might be a problem with your API key? Please visit the troubleshooting notebook!")
    
openai = OpenAI()

API key looks good so far


In [4]:
#prompts

system_prompt = "あなたはコンピュータ・サイエンス分野に関連する質問に答える技術チューターです。\
回答は、ソフトウェア開発、人工知能、大規模言語モデルの分野における最新の進歩を反映したものにしてください。マークダウン形式で回答してください。\
学習者がトピックについてより詳しい情報を得るのに役立つリソースを含めてください。"

user_prompt = "コンピュータサイエンスや AI のバックグラウンドを持たない人に LLM をどのように説明しますか？"

In [5]:
# Get gpt-4o-mini to answer, with streaming

stream = openai.chat.completions.create(
    model=MODEL_GPT,
    messages=[
        {"role": "system", "content": system_prompt},
        {"role": "user", "content": user_prompt}
        ],
    stream=True
    )

response = ""
display_handle = display(Markdown(""), display_id=True)

for chunk in stream:
    response += chunk.choices[0].delta.content or ''
    response = response.replace("```","").replace("markdown", "")
    update_display(Markdown(response), display_id=display_handle.display_id)

大規模言語モデル（LLM: Large Language Model）をコンピュータサイエンスやAIのバックグラウンドを持たない人に説明する際は、以下のポイントを考えると良いでしょう。

### LLMの基本的な説明

1. **言語の理解と生成**:
   LLMは非常に大量のテキストデータから学習し、人間のように自然な文章を理解し、生成する能力を持つプログラムです。これは、人間の言葉を「読んで」理解し、文章を書く技術に似ています。

2. **膨大な情報源**:
   LLMは本、記事、ウェブサイトなど、さまざまな情報源から収集されたデータを基にトレーニングされており、そのため多岐にわたるトピックについて知識を持っています。

3. **コンテキストを把握**:
   LLMは与えられた文章や質問の文脈を理解し、それに適した答えを生成します。つまり、会話の流れに合わせて賢く応答する能力があります。

4. **応用例**:
   - **チャットボット**: 顧客サポートや情報提供のために使用。
   - **コンテンツ生成**: 記事やブログのタイトル、ソーシャルメディア投稿の作成。
   - **言語翻訳**: 異なる言語間の翻訳作業。

### LLMの仕組みをわかりやすく

- **トレーニング**:
  LLMは多くの文章を解析するときに「単語のパターン」を学びます。これにより、新しい文章でも自然に感じられるような文を作ることができます。

- **ニューラルネットワーク**:
  LLMは「ニューラルネットワーク」と呼ばれる構造を使っており、これは脳の神経細胞の働きに似たモデルです。これによって、複雑なパターンや関連性を学ぶことができます。

### 更なる理解を深めるためのリソース

- **オンラインコース**:
  - [Coursera: AI For Everyone](https://www.coursera.org/learn/ai-for-everyone): AIの基礎を理解するためのコース。
  - [edX:Introduction to Artificial Intelligence](https://www.edx.org/course/introduction-to-artificial-intelligence-ai): AIに関する包括的な紹介。

- **書籍**:
  - 「Deep Learning」 by Ian Goodfellow, Yoshua Bengio, and Aaron Courville: 深層学習の入門書で、基礎を学ぶのに役立つ。
  - 「Artificial Intelligence: A Guide to Intelligent Systems」 by Michael Negnevitsky: AIの基本的な概念を理解するための良書。

- **動画**:
  - [YouTube: What Are Large Language Models?](https://www.youtube.com/results?search_query=What+Are+Large+Language+Models%3F): LLMに関する簡単な説明動画。

### まとめ

大規模言語モデル（LLM）は、テキストを理解し、人間らしい文章を生成する能力を持つ技術です。自然な会話や情報提供など、さまざまな分野で活用されています。興味がある方は、上記のリソースでさらなる学習を進めることをお勧めします。

In [6]:
# Get Llama 3.2 to answer

OLLAMA_API = "http://localhost:11434/api/chat"

messages=[
    {"role": "system", "content": system_prompt},
    {"role": "user", "content": user_prompt}
    ]

payload = {
    "model": MODEL_LLAMA,
    "messages": messages,
    "stream": True
    }

response = ollama.chat(model=MODEL_LLAMA, messages=messages)
reply = response['message']['content']
display(Markdown(reply))

コンピュータ・サイエンス分野に関連する質問に答える技術チューターとして、以下をご紹介します。

コンピュータ・サイエンスとは、情報が実体上に現れ、その情報を操作し理解するための計算機の基本的な概念です。コンピュータ・サイエンスは、記憶、感覚、思考などの機能を含む多様な分野であり、AIとLLM（Large Language Model）はそれぞれ重要な側面です。

**コンピュータ・サイエンス**

コンピュータ・サイエンスは、情報が計算機の内部に記録され、それを操作して解釈するプロセスを含む。コンピュータによって生成されたテキストや画像などのデータを分析し、推論し、予測することで、人間の知能を超えた思考能力を作成できます。

**Large Language Model (LLM)**

 Large Language Model は、大規模な言語モデルの一種です。これは、複雑な情報とテキストを理解して情報に基づいた決定を下すために使用される AI です。LLM は、現代の世界で広く使用されている、自然言語の分析、生成、表現に関するさまざまな機能を持つ。

**コンピュータ・サイエンスと LLM の関係**

コンピュータ・サイエンス分野における LLM の重要性は、LLM が人々がコミュニケーションし、情報を共有するための基本的なツールであるということです。LLM は、人が手動で行うより効果的かつ直感的なコミュニケーション方法に代わって人間の思考と言語 processing能力を現実化できます。

**LLM の利用**

LLM を使用することで、人々はさまざまな状況で情報を共有し、個人的な経験や関心事に基づいて合うことができ、コミュニケーションがより効果的になります。

**リソース**

*   [OpenAI LLM](https://www.llaushub.com/): 2019 年、Googleによって開発されたLLMを使用した初期のリッジマッチ型LSTMで構成されているLLM。
*   [Hugging Face Transformers](https://huggingface.co transformers): Hugging Face が開発したTransformer言語モデルのベースで構成されているLLM。 
*   [Stanford Question Answering Dataset (SQuAD)](https://www.squad.ai/): Stanford大学によって発見されたQ&Aトレードマークの文書データセット、すでにLLMを使用したテスト結果として提示されています。
*   [Microsoft Cognitive Services](https://docs.microsoft.com/en-us/azure/cognitive-services/affective-detection): Microsoftの感情認識サービスへのアクセスにより、LLM へのアクセスが可能になりました。

コンピュータ・サイエンス分野におけるLLM の重要性は、人々がコミュニケーションし、情報を共有するための基本的なツールであるということです。LLM を使用することで、人間の思考と言語 processing能力を現実化できます。

*   [IBM Watson](https://www.ibm.com/watson/): IBMが開発したAIシステムで、LLM のベースとなるAIです。
*   [Microsoft Bot Framework](https://docs.microsoft.com/en-us/azure/bot-service/bots-builders): MicrosoftのBotsフレームワークで構成されたLLMベースのAIです。

上記は、コンピュータ・サイエンス分野におけるLLM の重要性と、LLM を使用することで人々がコミュニケーションし、情報を共有するための基本的なツールであることについてお詫びしています。