# LCEL 인터페이스 살펴보기

> LCEL로 완성된 Chain으로 사용할 수 있는 기능들에 대해 살펴봄

LCEL로 연결되는 각 컴포넌트들은 `Runnable` 프로토콜을 구현하였음
`Runnable` 프로토콜은 대ㅐㄷ분의 컴포넌트에 이미 구현되어있음
`Runnable` 프로토콜은 사용자 정의 체인을 정의하거나 이를 표준화된 방식으로 호출하는 것을 쉽게 함.
표준 인터페이스에는 다음이 포함됨
- stream : 응답의 청크를 스트리밍
- invoke : 입력에 대해 체인을 호출
- batch : 입력 목록에 대해 체인을 호출
- 비동기 메소드
    - astream : 비동기적으로 응답의 청크를 스트리밍
    - ainvoke : 비동기적으로 입력에 대해 체인 호출
    - abatch : 비동기적으로 입력 목록에 대해 체인 호출
    - astream_log : 최종 응답 뿐 아니라 발생하는 중간 단계를 스트리밍

## 1. Set API Keys

In [1]:
from dotenv import load_dotenv

load_dotenv()

True

## 2. LCEL 인터페이스

In [2]:
from langchain_openai import ChatOpenAI
from langchain_core.prompts import PromptTemplate
from langchain_core.output_parsers import StrOutputParser

prompt = PromptTemplate.from_template("{topic}에 대해 자세하게 설명해줘.")

model = ChatOpenAI(model="gpt-4o-mini", temperature=0.1)

chain = prompt | model | StrOutputParser()

### 2-1. stream : 실시간 출력

In [3]:
for chunk in chain.stream({'topic' : '인공지능 모델의 학습 방법'}):
    print(chunk, end="", flush=True)

인공지능 모델의 학습 방법은 여러 가지가 있지만, 일반적으로는 다음과 같은 단계로 진행됩니다. 여기서는 주로 머신러닝과 딥러닝을 중심으로 설명하겠습니다.

### 1. 데이터 수집
모델 학습의 첫 단계는 데이터를 수집하는 것입니다. 데이터는 모델이 학습할 수 있는 기초 자료로, 다양한 형식(텍스트, 이미지, 음성 등)으로 존재할 수 있습니다. 데이터의 양과 질은 모델의 성능에 큰 영향을 미칩니다.

### 2. 데이터 전처리
수집한 데이터는 종종 노이즈가 많거나 불완전합니다. 따라서 데이터 전처리 과정이 필요합니다. 이 과정에는 다음과 같은 작업이 포함됩니다:
- **결측치 처리**: 누락된 데이터를 처리합니다.
- **정규화/표준화**: 데이터의 범위를 조정하여 모델 학습을 용이하게 합니다.
- **특징 추출**: 중요한 정보를 추출하여 모델의 입력으로 사용합니다.
- **데이터 증강**: 데이터의 양을 늘리기 위해 변형을 가합니다(예: 이미지 회전, 크기 조정 등).

### 3. 모델 선택
문제의 특성에 따라 적합한 모델을 선택합니다. 예를 들어, 이미지 분류 문제에는 CNN(합성곱 신경망)을, 자연어 처리에는 RNN(순환 신경망)이나 Transformer 모델을 사용할 수 있습니다.

### 4. 모델 학습
모델 학습은 주어진 데이터를 통해 모델의 파라미터를 조정하는 과정입니다. 이 과정은 다음과 같은 단계로 이루어집니다:
- **손실 함수 정의**: 모델의 예측값과 실제값 간의 차이를 측정하는 함수를 정의합니다. 일반적으로 회귀 문제에는 평균 제곱 오차(MSE), 분류 문제에는 교차 엔트로피 손실을 사용합니다.
- **최적화 알고리즘 선택**: 손실 함수를 최소화하기 위해 파라미터를 업데이트하는 방법을 선택합니다. 대표적인 최적화 알고리즘으로는 SGD(확률적 경사 하강법), Adam 등이 있습니다.
- **에포크와 배치**: 전체 데이터셋을 여러 번 반복하여 학습하는 에포크와, 데이터를 작은 배치로 나누어 학습하는 배치 학습을 설정합니다.

### 5

### 2-2. invoke : 호출

In [6]:
print(chain.invoke({'topic' : '인공지능 모델의 학습 방법'}))

인공지능 모델의 학습 방법은 크게 두 가지로 나눌 수 있습니다: 지도 학습(Supervised Learning)과 비지도 학습(Unsupervised Learning). 이 외에도 강화 학습(Reinforcement Learning)과 준지도 학습(Semi-Supervised Learning) 등 다양한 방법이 존재합니다. 각 방법에 대해 자세히 설명하겠습니다.

### 1. 지도 학습 (Supervised Learning)
지도 학습은 입력 데이터와 그에 대한 정답(label)이 주어졌을 때, 모델이 입력과 출력 간의 관계를 학습하는 방법입니다. 주로 분류(Classification)와 회귀(Regression) 문제에 사용됩니다.

- **데이터 준비**: 학습에 사용할 데이터셋을 준비합니다. 이 데이터셋은 입력 데이터와 해당하는 정답(label)으로 구성됩니다.
- **모델 선택**: 문제에 적합한 알고리즘(예: 선형 회귀, 의사결정 트리, 신경망 등)을 선택합니다.
- **학습 과정**: 모델은 주어진 입력 데이터에 대해 예측을 수행하고, 예측 결과와 실제 정답 간의 오차를 계산합니다. 이 오차를 최소화하기 위해 경량화된 알고리즘(예: 경사 하강법)을 사용하여 모델의 파라미터를 업데이트합니다.
- **검증**: 학습이 완료된 후, 별도의 검증 데이터셋을 사용하여 모델의 성능을 평가합니다.

### 2. 비지도 학습 (Unsupervised Learning)
비지도 학습은 정답(label)이 없는 데이터에서 패턴이나 구조를 찾는 방법입니다. 주로 군집화(Clustering)와 차원 축소(Dimensionality Reduction)에 사용됩니다.

- **데이터 준비**: 정답이 없는 데이터셋을 준비합니다.
- **모델 선택**: K-평균 군집화, 주성분 분석(PCA), t-SNE 등과 같은 알고리즘을 선택합니다.
- **학습 과정**: 모델은 데이터의 구조를 파악하고, 유사한 데이터 포인트를 그룹화하거나 데이터의 차원을 축소하는 등의 작업을 수행합니다.

### 2-3. batch : 배치 (단위 실행)

여러 개의 딕셔너리를 포함하는 리스트를 인자로 받아서, 각 딕셔너리로 완성되는 각 프롬프트에 대해 일괄 처리를 수행함
- 반환 값도 리스트로 반환됨

In [8]:
chain.batch([{"topic" : "인공지능"}, {"topic" : "안드로이드"}])

['인공지능(Artificial Intelligence, AI)은 컴퓨터 시스템이 인간의 지능을 모방하여 학습, 추론, 문제 해결, 이해, 언어 처리 등의 작업을 수행할 수 있도록 하는 기술입니다. AI는 여러 분야에서 활용되며, 그 범위는 매우 넓습니다. 다음은 인공지능의 주요 개념과 기술에 대한 설명입니다.\n\n### 1. 인공지능의 종류\n- **약한 인공지능(Weak AI)**: 특정 작업을 수행하도록 설계된 AI로, 예를 들어 음성 인식, 이미지 인식, 추천 시스템 등이 이에 해당합니다. 현재 대부분의 AI 시스템이 이 범주에 속합니다.\n- **강한 인공지능(Strong AI)**: 인간과 같은 수준의 지능을 갖춘 AI로, 스스로 학습하고 이해하며 다양한 작업을 수행할 수 있는 능력을 지닙니다. 현재는 이론적인 개념에 가까우며, 실제로 구현된 사례는 없습니다.\n\n### 2. 머신러닝(Machine Learning)\n머신러닝은 AI의 한 분야로, 데이터에서 패턴을 학습하여 예측이나 결정을 내리는 알고리즘을 개발하는 것입니다. 머신러닝은 크게 세 가지 유형으로 나눌 수 있습니다:\n- **지도 학습(Supervised Learning)**: 입력 데이터와 그에 대한 정답(레이블)을 제공하여 모델을 학습시키는 방법입니다. 예를 들어, 스팸 이메일 분류기 등이 있습니다.\n- **비지도 학습(Unsupervised Learning)**: 레이블이 없는 데이터에서 패턴이나 구조를 찾아내는 방법입니다. 클러스터링이나 차원 축소 기법이 여기에 해당합니다.\n- **강화 학습(Reinforcement Learning)**: 에이전트가 환경과 상호작용하며 보상을 최대화하는 방향으로 학습하는 방법입니다. 게임 AI나 로봇 제어에 많이 사용됩니다.\n\n### 3. 딥러닝(Deep Learning)\n딥러닝은 머신러닝의 한 분야로, 인공신경망(Artificial Neural Networks)을 기반으로 한 기술입니다. 여러 층의 신경망을 통해 복잡한 데이터의 특

In [9]:
chain.batch(
    [
        {"topic" : "인공지능"}, 
        {"topic" : "안드로이드"},
        {"topic" : "휴머노이드"},
        {"topic" : "인공태양"},
        {"topic" : "인공눈물"},
    ],
    config={"max_concurrency" : 3}   # 동시에 처리할 수 있는 최대 작업 수 지정
)

['인공지능(Artificial Intelligence, AI)은 컴퓨터 시스템이 인간의 지능을 모방하여 학습, 추론, 문제 해결, 이해, 언어 처리 등의 작업을 수행할 수 있도록 하는 기술입니다. 인공지능은 여러 분야에서 활용되며, 그 범위는 매우 넓습니다. 아래에서 인공지능의 주요 개념과 기술, 응용 분야에 대해 자세히 설명하겠습니다.\n\n### 1. 인공지능의 종류\n\n인공지능은 크게 두 가지로 나눌 수 있습니다.\n\n- **약한 인공지능(Weak AI)**: 특정 작업을 수행하도록 설계된 인공지능으로, 인간의 지능을 완전히 모방하지는 않습니다. 예를 들어, 음성 인식 시스템, 추천 알고리즘, 챗봇 등이 이에 해당합니다.\n\n- **강한 인공지능(Strong AI)**: 인간과 유사한 수준의 지능을 갖춘 인공지능으로, 다양한 작업을 수행할 수 있는 능력을 지니고 있습니다. 현재는 이론적인 개념에 가까우며, 실제로 구현된 사례는 없습니다.\n\n### 2. 인공지능의 기술\n\n인공지능은 여러 기술을 기반으로 발전하고 있습니다. 주요 기술은 다음과 같습니다.\n\n- **기계 학습(Machine Learning)**: 데이터에서 패턴을 학습하여 예측이나 결정을 내리는 알고리즘입니다. 지도 학습, 비지도 학습, 강화 학습 등 다양한 방법이 있습니다.\n\n- **딥 러닝(Deep Learning)**: 인공 신경망을 기반으로 한 기계 학습의 한 분야로, 대량의 데이터를 처리하여 복잡한 패턴을 인식하는 데 강력한 성능을 발휘합니다. 이미지 인식, 자연어 처리 등에서 많이 사용됩니다.\n\n- **자연어 처리(Natural Language Processing, NLP)**: 컴퓨터가 인간의 언어를 이해하고 생성할 수 있도록 하는 기술입니다. 번역, 감정 분석, 대화형 AI 등에 활용됩니다.\n\n- **컴퓨터 비전(Computer Vision)**: 이미지나 비디오에서 정보를 추출하고 해석하는 기술로, 객체 인식, 얼굴 인식, 자율주행차 등에 사용됩니다.

### 2-4. astream : 비동기 스트림

비동기 for 문을 사용해 스트림에서 메시지를 순차적으로 받아오고, print문을 통해 chunk의 내용을 즉시 출력함

In [10]:
async for token in chain.astream({'topic' : '인공지능 모델의 학습 방법'}):
    print(token, end="", flush=True)

인공지능 모델의 학습 방법은 크게 세 가지로 나눌 수 있습니다: 지도 학습, 비지도 학습, 강화 학습. 각 방법은 데이터의 종류와 문제의 특성에 따라 다르게 적용됩니다. 아래에서 각 방법에 대해 자세히 설명하겠습니다.

### 1. 지도 학습 (Supervised Learning)

지도 학습은 입력 데이터와 그에 대한 정답(레이블)이 주어지는 경우에 사용됩니다. 모델은 주어진 입력과 출력 간의 관계를 학습하여 새로운 입력에 대한 예측을 할 수 있도록 합니다.

- **데이터 준비**: 학습에 사용할 데이터셋은 입력 데이터와 해당하는 정답(레이블)으로 구성됩니다. 예를 들어, 이미지 분류 문제에서는 각 이미지와 그에 해당하는 클래스 레이블이 필요합니다.
  
- **모델 선택**: 다양한 알고리즘(예: 선형 회귀, 결정 트리, 신경망 등) 중에서 문제에 적합한 모델을 선택합니다.

- **학습 과정**: 모델은 주어진 데이터셋을 통해 파라미터를 조정합니다. 이 과정에서 손실 함수(loss function)를 사용하여 모델의 예측과 실제 정답 간의 차이를 측정하고, 이를 최소화하는 방향으로 파라미터를 업데이트합니다. 일반적으로 경량화된 방법인 경사 하강법(Gradient Descent)을 사용합니다.

- **검증 및 평가**: 학습이 완료된 후, 별도의 검증 데이터셋을 사용하여 모델의 성능을 평가합니다. 이 단계에서 과적합(overfitting)을 방지하기 위해 교차 검증(cross-validation) 기법을 사용할 수 있습니다.

### 2. 비지도 학습 (Unsupervised Learning)

비지도 학습은 레이블이 없는 데이터에서 패턴이나 구조를 찾는 방법입니다. 주로 데이터의 군집화(clustering)나 차원 축소(dimensionality reduction)에 사용됩니다.

- **데이터 준비**: 입력 데이터는 레이블 없이 제공됩니다. 예를 들어, 고객의 구매 데이터를 분석하여 유사한 고객 그룹을 찾는 경우가 있습니다.

- **모델 선택**

### 2-5. ainvoke : 비동기 호출

In [16]:
response = chain.ainvoke({"topic" : "NVDA"})

In [17]:
await response

'NVIDIA Corporation(NVDA)은 미국의 기술 회사로, 주로 그래픽 처리 장치(GPU)와 인공지능(AI) 기술을 개발하고 제조하는 데 주력하고 있습니다. 1993년에 설립된 NVIDIA는 비디오 게임, 데이터 센터, 자율주행차, 그리고 AI 연구 등 다양한 분야에서 사용되는 고성능 컴퓨팅 솔루션을 제공합니다.\n\n### 주요 제품 및 기술\n\n1. **GPU**: NVIDIA의 가장 유명한 제품은 GeForce 시리즈의 그래픽 카드입니다. 이들은 주로 게임과 그래픽 디자인에 사용됩니다. 또한, Quadro와 Tesla 시리즈는 전문적인 그래픽 작업 및 데이터 센터에서의 고성능 컴퓨팅을 위해 설계되었습니다.\n\n2. **AI 및 머신러닝**: NVIDIA는 AI와 머신러닝 분야에서도 큰 영향을 미치고 있습니다. CUDA라는 병렬 컴퓨팅 플랫폼과 API를 통해 개발자들이 GPU를 활용하여 복잡한 계산을 수행할 수 있도록 지원합니다. NVIDIA의 Tensor Core GPU는 AI 모델의 훈련과 추론을 가속화하는 데 최적화되어 있습니다.\n\n3. **자율주행차**: NVIDIA는 자율주행차 기술에도 투자하고 있으며, NVIDIA DRIVE 플랫폼을 통해 차량의 인공지능 시스템을 개발하고 있습니다. 이 플랫폼은 센서 데이터 처리, 경로 계획, 그리고 차량 제어를 위한 다양한 기능을 제공합니다.\n\n4. **게임 및 VR**: NVIDIA는 게임 산업에서도 중요한 역할을 하고 있으며, RTX 기술을 통해 실시간 레이 트레이싱을 지원하는 그래픽 카드를 출시했습니다. 이 기술은 게임의 그래픽 품질을 획기적으로 향상시킵니다.\n\n5. **클라우드 컴퓨팅**: NVIDIA는 데이터 센터와 클라우드 서비스 제공업체를 위한 GPU 솔루션도 제공합니다. 이러한 솔루션은 대규모 데이터 처리와 AI 모델 훈련에 사용됩니다.\n\n### 시장 위치\n\nNVIDIA는 GPU 시장에서 주요한 점유율을 차지하고 있으며, AMD와 Intel과 같은 경쟁사와 경쟁하고

### 2-6. abatch : 비동기 일괄 처리

In [20]:
response = chain.abatch(
    [{"topic" : "인공지능"}, {"topic" : "안드로이드"}]
)

In [21]:
await response

['인공지능(Artificial Intelligence, AI)은 컴퓨터 시스템이 인간의 지능을 모방하여 학습, 추론, 문제 해결, 이해, 언어 처리 등의 작업을 수행할 수 있도록 하는 기술입니다. AI는 다양한 분야에서 활용되며, 그 범위는 매우 넓습니다. 아래에서 인공지능의 주요 개념과 기술, 응용 분야에 대해 자세히 설명하겠습니다.\n\n### 1. 인공지능의 종류\n\n인공지능은 크게 두 가지로 나눌 수 있습니다.\n\n- **약한 인공지능(Weak AI)**: 특정 작업을 수행하도록 설계된 AI로, 인간의 지능을 모방하지만 자율적인 사고나 이해는 하지 못합니다. 예를 들어, 음성 인식 시스템, 추천 알고리즘 등이 이에 해당합니다.\n\n- **강한 인공지능(Strong AI)**: 인간과 유사한 수준의 지능을 갖춘 AI로, 자율적으로 사고하고 문제를 해결할 수 있는 능력을 가집니다. 현재로서는 이론적인 개념에 가까우며, 실제로 구현된 사례는 없습니다.\n\n### 2. 인공지능의 기술\n\n인공지능은 여러 기술과 방법론을 포함합니다.\n\n- **기계 학습(Machine Learning)**: 데이터에서 패턴을 학습하여 예측이나 결정을 내리는 알고리즘입니다. 지도 학습, 비지도 학습, 강화 학습 등 다양한 방법이 있습니다.\n\n- **딥 러닝(Deep Learning)**: 인공 신경망을 기반으로 한 기계 학습의 한 분야로, 대량의 데이터를 처리하여 복잡한 패턴을 인식하는 데 강력한 성능을 발휘합니다. 이미지 인식, 자연어 처리 등에서 많이 사용됩니다.\n\n- **자연어 처리(Natural Language Processing, NLP)**: 컴퓨터가 인간의 언어를 이해하고 생성할 수 있도록 하는 기술입니다. 챗봇, 번역기, 감정 분석 등이 포함됩니다.\n\n- **컴퓨터 비전(Computer Vision)**: 이미지나 비디오에서 정보를 추출하고 해석하는 기술로, 얼굴 인식, 객체 탐지, 자율주행차 등에 활용됩니다.\n\n### 3. 인공지능의 응