### 사용 툴
- python: LangChain, LamaIndex
- spring: Spring AI


### AI 선택가이드
- **창의적 글쓰기**: Claude 4 > GPT-4o
- **코딩 지원**: GPT-4o > Claude 4 > Llama 3.1
- **실시간 정보**: Gemini Ultra > GPT-4o
- **비용 효율성**: Llama 3.1 > Claude Sonnet > GPT-4o


### LangChain 간략 설명


##### 1. Lang Graph
> 복잡한 흐름이 필요한 경우에 사용합니다.
- LangGraph는 멀티 Actor 애플리케이션을 그래프 형태로 구축할 수 있게 해주는 LangChain의 고급 라이브러리입니다. 복잡한 AI 워크플로우를 노드(Actor)와 엣지(연결)로 구성된 그래프로 모델링하여, 유연하고 확장 가능한 AI 시스템을 만들 수 있습니다.
    - **그래프(Graph) 기반 아키텍처를 도입하여 비선형적인 복잡한 흐름을 유연하게 구성할 수 있도록 지원**
    - **멀티에이전트 시스템을 쉽게 설계 가능**
    - **비동기 실행 지원으로 성능 최적화 가능**

##### 2. LangServe
> LangServe는 LangChain 기반 애플리케이션을 쉽게 배포(serve)할 수 있도록 설계된 라이브러리
- **LangChain 체인을 자동으로 REST API로 변환**
    - LangChain 체인을 간단한 코드만으로 API로 변환할 수 있습니다.
    - API Endpoint를 자동 생성하여, 별도의 서버 설정 없이 바로 사용 가능.
- **FastAPI 기반의 경량화된 API 서버 제공**
    - FastAPI를 활용하여 비동기 요청 처리 및 빠른 응답 속도를 제공.
    - OpenAPI 문서(Swagger UI)도 자동으로 생성.
- **LangChain의 다양한 구성 요소와 연동**
    - LLM, Memory, Retriever, Agents, Tools 등을 포함한 LangChain 컴포넌트 지원.
    - 기존 LangChain 체인을 쉽게 API 서비스로 변환 가능.
- **확장 및 배포 용이**
    - **Docker** 컨테이너화하여 배포 가능.
    - 서버리스 환경 (AWS Lambda, GCP Cloud Run 등)에도 쉽게 배포 가능.
    - Kubernetes 같은 환경에서도 스케일링이 용이함.

##### 3. Lang Smith
> (성능 추적)LangSmith는 LangChain 애플리케이션을 디버깅, 모니터링, 평가, 최적화하는 도구입니다.
 LangSmith 가 제공하는 기능

- **디버깅 도구**
    - LangChain 체인의 실행을 시각적으로 확인 가능
    - 각 프롬프트 입력과 출력을 분석하여 문제 발생 지점 찾기
- **로깅 및 모니터링**
    - 체인의 실행 로그를 저장하여 나중에 분석 가능
    - 응답 시간, 호출 비용, 오류 비율을 추적
- **성능 평가 및 벤치마킹**
    - 서로 다른 프롬프트, 모델, 체인을 비교 평가
    - 다양한 실험 결과를 저장하고 분석 가능
- **테스트 자동화 및 평가 메트릭 제공**
    - LLM 응답을 자동으로 평가하는 기능
    - A/B 테스트를 수행하여 최적의 설정 찾기
- **LangChain과 완벽한 통합**
    - LangChain 체인의 실행 과정에서 LangSmith를 쉽게 연동 가능
    - 추가 코드 변경 없이 LangChain 애플리케이션에 LangSmith 기능 적용 가능

#### LangChain Expression Language (LCEL)
> Rnnable이 지원
- Prompt - LLM - outputParser을 연결하는 것을 의미

1. **프롬프트 생성**
    1. 사용자의 요구 사항이나 특정 작업을 정의하는 Prompt를 생성합니다. 
    2. 이 Prompt는 LLM에게 전달하기 전에, 작업의 목적과 맥락을 명확히 전달하기 위해 최적화 될 수 있습니다.
2. **LLM 모델** 
    1. LLM은 제공된 Prompt를 분석하고, 학습된 지식을 바탕으로 적절한 응답을 생성합니다. 
    2. 이 과정에서 LLM은 내부적으로 다양한 언어 패턴과 내 외부 지식을 활용하여, 요청된 작업을 수행하거나 정보를 제공합니다.
3. **출력 파서 (Output Parser)**
    1. LLM에 의해 생성된 응답은 최종 사용자에게 필요한 형태로 변환되어 제공됩니다. 
    2. 이 응답은 직접적인 답변, 생성된 텍스트, 요약된 정보 등 다양한 형태를 취할 수 있습니다.

#### Runnable 프로토콜
> PromptTemplate + LLM(stream()) + StrOutputParser
1. invoke : 주어진 입력에 대해 체인을 호출하고, 결과를 반환합니다. 이 메소드는 단일 입력에 대해 동기적으로 작동합니다.
2. batch : 입력 리스트에 대해 체인을 호출하고, 각 입력에 대한 결과를 리스트로 반환합니다. 이 메소드는 여러 입력에 대해 동기적으로 작동하며, 효율적인 배치 처리를 가능하게 합니다.
3. stream : 입력에 대해 체인을 호출하고, 결과의 조각들을 스트리밍 합니다. 이는 대용량 데이터 처리나 실시간 데이터 처리에 유용합니다.
4. 비동기 버전 : `ainvoke`, `abatch`, `astream` 등의 메소드는 각각의 동기 버전에 대한 비동기 실행을 지원합니다. 이를 통해 비동기 프로그래밍 패러다임을 사용하여 더 높은 처리 성능과 효율을 달성할 수 있습니다.

- **stream: 실시간 출력**
    
    `chain.stream`() 메서드를 사용하여 주어진 토픽에 대한 데이터 스트림을 생성하고, 이 스트림을 반복하여 각 데이터의 내용(`content`)을 즉시 출력합니다.