# Langchain 서비스

## YoutubeLoader

In [1]:
from langchain.document_loaders import YoutubeLoader
from langchain.chains.summarize import load_summarize_chain
from langchain.chat_models import ChatOpenAI

In [3]:
# YouTubeLoader 모듈을 이용해 YouTube URL에서 데이터를 로드
loader = YoutubeLoader.from_youtube_url('https://www.youtube.com/watch?v=O5nskjZ_GoI', add_video_info=True)

# 해당 YouTube 영상의 스크립트 데이터를 불러옴 (script 변수에 저장)
script = loader.load()

# 불러온 스크립트의 첫 번째 페이지의 내용(page_content)을 출력
print(script[0].page_content)


Hello world, I’m Carrie Anne, and welcome
to CrashCourse Computer Science! Over the course of this series, we’re going
to go from bits, bytes, transistors and logic gates, all the way to Operating Systems, Virtual
Reality and Robots! We’re going to cover a lot, but just to
clear things up - we ARE NOT going to teach you how to program. Instead, we’re going to explore a range
of computing topics as a discipline and a technology. Computers are the lifeblood of today’s world. If they were to suddenly turn off, all at
once, the power grid would shut down, cars would crash, planes would fall, water treatment
plants would stop, stock markets would freeze, trucks with food wouldn’t know where to
deliver, and employees wouldn’t get paid. Even many non-computer objects - like DFTBA
shirts and the chair I’m sitting on – are made in factories run by computers. Computing really has transformed nearly every
aspect of our lives. And this isn’t the first time we’ve seen
this sort of technology-driven

In [None]:
!pip install -U langchain-openai

In [None]:
!pip show  langchain-openai

In [5]:
# LangChain 라이브러리와 OpenAI 모델을 사용하여 텍스트의 토큰 수를 계산하는 기능
# 0.3.0 이후
# pip install -U langchain-openai
# from langchain_openai import OpenAI

# 0.0.10 ~ 0.3.0에서만 사용
from langchain.llms import OpenAI

# OpenAI의 LLM(Language Learning Model) 인스턴스 생성
# 모델명은 "text-ada-001"을 사용하고, 한 번에 하나의 응답을 생성함
llm = OpenAI(model_name="text-ada-001", n=1, best_of=1)


# 주어진 텍스트의 토큰 수를 계산하여 출력하는 코드
# script[0].page_content: 분석할 텍스트 
# get_num_tokens(): 텍스트의 토큰 수를 반환하는 함수
print(llm.get_num_tokens(script[0].page_content))


3033


In [6]:
# 요약
# chain = load_summarize_chain(ChatOpenAI(temperature=0), chain_type='stuff', verbose=False)
# result = chain.run(script)
# print(result)

# OpenAI API 키 설정 

with open("./GPT_Key.txt", "r") as f:
    api_key = f.read().strip()

# ChatOpenAI 인스턴스 생성
llm = ChatOpenAI(api_key=api_key, temperature=0)

# 요약 체인 실행
chain = load_summarize_chain(llm, chain_type='stuff', verbose=False)
result = chain.run(script)
print(result)

  llm = ChatOpenAI(api_key=api_key, temperature=0)
  result = chain.run(script)


Carrie Anne introduces CrashCourse Computer Science, covering a range of computing topics without teaching programming. Computers are essential to modern life, impacting everything from power grids to food delivery. The series explores the history of computing, from the abacus to Charles Babbage's Difference Engine and Analytical Engine. The US government's use of Herman Hollerith's tabulating machine for the 1890 census marked the beginning of computers in business and government. This led to the founding of IBM and the development of digital computers to meet the demands of a growing population and global trade.


In [7]:
# 한글로 번역
import tool

sentence = tool.remove_empty_lines(result) # 빈 라인 삭제
# print(sentence)
prompt = f'아래 문장을 한국어로 번역해줘.\n\n{sentence}'
print('-> prompt: ' + prompt)
print('-' * 80)
format = '''
{
  "res": "번역된 문장"
}
'''

response = tool.answer('너는 번역기야', prompt, format)

print(response['res'])

# gpt-4o
# 캐리 앤은 프로그래밍을 가르치지 않고 다양한 컴퓨팅 주제를 다루는 CrashCourse Computer Science를 소개합니다. 
# 그녀는 현대 사회에서 컴퓨터의 중요성과 그들의 변혁적인 영향을 논의합니다. 
# 주판에서 찰스 배비지의 차분기와 분석 엔진에 이르기까지 컴퓨팅의 역사가 탐구됩니다. 
# 특정 작업을 위한 컴퓨팅 장치의 개발은 허먼 홀러리스에 의해 최초의 범용 컴퓨터가 만들어지게 했으며, 
# 이는 비즈니스와 정부에서 데이터 처리를 혁신했습니다. 이는 이후 디지털 컴퓨터의 기초를 마련했습니다.

-> prompt: 아래 문장을 한국어로 번역해줘.

Carrie Anne introduces CrashCourse Computer Science, covering a range of computing topics without teaching programming. Computers are essential to modern life, impacting everything from power grids to food delivery. The series explores the history of computing, from the abacus to Charles Babbage's Difference Engine and Analytical Engine. The US government's use of Herman Hollerith's tabulating machine for the 1890 census marked the beginning of computers in business and government. This led to the founding of IBM and the development of digital computers to meet the demands of a growing population and global trade.
--------------------------------------------------------------------------------
캐리 앤은 프로그래밍을 가르치지 않고 다양한 컴퓨팅 주제를 다루는 CrashCourse 컴퓨터 과학을 소개합니다. 컴퓨터는 현대 생활에 필수적이며, 전력망에서 음식 배달에 이르기까지 모든 것에 영향을 미칩니다. 이 시리즈는 주판에서 찰스 배비지의 차분 기관과 분석 기관에 이르기까지 컴퓨팅의 역사를 탐구합니다. 1890년 인구 조사에서 허먼 홀러리트의 집계 기계를 사용한 미국 정부의 사례는 비즈니스와 정부에서 컴퓨터의 시작을 알렸습니다. 이는 IBM의 설립과 증가하는 인구와 

In [8]:
from pytubefix import YouTube

# YouTube 비디오 객체 생성
yt = YouTube('https://www.youtube.com/watch?v=jmkD21Q25SY&t=11s')

# 비디오 제목 출력
print(yt.title)

# 비디오의 스트림 정보 확인
streams = yt.streams.all()
for stream in streams:
    print(stream)

# 최고 화질의 비디오 다운로드
yt.streams.get_highest_resolution().download()


Spicy stir-fried pork and kimchi (Dwaeji-kimchi duruchigi 돼지김치 두루치기)
<Stream: itag="18" mime_type="video/mp4" res="360p" fps="24fps" vcodec="avc1.42001E" acodec="mp4a.40.2" progressive="True" type="video">
<Stream: itag="137" mime_type="video/mp4" res="1080p" fps="24fps" vcodec="avc1.640028" progressive="False" type="video">
<Stream: itag="248" mime_type="video/webm" res="1080p" fps="24fps" vcodec="vp9" progressive="False" type="video">
<Stream: itag="399" mime_type="video/mp4" res="1080p" fps="24fps" vcodec="av01.0.08M.08" progressive="False" type="video">
<Stream: itag="136" mime_type="video/mp4" res="720p" fps="24fps" vcodec="avc1.4d401f" progressive="False" type="video">
<Stream: itag="247" mime_type="video/webm" res="720p" fps="24fps" vcodec="vp9" progressive="False" type="video">
<Stream: itag="398" mime_type="video/mp4" res="720p" fps="24fps" vcodec="av01.0.05M.08" progressive="False" type="video">
<Stream: itag="135" mime_type="video/mp4" res="480p" fps="24fps" vcodec="avc1.4d4

  streams = yt.streams.all()


'F:\\ai\\ws_python\\openai_ex\\langchain\\Spicy stir-fried pork and kimchi (Dwaeji-kimchi duruchigi 돼지김치 두루치기).mp4'