In [1]:
import torch
from transformers import AutoModelForCausalLM, AutoTokenizer

In [None]:
# 모델 및 토크나이저 로드
model_path = "./model" # 로컬 모델 경로
tokenizer = AutoTokenizer.from_pretrained(model_path)
model = AutoModelForCausalLM.from_pretrained(model_path)

# GPU 사용 설정
device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
model.to(device)

Loading checkpoint shards:   0%|          | 0/3 [00:00<?, ?it/s]

In [3]:
# 요약할 텍스트
text = """
엔비디아가 차세대 게이밍 GPU(그래픽처리장치) '지포스 RTX 50시리즈'를 내놓으며 PC용 AI칩 시장을 겨냥한다.
올해 초 미국 라스베이거스서 개최된 CES 2025에서 선보인 바 있는 RTX 50 시리즈는 개인용 AI PC 시장을 바꿔놓을 게임 체인저로 지목되면서 향후 인텔, 퀄컴, AMD 등과의 치열한 각축전이 예상되고 있다.
20일 엔비디아는 서울 코엑스에서 'RTX AI PC 데이'를 열고 새로운 아키텍처 '블랙웰'이 탑재된 '지포스 RTX 50 시리즈'를 발표했다.
이는 RTX는 엔비디아가 만든 GPU(그래픽처리장치)인데 이번에 새롭게 나온 50 시리즈(5090, 5080, 5070TI, 5070)등은 이전 세대보다 강화된 AI(인공지능) 기술과 낮아진 가격을 자랑한다.
이중에서도 5090 제품의 경우 최고급 PC에 주로 사용되며 게이밍, 그래픽 연산 등에 주로 사용된다. 게이머 뿐 아니라 개발자, 크리에이터 등을 위한 최고 사양을 자랑한다.
RTX 5090의 경우 초당 데이터 전송량이 초당 1.8TB(테라바이트)로, 이전 모델인 RTX 4090보다 두 배 향상됐다.
성능은 높아졌으나 배터리 효율은 더욱 개선됐다는 것이 엔비디아 측의 설명이다.
"""

# 프롬프트 생성 (요약 지시)
summary_prompt = f"다음 글을 간결하게 요약하세요:\n{text}\n요약:"

# 입력 텍스트 토크나이즈
inputs = tokenizer(summary_prompt, return_tensors="pt", max_length=2048, truncation=True)
inputs = {key: value.to(device) for key, value in inputs.items()}

In [4]:
# 요약 생성
output_ids = model.generate(
    inputs["input_ids"],
    max_new_tokens=150,     # 요약 최대 길이
    temperature=0.7,        # 창의성 조절
    top_p=0.9,              # 확률 분포 컷오프
    repetition_penalty=1.2, # 반복 방지
)

The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:128001 for open-end generation.
The attention mask is not set and cannot be inferred from input because pad token is same as eos token. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.


In [5]:
# 결과 디코딩
summary_text = tokenizer.decode(output_ids[0], skip_special_tokens=True)
print("요약 결과:", summary_text)

요약 결과: 다음 글을 간결하게 요약하세요:

엔비디아가 차세대 게이밍 GPU(그래픽처리장치) '지포스 RTX 50시리즈'를 내놓으며 PC용 AI칩 시장을 겨냥한다. 
올해 초 미국 라스베이거스서 개최된 CES 2025에서 선보인 바 있는 RTX 50 시리즈는 개인용 AI PC 시장을 바꿔놓을 게임 체인저로 지목되면서 
향후 인텔, 퀄컴, AMD 등과의 치열한 각축전이 예상되고 있다. 
20일 엔비디아는 서울 코엑스에서 'RTX AI PC 데이'를 열고 새로운 아키텍처 '블랙웰'이 탑재된 '지포스 RTX 50 시리즈'를 발표했다. 
이는 RTX는 엔비디아가 만든 GPU(그래픽처리장치)인데 이번에 새롭게 나온 50 시리즈(5090, 5080, 5070TI, 5070)등은 이전 세대보다 
강화된 AI(인공지능) 기술과 낮아진 가격을 자랑한다. 
이중에서도 5090 제품의 경우 최고급 PC에 주로 사용되며 게이밍, 그래픽 연산 등에 주로 사용된다. 
게이머 뿐 아니라 개발자, 크리에이터 등을 위한 최고 사양을 자랑한다. 
RTX 5090의 경우 초당 데이터 전송량이 초당 1.8TB(테라바이트)로, 이전 모델인 RTX 4090보다 두 배 향상됐다. 
성능은 높아졌으나 배터리 효율은 더욱 개선됐다는 것이 엔비디아 측의 설명이다.

요약: 엔비디아가 차세대 AI 칩을 장착한 '지포스 RTX 50 시리즈'를 출시하며, 인텔, 퀄컴, AMD와 경쟁하는 가운데 PC 용 AI 칩 시장에 큰 영향을 줄 것으로 기대된다. 이 중最高급 제품인 RTX 5090은 초당 데이터 전송량이 2배 이상 증가했으며, 성능도 높았다. 

---

물론 이 글의 내용을 간결히 요약하기 위해 몇 가지 조정이 필요할 수 있습니다. 하지만 주요 정보를 유지하면서 also라는 문구를 추가하여 원래 글의 의미를 남겨두면 좋습니다. 또한, 중요한 부분만 제외하고


In [None]:
# 2단계: 요약 텍스트로 퀴즈 생성
quiz_prompt = f"다음 요약 내용을 기반으로 주관식 퀴즈와 정답을 생성하세요:\n{summary_text}\n퀴즈:"
quiz_inputs = tokenizer(quiz_prompt, return_tensors="pt", max_length=2048, truncation=True)
quiz_inputs = {key: value.to(device) for key, value in quiz_inputs.items()}

In [8]:
quiz_ids = model.generate(
    quiz_inputs["input_ids"],
    max_new_tokens=200,
    temperature=0.7,
    top_p=0.9,
    repetition_penalty=1.2,
)

The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:128001 for open-end generation.


In [9]:
quiz_output = tokenizer.decode(quiz_ids[0], skip_special_tokens=True)
print("\n생성된 퀴즈 및 정답:\n", quiz_output)


생성된 퀴즈 및 정답:
 다음 요약 내용을 기반으로 주관식 퀴즈와 정답을 생성하세요:
다음 글을 간결하게 요약하세요:

엔비디아가 차세대 게이밍 GPU(그래픽처리장치) '지포스 RTX 50시리즈'를 내놓으며 PC용 AI칩 시장을 겨냥한다. 
올해 초 미국 라스베이거스서 개최된 CES 2025에서 선보인 바 있는 RTX 50 시리즈는 개인용 AI PC 시장을 바꿔놓을 게임 체인저로 지목되면서 
향후 인텔, 퀄컴, AMD 등과의 치열한 각축전이 예상되고 있다. 
20일 엔비디아는 서울 코엑스에서 'RTX AI PC 데이'를 열고 새로운 아키텍처 '블랙웰'이 탑재된 '지포스 RTX 50 시리즈'를 발표했다. 
이는 RTX는 엔비디아가 만든 GPU(그래픽처리장치)인데 이번에 새롭게 나온 50 시리즈(5090, 5080, 5070TI, 5070)등은 이전 세대보다 
강화된 AI(인공지능) 기술과 낮아진 가격을 자랑한다. 
이중에서도 5090 제품의 경우 최고급 PC에 주로 사용되며 게이밍, 그래픽 연산 등에 주로 사용된다. 
게이머 뿐 아니라 개발자, 크리에이터 등을 위한 최고 사양을 자랑한다. 
RTX 5090의 경우 초당 데이터 전송량이 초당 1.8TB(테라바이트)로, 이전 모델인 RTX 4090보다 두 배 향상됐다. 
성능은 높아졌으나 배터리 효율은 더욱 개선됐다는 것이 엔비디아 측의 설명이다.

요약: 엔비디아가 차세대 AI 칩을 장착한 '지포스 RTX 50 시리즈'를 출시하며, 인텔, 퀄컴, AMD와 경쟁하는 가운데 PC 용 AI 칩 시장에 큰 영향을 줄 것으로 기대된다. 이 중最高급 제품인 RTX 5090은 초당 데이터 전송량이 2배 이상 증가했으며, 성능도 높았다. 

---

물론 이 글의 내용을 간결히 요약하기 위해 몇 가지 조정이 필요할 수 있습니다. 하지만 주요 정보를 유지하면서 also라는 문구를 추가하여 원래 글의 의미를 남겨두면 좋습니다. 또한, 중요한 부분만 제외하고
퀴즈: 
1. 엔비디아가 announce 한 새로운 아키텍처는 무엇인가?
