# 300_HuggingFace_QuickStart_pipeline

파이프라인은 추론을 위해 모델을 사용하는 훌륭하고 쉬운 방법입니다.

이러한 파이프라인은 라이브러리에서 대부분의 복잡한 코드를 추상화하는 개체로, Named Entity Recognition, Masked Language Modeling, 감정 분석, Feature Extraction 및 Question Answering.을 비롯한 여러 task 전용의 간단한 API를 제공합니다.

In [None]:
!pip install -q transformers datasets
!pip install -q sentencepiece
!pip install -q kobert-transformers

[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m363.4/363.4 MB[0m [31m3.2 MB/s[0m eta [36m0:00:00[0m
[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m13.8/13.8 MB[0m [31m88.1 MB/s[0m eta [36m0:00:00[0m
[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m24.6/24.6 MB[0m [31m76.3 MB/s[0m eta [36m0:00:00[0m
[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m883.7/883.7 kB[0m [31m41.5 MB/s[0m eta [36m0:00:00[0m
[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m664.8/664.8 MB[0m [31m2.4 MB/s[0m eta [36m0:00:00[0m
[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m211.5/211.5 MB[0m [31m5.0 MB/s[0m eta [36m0:00:00[0m
[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m56.3/56.3 MB[0m [31m42.0 MB/s[0m eta [36m0:00:00[0m
[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m127.9/127.9 MB[0m [31m19.8 MB/s[0m eta [36m0:00:00[0m
[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━

In [None]:
from transformers import pipeline

🤗 Transformers 라이브러리 기능을 간단히 살펴보겠습니다.  

라이브러리는 **텍스트의 감정 분석과 같은 자연어 이해(NLU)** 및 **새 텍스트로 프롬프트를 완성하거나 다른 언어로 번역하는 것과 같은 자연어 생성(NLG)** 작업을 위해 사전 훈련된 모델을 다운로드합니다.

먼저 pipeline API를 쉽게 활용하여 추론에서 **사전 훈련된 모델**을 빠르게 사용하는 방법을 살펴보겠습니다. 그런 다음, 라이브러리가 어떻게 이러한 모델에 대한 액세스를 제공하고 **데이터를 사전 처리**하는 데 도움이 되는지 확인 할 것입니다.

## pipeline 으로 작업 시작하기

- 주어진 task 에서 사전 훈련된 모델을 사용하는 가장 쉬운 방법은  `pipeline`을 사용하는 것입니다.

🤗 Transformers 라이브러리는 기본적으로 다음 task를 제공합니다.

- **기계 번역(Translation)**: 다른 언어로 된 텍스트를 번역합니다.  
- **감정 분석(Text Classification)**: 텍스트는 긍정적인가 부정적인가?
- **텍스트 생성(Text Generation)**: 프롬프트를 제공하면 모델이 다음을 생성합니다.
- **이름 개체 인식(NER)**: 입력 문장에서 각 단어를 나타내는 개체(사람, 장소, 등.)
- **질문 답변(Question Answering)**: 모델에 일부 컨텍스트와 질문을 제공하고 컨텍스트에서 답변을 추출합니다.
- **마스킹된 텍스트 채우기(Fill-Mask)**: 마스킹된 단어가 있는 텍스트(예: `[MASK]`로 대체)가 주어지면 공백을 채웁니다.
- **요약(Summarization)**: 긴 텍스트의 요약을 생성합니다.
- **특징 추출(Feature Extraction)**: 텍스트의 텐서 표현을 반환합니다.
- **Zero-Shot 분류(Zero-Shot Classification)**


### pretrained models : https://huggingface.co/models

## 기계 번역

- korean pretrained model : https://huggingface.co/Helsinki-NLP/opus-mt-ko-en  

- Helsinki-NLP : University of Helsinki 에서 작성한 다양한 언어 모델 그룹

In [None]:
# HuggingFace Transformers의 번역 파이프라인 생성
# 한국어(Korean) → 영어(English) 번역 모델 사용
translator = pipeline("translation", model="Helsinki-NLP/opus-mt-ko-en")

translator("나는 너를 사랑해"), translator("언제나 당신에게 감사함을 느끼고 있습니다.")

The secret `HF_TOKEN` does not exist in your Colab secrets.
To authenticate with the Hugging Face Hub, create a token in your settings tab (https://huggingface.co/settings/tokens), set it as secret in your Google Colab and restart your session.
You will be able to reuse this secret in all of your notebooks.
Please note that authentication is recommended but still optional to access public models or datasets.


config.json:   0%|          | 0.00/1.39k [00:00<?, ?B/s]

pytorch_model.bin:   0%|          | 0.00/312M [00:00<?, ?B/s]

generation_config.json:   0%|          | 0.00/293 [00:00<?, ?B/s]

model.safetensors:   0%|          | 0.00/312M [00:00<?, ?B/s]

tokenizer_config.json:   0%|          | 0.00/44.0 [00:00<?, ?B/s]

source.spm:   0%|          | 0.00/842k [00:00<?, ?B/s]

target.spm:   0%|          | 0.00/813k [00:00<?, ?B/s]

vocab.json:   0%|          | 0.00/1.72M [00:00<?, ?B/s]

Device set to use cuda:0


([{'translation_text': 'I love you.'}],
 [{'translation_text': "I'm always grateful to you."}])

## 감정 분석

In [None]:
# 감성 분석(sentiment analysis) 파이프라인 생성
# 기본적으로 영어 문장에 대해 긍정(positive) 또는 부정(negative) 감정을 분류하는 사전학습 모델을 사용
classifier = pipeline('sentiment-analysis')

No model was supplied, defaulted to distilbert/distilbert-base-uncased-finetuned-sst-2-english and revision 714eb0f (https://huggingface.co/distilbert/distilbert-base-uncased-finetuned-sst-2-english).
Using a pipeline without specifying a model name and revision in production is not recommended.


config.json:   0%|          | 0.00/629 [00:00<?, ?B/s]

Xet Storage is enabled for this repo, but the 'hf_xet' package is not installed. Falling back to regular HTTP download. For better performance, install the package with: `pip install huggingface_hub[hf_xet]` or `pip install hf_xet`


model.safetensors:   0%|          | 0.00/268M [00:00<?, ?B/s]

tokenizer_config.json:   0%|          | 0.00/48.0 [00:00<?, ?B/s]

vocab.txt:   0%|          | 0.00/232k [00:00<?, ?B/s]

Device set to use cuda:0


- 이 명령을 처음 입력하면 사전 훈련된 모델과 해당 토크나이저가 다운로드되어 캐시됩니다.  

- 토크나이저는 모델의 텍스트를 사전 처리한 다음 예측을 담당하는 역할을 합니다.  

- 파이프라인은 모든 것을 함께 그룹화하고 예측을 읽을 수 있도록 사후 처리합니다. 예를 들어:

In [None]:
classifier('We are very happy to show you the 🤗 Transformers library.')

[{'label': 'POSITIVE', 'score': 0.9997795224189758}]

사전 처리된 다음 모델에 *batch*로 공급하면 다음과 같은 사전 목록을 반환합니다.

In [None]:
results = classifier([
                      "We are very happy to show you the 🤗 Transformers library.",
                       "We hope you don't hate it."
                        ])

for result in results:
    print(f"label: {result['label']}, with score: {round(result['score'], 4)}")

label: POSITIVE, with score: 0.9998
label: NEGATIVE, with score: 0.5309


## 한국어 감정분석

- NSMC(Naver Sentiment Movie Corpus) 로 미세 조정된 BERT 다국어 basecase 모델 : https://huggingface.co/sangrimlee/bert-base-multilingual-cased-nsmc

In [None]:
# 한국어 감성 분석 파이프라인 생성
# 'sangrimlee/bert-base-multilingual-cased-nsmc' 모델은
# 네이버 영화 리뷰 데이터셋(NSMC)으로 학습된 다국어 BERT 기반 감성 분류 모델
classifier_ko = pipeline('sentiment-analysis',
                         model="sangrimlee/bert-base-multilingual-cased-nsmc")

config.json:   0%|          | 0.00/932 [00:00<?, ?B/s]

pytorch_model.bin:   0%|          | 0.00/712M [00:00<?, ?B/s]

tokenizer_config.json:   0%|          | 0.00/297 [00:00<?, ?B/s]

vocab.txt:   0%|          | 0.00/996k [00:00<?, ?B/s]

model.safetensors:   0%|          | 0.00/711M [00:00<?, ?B/s]

tokenizer.json:   0%|          | 0.00/1.96M [00:00<?, ?B/s]

special_tokens_map.json:   0%|          | 0.00/112 [00:00<?, ?B/s]

Device set to use cuda:0


In [None]:
print(classifier_ko("오늘은 정말 즐거운 날이다. 행복하다."))
print(classifier_ko("기분이 꿀꿀해서 술이나 한잔 해야겠다."))

[{'label': 'positive', 'score': 0.991436779499054}]
[{'label': 'negative', 'score': 0.8828708529472351}]


In [None]:
classifier_ko([
               "언제나 당신에게 감사함을 느끼고 있습니다.",
               "너한테는 별로 좋은 기억이 없어."
               ])

[{'label': 'positive', 'score': 0.9883792400360107},
 {'label': 'negative', 'score': 0.9782137870788574}]

- 자동 별점 부여

In [None]:
# 다국어 감성 분석 모델 이름 지정
# 'nlptown/bert-base-multilingual-uncased-sentiment'는 영어뿐만 아니라 한국어 등 여러 언어의 감성 분석이 가능한 BERT 기반 모델
model_name = "nlptown/bert-base-multilingual-uncased-sentiment"

# 감성 분석 파이프라인 생성 (한국어 문장도 지원됨)
kor_classifier = pipeline('sentiment-analysis', model=model_name)

texts = ["다시는 보고 싶지 않은 짜증나는 영화",
            "아주 재미있는 영화",
            "정말 재미없는 영화였다",
            "이 영화 망할거야",
            "이 영화 최고",
            "보통 영화"]

results = kor_classifier(texts)

for i, result in enumerate(results):
    print(f"{texts[i]} --> 별점: {result['label']}, with score: {round(result['score'], 4)}")

Device set to use cuda:0


다시는 보고 싶지 않은 짜증나는 영화 --> 별점: 1 star, with score: 0.297
아주 재미있는 영화 --> 별점: 4 stars, with score: 0.3977
정말 재미없는 영화였다 --> 별점: 2 stars, with score: 0.3608
이 영화 망할거야 --> 별점: 1 star, with score: 0.2782
이 영화 최고 --> 별점: 5 stars, with score: 0.8198
보통 영화 --> 별점: 3 stars, with score: 0.4462


## Zero Shot Pipeline - 처음 보는 문장의 category 분류

In [None]:
# 제로샷 분류(zero-shot classification) 파이프라인 생성
# 사전 정의된 레이블(label)에 대해 학습 없이 문장을 분류할 수 있음
classifier = pipeline("zero-shot-classification")

# 입력 문장을 주어진 후보 레이블 중 어떤 범주로 분류할지 예측
sequence = "This is a course about the Transformers library"
candidate_labels = ["education", "politics", "business"]

result = classifier(
    sequence     ,  # 분류할 문장
    candidate_labels=candidate_labels  # 후보 레이블 목록
)

result

No model was supplied, defaulted to facebook/bart-large-mnli and revision d7645e1 (https://huggingface.co/facebook/bart-large-mnli).
Using a pipeline without specifying a model name and revision in production is not recommended.
Device set to use cuda:0


{'sequence': 'This is a course about the Transformers library',
 'labels': ['education', 'business', 'politics'],
 'scores': [0.844595193862915, 0.11197695881128311, 0.04342786595225334]}

### Zero Shot Pipeline - 다국어 version

In [None]:
classifier = pipeline("zero-shot-classification", model='joeddav/xlm-roberta-large-xnli')

sequence = "2025년 대통령 선거에 누구에게 투표하겠습니까"
candidate_labels = ["건강", "문화", "정치"]
hypothesis_template = "이 텍스트는 {}에 관한 내용 입니다."

result = classifier(sequence, candidate_labels, hypothesis_template=hypothesis_template)
result

Some weights of the model checkpoint at joeddav/xlm-roberta-large-xnli were not used when initializing XLMRobertaForSequenceClassification: ['roberta.pooler.dense.bias', 'roberta.pooler.dense.weight']
- This IS expected if you are initializing XLMRobertaForSequenceClassification from the checkpoint of a model trained on another task or with another architecture (e.g. initializing a BertForSequenceClassification model from a BertForPreTraining model).
- This IS NOT expected if you are initializing XLMRobertaForSequenceClassification from the checkpoint of a model that you expect to be exactly identical (initializing a BertForSequenceClassification model from a BertForSequenceClassification model).
Device set to use cuda:0


{'sequence': '2025년 대통령 선거에 누구에게 투표하겠습니까',
 'labels': ['정치', '문화', '건강'],
 'scores': [0.9749680161476135, 0.01818726398050785, 0.006844703573733568]}

## Text 생성

In [None]:
# 텍스트 생성(text generation) 파이프라인 생성
# distilgpt2 모델은 GPT-2를 경량화한 버전으로, 빠르고 효율적인 텍스트 생성이 가능함
generator = pipeline("text-generation", model="distilgpt2")

# 주어진 문장으로부터 텍스트를 이어서 생성
# - max_length: 전체 생성 문장의 최대 길이
# - num_return_sequences: 생성할 문장 수 (여기선 2개)
result = generator(
    "In this course, we will teach you how to",  # 시작 문장
    max_length=30,
    num_return_sequences=2
)

print(result)

config.json:   0%|          | 0.00/762 [00:00<?, ?B/s]

Xet Storage is enabled for this repo, but the 'hf_xet' package is not installed. Falling back to regular HTTP download. For better performance, install the package with: `pip install huggingface_hub[hf_xet]` or `pip install hf_xet`


model.safetensors:   0%|          | 0.00/353M [00:00<?, ?B/s]

generation_config.json:   0%|          | 0.00/124 [00:00<?, ?B/s]

tokenizer_config.json:   0%|          | 0.00/26.0 [00:00<?, ?B/s]

vocab.json:   0%|          | 0.00/1.04M [00:00<?, ?B/s]

merges.txt:   0%|          | 0.00/456k [00:00<?, ?B/s]

tokenizer.json:   0%|          | 0.00/1.36M [00:00<?, ?B/s]

Device set to use cuda:0
Truncation was not explicitly activated but `max_length` is provided a specific value, please use `truncation=True` to explicitly truncate examples to max length. Defaulting to 'longest_first' truncation strategy. If you encode pairs of sequences (GLUE-style) with the tokenizer you can select this strategy more precisely by providing a specific strategy to `truncation`.
Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


[{'generated_text': 'In this course, we will teach you how to learn how to write an HTML form for Word. It․ can be found on GitHub, as'}, {'generated_text': 'In this course, we will teach you how to create and use data using a basic form of graph programming on Clojure in the future. It will also'}]


### 한글 Text 생성

- SKT 에서 2021년 5월에 만든 `skt/ko-gpt-trinity-1.2B-v0.5` model 사용 (https://huggingface.co/skt/ko-gpt-trinity-1.2B-v0.5)

In [None]:
generator = pipeline("text-generation", model="skt/ko-gpt-trinity-1.2B-v0.5")
generator(
        "이 학습 과정에서, 제가 가르치고 싶은 것은",
        max_length=30,
        num_return_sequences=1)

config.json:   0%|          | 0.00/731 [00:00<?, ?B/s]

pytorch_model.bin:   0%|          | 0.00/4.68G [00:00<?, ?B/s]

model.safetensors:   0%|          | 0.00/4.68G [00:00<?, ?B/s]

tokenizer_config.json:   0%|          | 0.00/2.00 [00:00<?, ?B/s]

tokenizer.json:   0%|          | 0.00/1.05M [00:00<?, ?B/s]

special_tokens_map.json:   0%|          | 0.00/109 [00:00<?, ?B/s]

Device set to use cuda:0
Truncation was not explicitly activated but `max_length` is provided a specific value, please use `truncation=True` to explicitly truncate examples to max length. Defaulting to 'longest_first' truncation strategy. If you encode pairs of sequences (GLUE-style) with the tokenizer you can select this strategy more precisely by providing a specific strategy to `truncation`.


[{'generated_text': "이 학습 과정에서, 제가 가르치고 싶은 것은 '자기주도학습'입니다. 자기주도학습은 학습자가 스스로 학습 목표를 설정하고 학습 계획을 수립하고"}]

In [None]:
generator(
        "스스로 학습 목표를 설정하고 학습 계획을 수립하고",
        max_length=30,
        num_return_sequences=1)

[{'generated_text': '스스로 학습 목표를 설정하고 학습 계획을 수립하고 실천하는 과정을 통해 학습자의 학습 동기를 유발하고 학습자의 학습 의욕을 고취시키는 데 목적이'}]

In [None]:
generator(
        "학습자의 학습 의욕을 고취시키는 데 목적이",
        max_length=30,
        num_return_sequences=1)

[{'generated_text': '학습자의 학습 의욕을 고취시키는 데 목적이 있다. \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n'}]

### 마스킹된 텍스트 채우기

In [None]:
# 빈칸 채우기 (Masked Language Modeling) 파이프라인 생성
# BERT 계열 모델을 사용하여 <mask> 토큰에 들어갈 가장 적절한 단어 예측
unmasker = pipeline("fill-mask")

# 문장에서 <mask> 위치에 올 수 있는 단어를 예측
# - top_k=2: 상위 2개의 예측 결과를 반환
result = unmasker("This course will teach you all about <mask> models.", top_k=2)

# 예측 결과 출력
print(result)

No model was supplied, defaulted to distilbert/distilroberta-base and revision fb53ab8 (https://huggingface.co/distilbert/distilroberta-base).
Using a pipeline without specifying a model name and revision in production is not recommended.


config.json:   0%|          | 0.00/480 [00:00<?, ?B/s]

Xet Storage is enabled for this repo, but the 'hf_xet' package is not installed. Falling back to regular HTTP download. For better performance, install the package with: `pip install huggingface_hub[hf_xet]` or `pip install hf_xet`


model.safetensors:   0%|          | 0.00/331M [00:00<?, ?B/s]

Some weights of the model checkpoint at distilbert/distilroberta-base were not used when initializing RobertaForMaskedLM: ['roberta.pooler.dense.bias', 'roberta.pooler.dense.weight']
- This IS expected if you are initializing RobertaForMaskedLM from the checkpoint of a model trained on another task or with another architecture (e.g. initializing a BertForSequenceClassification model from a BertForPreTraining model).
- This IS NOT expected if you are initializing RobertaForMaskedLM from the checkpoint of a model that you expect to be exactly identical (initializing a BertForSequenceClassification model from a BertForSequenceClassification model).


tokenizer_config.json:   0%|          | 0.00/25.0 [00:00<?, ?B/s]

vocab.json:   0%|          | 0.00/899k [00:00<?, ?B/s]

merges.txt:   0%|          | 0.00/456k [00:00<?, ?B/s]

tokenizer.json:   0%|          | 0.00/1.36M [00:00<?, ?B/s]

Device set to use cuda:0


[{'score': 0.19619743525981903, 'token': 30412, 'token_str': ' mathematical', 'sequence': 'This course will teach you all about mathematical models.'}, {'score': 0.04052695631980896, 'token': 38163, 'token_str': ' computational', 'sequence': 'This course will teach you all about computational models.'}]


### 개체명 인식

In [None]:
# 개체명 인식(NER: Named Entity Recognition) 파이프라인 생성
# grouped_entities=True: 같은 개체로 인식된 연속된 토큰들을 하나로 묶어서 반환
ner = pipeline("ner", grouped_entities=True)

# 입력 문장에서 사람 이름, 기관명, 위치 등 고유 명사를 인식
result = ner("My name is Sylvian and I work at Hugging Face in Brooklyn")

# 결과 출력
print(result)

No model was supplied, defaulted to dbmdz/bert-large-cased-finetuned-conll03-english and revision 4c53496 (https://huggingface.co/dbmdz/bert-large-cased-finetuned-conll03-english).
Using a pipeline without specifying a model name and revision in production is not recommended.


config.json:   0%|          | 0.00/998 [00:00<?, ?B/s]

Xet Storage is enabled for this repo, but the 'hf_xet' package is not installed. Falling back to regular HTTP download. For better performance, install the package with: `pip install huggingface_hub[hf_xet]` or `pip install hf_xet`


model.safetensors:   0%|          | 0.00/1.33G [00:00<?, ?B/s]

Some weights of the model checkpoint at dbmdz/bert-large-cased-finetuned-conll03-english were not used when initializing BertForTokenClassification: ['bert.pooler.dense.bias', 'bert.pooler.dense.weight']
- This IS expected if you are initializing BertForTokenClassification from the checkpoint of a model trained on another task or with another architecture (e.g. initializing a BertForSequenceClassification model from a BertForPreTraining model).
- This IS NOT expected if you are initializing BertForTokenClassification from the checkpoint of a model that you expect to be exactly identical (initializing a BertForSequenceClassification model from a BertForSequenceClassification model).


tokenizer_config.json:   0%|          | 0.00/60.0 [00:00<?, ?B/s]

vocab.txt:   0%|          | 0.00/213k [00:00<?, ?B/s]

Device set to use cuda:0


[{'entity_group': 'PER', 'score': np.float32(0.99876773), 'word': 'Sylvian', 'start': 11, 'end': 18}, {'entity_group': 'ORG', 'score': np.float32(0.96721965), 'word': 'Hugging Face', 'start': 33, 'end': 45}, {'entity_group': 'LOC', 'score': np.float32(0.9846444), 'word': 'Brooklyn', 'start': 49, 'end': 57}]




### 질의 응답

In [None]:
# 질의응답(question answering) 파이프라인 생성
# 주어진 문맥(context)에서 질문(question)에 대한 답을 추출하는 사전학습된 모델 사용
question_answerer = pipeline("question-answering")

# 질문과 문맥을 입력하여 정답을 추출
result = question_answerer(
    question="Where do I work ?",  # 질문
    context="My name is Sylvian and I work at Hugging Face in Brooklyn"  # 문맥
)

print(result)

No model was supplied, defaulted to distilbert/distilbert-base-cased-distilled-squad and revision 564e9b5 (https://huggingface.co/distilbert/distilbert-base-cased-distilled-squad).
Using a pipeline without specifying a model name and revision in production is not recommended.


config.json:   0%|          | 0.00/473 [00:00<?, ?B/s]

Xet Storage is enabled for this repo, but the 'hf_xet' package is not installed. Falling back to regular HTTP download. For better performance, install the package with: `pip install huggingface_hub[hf_xet]` or `pip install hf_xet`


model.safetensors:   0%|          | 0.00/261M [00:00<?, ?B/s]

tokenizer_config.json:   0%|          | 0.00/49.0 [00:00<?, ?B/s]

vocab.txt:   0%|          | 0.00/213k [00:00<?, ?B/s]

tokenizer.json:   0%|          | 0.00/436k [00:00<?, ?B/s]

Device set to use cuda:0


{'score': 0.7309884428977966, 'start': 33, 'end': 45, 'answer': 'Hugging Face'}


### 사전 학습된 모델을 이용한 챗봇

* `model`은 `AutoModelForSeq2SeqLM` 클래스의 인스턴스입니다. 이 클래스는 선택한 언어 모델과 상호작용할 수 있도록 해줍니다.
* `tokenizer`는 `AutoTokenizer` 클래스의 인스턴스입니다. 이 클래스는 입력 텍스트를 모델이 가장 효율적으로 이해할 수 있는 방식으로 변환해줍니다. 구체적으로는 텍스트를 "토큰(token)"으로 분해하여 모델이 처리할 수 있는 형태로 바꿔줍니다.

 `"facebook/blenderbot-400M-distill"` 모델을 사용합니다. 이 모델은 오픈소스 라이선스 하에 자유롭게 사용할 수 있으며, 속도도 비교적 빠르기 때문에 선택되었습니다.
다양한 모델과 그 기능을 더 살펴보고 싶다면 Hugging Face 웹사이트를 참고해 보세요: [Hugging Face Models](https://huggingface.co/models).

In [1]:
from transformers import AutoTokenizer, AutoModelForSeq2SeqLM

# 사용할 모델 선택: "facebook/blenderbot-400M-distill" 사용
model_name = "facebook/blenderbot-400M-distill"

# 사전학습된 시퀀스-투-시퀀스 언어 모델 불러오기
model = AutoModelForSeq2SeqLM.from_pretrained(model_name)

# 해당 모델에 맞는 토크나이저 불러오기
tokenizer = AutoTokenizer.from_pretrained(model_name)

The secret `HF_TOKEN` does not exist in your Colab secrets.
To authenticate with the Hugging Face Hub, create a token in your settings tab (https://huggingface.co/settings/tokens), set it as secret in your Google Colab and restart your session.
You will be able to reuse this secret in all of your notebooks.
Please note that authentication is recommended but still optional to access public models or datasets.


config.json:   0%|          | 0.00/1.57k [00:00<?, ?B/s]

pytorch_model.bin:   0%|          | 0.00/730M [00:00<?, ?B/s]

model.safetensors:   0%|          | 0.00/730M [00:00<?, ?B/s]

generation_config.json:   0%|          | 0.00/347 [00:00<?, ?B/s]

tokenizer_config.json:   0%|          | 0.00/1.15k [00:00<?, ?B/s]

vocab.json:   0%|          | 0.00/127k [00:00<?, ?B/s]

merges.txt:   0%|          | 0.00/62.9k [00:00<?, ?B/s]

added_tokens.json:   0%|          | 0.00/16.0 [00:00<?, ?B/s]

special_tokens_map.json:   0%|          | 0.00/772 [00:00<?, ?B/s]

tokenizer.json:   0%|          | 0.00/310k [00:00<?, ?B/s]

In [2]:
# 챗봇과 대화하는 함수 정의
def chat_with_bot(tokenizer, model):
    while True:
        # 사용자로부터 입력 받기
        input_text = input("You: ")

        # 종료 조건: 사용자가 quit, exit, bye 입력 시 대화 종료
        if input_text.lower() in ["quit", "exit", "bye"]:
            print("Chatbot: Goodbye!")
            break

        # 입력 문장을 토크나이즈하여 텐서로 변환
        inputs = tokenizer.encode(input_text, return_tensors="pt")

        # 모델로부터 응답 생성 (최대 150개의 새 토큰 생성)
        outputs = model.generate(inputs, max_new_tokens=150)

        # 생성된 응답을 디코딩하여 사람이 읽을 수 있는 문자열로 변환
        response = tokenizer.decode(outputs[0], skip_special_tokens=True).strip()

        # 챗봇의 응답 출력
        print("Chatbot:", response)

# 대화 시작
chat_with_bot(tokenizer, model)

You: good morning
Chatbot: Good morning! How are you? I just got back from a long day of work.
You: quit
Chatbot: Goodbye!


In [3]:
from transformers import AutoTokenizer, AutoModelForSeq2SeqLM

model_name = "google/flan-t5-base"
tokenizer = AutoTokenizer.from_pretrained(model_name)
model = AutoModelForSeq2SeqLM.from_pretrained(model_name)

tokenizer_config.json:   0%|          | 0.00/2.54k [00:00<?, ?B/s]

Xet Storage is enabled for this repo, but the 'hf_xet' package is not installed. Falling back to regular HTTP download. For better performance, install the package with: `pip install huggingface_hub[hf_xet]` or `pip install hf_xet`


spiece.model:   0%|          | 0.00/792k [00:00<?, ?B/s]

tokenizer.json:   0%|          | 0.00/2.42M [00:00<?, ?B/s]

special_tokens_map.json:   0%|          | 0.00/2.20k [00:00<?, ?B/s]

config.json:   0%|          | 0.00/1.40k [00:00<?, ?B/s]

Xet Storage is enabled for this repo, but the 'hf_xet' package is not installed. Falling back to regular HTTP download. For better performance, install the package with: `pip install huggingface_hub[hf_xet]` or `pip install hf_xet`


model.safetensors:   0%|          | 0.00/990M [00:00<?, ?B/s]

generation_config.json:   0%|          | 0.00/147 [00:00<?, ?B/s]

In [4]:
# 대화 시작
chat_with_bot(tokenizer, model)

You: hi there
Chatbot: hey there
You: quit
Chatbot: Goodbye!
