<a href="https://colab.research.google.com/github/k4west/huggingface/blob/main/bacon_w5_nlp_with_transformers_intro.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Transformer 모델과 🤗Transformers 소개

### 🤗로 시작하는 AI 스터디 Week 5

학습범위: 트랜스포머를 활용한 자연어 처리 Chapter 1

발표자: 임태하

*발표자료와 실습자료를 이 문서로 통합



## Section 1: HuggingFace 근황

### 지난달 약 6조원 기업가치 평가 받고 시리즈D 펀딩 3100억원 유치 성공한 허깅페이스

[기사](https://www.forbes.com/sites/alexkonrad/2023/07/13/ai-startup-hugging-face-raising-funds-4-billion-valuation/?sh=4dd35ca47f7a)

<img src='https://huggingface.co/datasets/huggingface/brand-assets/resolve/main/hf-logo-with-title.png' width='400px'>

- 머신러닝을 위한 깃허브 -> HuggingFace Hub
- 머신러닝 라이브러리 -> Transformers, Datasets, etc.
- 머신러닝 학습/호스팅 솔루션 -> AutoTrain, Inference Endpoints, Entreprise Hub


In [None]:
# 실습을 하려면 아래 코드를 실행해야 합니다!
!git clone https://github.com/nlp-with-transformers/notebooks.git
%cd notebooks
from install import *
install_requirements()

Cloning into 'notebooks'...
remote: Enumerating objects: 526, done.[K
remote: Counting objects: 100% (173/173), done.[K
remote: Compressing objects: 100% (46/46), done.[K
remote: Total 526 (delta 143), reused 136 (delta 127), pack-reused 353[K
Receiving objects: 100% (526/526), 28.62 MiB | 14.58 MiB/s, done.
Resolving deltas: 100% (250/250), done.
/content/notebooks
⏳ Installing base requirements ...
✅ Base requirements installed!
⏳ Installing Git LFS ...
✅ Git LFS installed!


In [None]:
#hide
from utils import *
setup_chapter()

No GPU was detected! This notebook can be *very* slow without a GPU 🐢
Go to Runtime > Change runtime type and select a GPU hardware accelerator.
Using transformers v4.16.2
Using datasets v1.16.1


## Section 2: ⏰ Transformer 모델의 등장 배경과 타임라인 (1980-2023)



#### 1. 시퀀스 모델링의 초기 단계: RNN

- **1980년대~1990년대**: Recurrent Neural Networks (RNN) 등장

  각 시간 단계에서의 입력과 이전 상태를 고려해 현재 상태를 계산

<img alt="rnn" caption="Unrolling an RNN in time." src="https://github.com/nlp-with-transformers/notebooks/blob/main/images/chapter01_rnn.png?raw=1" id="rnn" width="600px"/>

- **문제점**:
    - Long-range dependencies 처리 어려움 - 시퀸스 길어지면 바보됨
    - Gradient vanishing/exploding 문제 - 역전파 과정에서 발생
    - 순차적인 연산으로 인한 병렬 처리 불가능

#### 2. LSTM과 GRU: RNN의 개선

- **1997년**: LSTM(Long Short-Term Memory) 알고리즘 발표

  이전 상태와 현재 입력 외에도, '게이트'라고 불리는 여러 조건을 이용하여 어떤 정보를 잊을지, 어떤 정보를 저장할지, 어떤 정보를 출력할지 결정

- **2000년대 중반**: GRU(Gated Recurrent Units) 등장

  '게이트'의 개수가 줄어들고, 일부 내부 상태가 통합됨

<img alt="rnn-lstm-gru" src="https://miro.medium.com/v2/resize:fit:1194/1*B0q2ZLsUUw31eEImeVf3PQ.png" id="rnn-lstm-gru" width="800px"/>

- **문제점**:
    - 복잡한 구조와 많은 파라미터
    - 여전히 순차적 연산 필요

#### 3. Attention Mechanism의 도입

- **2014년**: Sequence to Sequence 모델과 Attention Mechanism 소개
- **2015년**: Neural Machine Translation에서 Attention 활용

- **장점**:
    - Long-range dependencies를 잘 처리
    - 더욱 풍부한 문맥 정보
- **문제점**:
    - 주로 RNN이나 LSTM과 결합해 사용

#### 4. Convolutional Sequence Models

- **2016년**: Convolutional Neural Networks (CNN)를 활용한 Sequence 모델 발표

<img src="https://www.researchgate.net/publication/332463886/figure/fig23/AS:750926574927874@1556046255189/Convolutional-neural-network-CNN-architecture-for-text-classification.png" width="400px"/>


- **장점**:
    - 병렬 처리 가능
    - 계산 효율성
- **문제점**:
    - Local receptive fields로 인한 long-range dependencies 처리 한계

#### 5. Transformer의 등장

- **2017년**: "Attention Is All You Need" 논문 발표

<img src="https://www.researchgate.net/publication/357410305/figure/fig1/AS:11431281110736007@1672715425555/Transformer-model-architecture-this-figures-left-and-right-halves-sketch-how-the.png" width="400px"/>


- **장점**:
    - Encoder-Decoder 구조
    - Multi-Head Attention
    - 전체 시퀀스를 한 번에 처리 (병렬 처리)
    - RNN과 LSTM 없이도 효율적인 Sequence Modeling 가능
- **혁신**:
    - Positional Encoding으로 순서 정보 포착

#### 6. Transformer의 확산과 응용

- **2018년**: BERT (Bidirectional Encoder Representations from Transformers) 발표
- **2018년**: GPT (Generative Pre-trained Transformer) 발표
- **2019년**: Transformer-XL, GPT-2 등 다양한 변형 모델 등장

<img alt="transformer-timeline" caption="The transformers timeline" src="https://github.com/nlp-with-transformers/notebooks/blob/main/images/chapter01_timeline.png?raw=1" id="transformer-timeline" width="800px"/>

- **응용 분야**:
    - 자연어 처리
    - 이미지 처리
    - 강화 학습

#### 7. 최신 동향

- **2020년~2021년**: Vision Transformer (ViT), GPT-3, CLIP 등 다양한 분야에서 활용
- **2022년-현재**: ChatGPT(GPT-3.5-turbo), GPT-4 등 뛰어난 성능과 사용성과 범용성이 높은 모델 상용화 성공, 다양한 오픈소스 LLMs 등장

<img src="https://miro.medium.com/v2/resize:fit:1170/0*ju6HL-mRkTA9i2T-" width="800px"/>


- **미래 연구**:
    - Efficient Transformer, Sparse Attention 등
    - 모델의 해석 가능성과 윤리적 문제
    - Private LLM

## Section 3: ✨ Transformer 모델에 대하여




### 인코더-디코더 프레임워크

기본적인 인코더-디코더 구조는 RNN을 사용한 기본적인 인코더-디코더 아키텍처로 인코더는 입력 시퀀스를 컨텍스트 벡터로 변환하고, 디코더는 이를 출력 시퀀스로 변환함

<img alt="enc-dec" caption="Encoder-decoder architecture with a pair of RNNs. In general, there are many more recurrent layers than those shown." src="https://github.com/nlp-with-transformers/notebooks/blob/main/images/chapter01_enc-dec.png?raw=1" id="enc-dec" width="600px"/>

한 쌍의 RNN으로 구성된 인코더-디코더 구조

- 인코더 블록: 입력 시퀀스를 고차원 '컨텍스트 벡터'로 변환
- 디코더 블록: 컨텍스트 벡터를 출력 시퀀스로 해석
- 연결: 인코더의 최종 상태 → 디코더의 초기 상태
- 응용 분야: 텍스트 번역, 챗봇, 이미지 캡셔닝, 음성 인식 등

참고:
- 인코더와 디코더는 RNN, LSTM, GRU, Transformer 등 다양한 모델로 구성 가능
- 고차원 컨텍스트 벡터를 통한 복잡한 문제 해결 가능

### 어탠션 메커니즘

긴 시퀀스의 정보를 하나의 고정된 크기의 벡터에 압축해야 하는 인코더-디코더 구조의 한계를 해결하기 위해 어텐션 메커니즘이 도입됨   

<img alt="enc-dec-attn" caption="Encoder-decoder architecture with an attention mechanism for a pair of RNNs." src="https://github.com/nlp-with-transformers/notebooks/blob/main/images/chapter01_enc-dec-attn.png?raw=1" id="enc-dec-attn" width="700px"/>

한 쌍의 RNN과 어텐션 메커니즘으로 구성된 인코더-디코더 구조

### 트랜스포머 모델 아키텍처

위 아이디어들을 결합하고 확장하여 만든 것이 트랜스포머 아키텍처

<img alt="transformer-self-attn" caption="Encoder-decoder architecture of the original Transformer." src="https://github.com/nlp-with-transformers/notebooks/blob/main/images/chapter01_self-attention.png?raw=1" id="transformer-self-attn" width="700px"/>

원본 트랜스포머의 인코더-디코더 구조

- 셀프 어텐션
- 레이어의 구성
- 병렬 처리의 이점

### 전이 학습

<img alt="transfer-learning" caption="Comparison of traditional supervised learning (left) and transfer learning (right)." src="https://github.com/nlp-with-transformers/notebooks/blob/main/images/chapter01_transfer-learning.png?raw=1" id="transfer-learning" width="700px"/>  


- 기존 학습 방법: 각 작업마다 모델을 처음부터 새로 학습
- 전이 학습: 미리 학습된 모델을 특정 작업에 빠르고 효율적으로 적용
- 중요성: 데이터나 학습 자원이 제한된 상황에서 유용
- 전이 학습 단계:
  1. 사전 학습 (Pre-training)
  2. 미세조정 (Fine-tuning)

추가 설명
- 전이 학습은 트랜스포머 아키텍처에도 적용되며, 예를 들어 BERT와 GPT는 대규모 데이터셋에서 미리 학습됨



트랜스포머를 아우르는 핵심 개념 3가지 정리:

1. **인코더-디코더 프레임워크** (구조적 유연성)

  주로 시퀀스-투-시퀀스 (sequence-to-sequence) 문제를 해결하는 데 사용되는 구조
  
  예를 들어, 기계 번역에서는 한 언어의 문장(인코더의 입력)을 다른 언어의 문장(디코더의 출력)으로 변환하는 작업을 수행함

  - 인코더: 입력 시퀀스를 고차원의 연속적인 표현으로 변환합니다. 이 표현은 문맥과 의미 정보를 담고 있습니다.
  - 디코더: 인코더의 출력을 받아 목표 시퀀스를 생성합니다. 이 과정에서도 문맥과 의미 정보가 반영됩니다.

2. **어탠션 메커니즘** (높은 문맥 이해 능력)

  시퀀스 내의 각 단어나 토큰이 다른 단어나 토큰에 얼마나 '집중'해야 하는지를 학습함
  
  이를 통해 모델은 문장 내의 중요한 부분에 더 많은 주의를 기울이고, 복잡한 의존성과 문맥을 더 잘 이해할 수 있음

  - Multi-Head Attention: 트랜스포머는 여러 개의 어텐션 '헤드'를 사용해 다양한 부분에 동시에 주목할 수 있음
  - Self-Attention: 같은 시퀀스 내의 단어들 사이의 관계를 학습하기 위해 사용되며, 인코더와 디코더 양쪽에서 활용됨

3. **전이 학습** (효율성 및 범용성)

  사전에 큰 데이터셋으로 학습된 후, 특정 작업에 맞게 미세 조정(fine-tuning)이 가능함
  
  이를 전이 학습이라고 하며, 적은 양의 데이터로도 높은 성능을 달성할 수 있음

  - 범용성: 한 번 학습된 트랜스포머 모델은 자연어 처리뿐만 아니라 이미지 처리, 강화 학습 등 다양한 분야에서도 활용할 수 있습니다.
  - 효율성: 전이 학습을 통해 적은 계산 리소스와 시간으로도 특정 작업에 뛰어난 성능을 보일 수 있습니다.

## Section 4: 📌 Hugging Face의 Transformers 라이브러리

Transformers 라이브러리는 ML 모델 사용을 쉽게 만드는 도구로 다음과 같은 문제를 해결하기 위해 만들어졌습니다:

### 문제 1: 💡 복잡한 모델, 어려운 사용 😓
- 복잡한 모델 😵
- 고성능 컴퓨터 필요 💻💨
- 전문 지식 필요 🎓

ex) https://github.com/google-research/bert


### 문제 2: 🤷‍♀️ 다들 각자 방식대로 🔄
- 코드와 모델의 표준화가 부족 😞
- 다른 사람의 연구나 코드를 적용하기 어려워 재사용 못함 🤯

### 해결책: HuggingFace의 Transformers 라이브러리
- 통일된 API 🛠️
- Pre-trained 모델을 쉽게 사용 👍
- 사용자 친화적 🤗

### ⚠️ 조심조심

Hugging Face에서 제공하는 모델과 데이터셋은 대체로 Google Colab에서 사용할 수 있지만 유의해야 할 사항들이 있어요.

#### Colab에서 사용시 제약조건:

1. **메모리 제한**: Colab은 무료 버전에서는 제한된 양의 RAM을 제공함
   
2. **시간 제한**: Colab 세션은 일정 시간이 지나면 종료됨

3. **접근 제한**: Hugging Face에서는 대부분의 모델과 데이터셋을 무료로 제공하나, 일부는 라이센스에 따라 상업적 이용 불가

#### 또 초보자가 조심해야 할 사항:

1. **모델 크기와 메모리**: 사용하려는 모델의 크기를 먼저 확인하고, 이가 Colab의 메모리 제한 내에 들어가는지 확인!

2. **코드의 안정성**: Hugging Face 라이브러리는 주기적으로 업데이트되어 호환성 문제가 생길 수 있음

3. **데이터 처리**: Hugging Face의 Datasets 라이브러리는 매우 다양한 데이터셋을 제공하지만 전처리가 필요할 수 있음

이외에도, 윤리적 고려사항, 데이터의 저작권 문제 등 고려함


### Pipeline 클래스 소개
1. Transformers 라이브러리에 있는 다양한 클래스 중 하나로 추론(inference=prediction)을 위해 모델을 사용하는 가장 쉬운 방법
2. 라이브러리의 복잡한 코드 대부분을 추상화하는 객체로, 개체 인식(NER), 마스크된 언어 모델링, 감정 분석, 특징 추출, 질문 답변 등 여러 Task에 사용되는 간단한 API를 제공 (음성이나 이미지 관련 Task도 있음)
3. `pipeline()`은 사용 가능한 다른 모든 파이프라인을 감싸는 래퍼 역할
4. 이렇게 추상화된 파이프라인은 사실 다음과 같이 구성되어 있음:
  - 원본 텍스트 입력을 토큰에 매핑하는 역할을 담당하는 `Tokenizer`
  - 입력으로부터 예측을 수행하는 `model`
  - 모델의 출력을 향상시키기 위한 일부(선택 사항) 후처리 클래스들

하나의 항목(예시에서는 텍스트 분류)에 대한 간단한 호출:

In [None]:
# ⚠️ 이 코드는 설명을 위해 가져온 코드이니 실행시키지 마세요!!! ⚠️
pipe = pipeline("text-classification")
pipe("This restaurant is awesome")

[{'label': 'POSITIVE', 'score': 0.9998743534088135}]

HuggingFace 허브에서 특정 모델을 사용할 수도 있는데, 이때 수행할 Task가 이미 정의되어 있는 모델의 경우 Task 정의를 무시할 수 있음:

In [None]:
# ⚠️ 이 코드는 설명을 위해 가져온 코드이니 실행시키지 마세요!!! ⚠️
pipe = pipeline(model="roberta-large-mnli")
pipe("This restaurant is awesome")

Downloading:   0%|          | 0.00/1.88k [00:00<?, ?B/s]

Downloading:   0%|          | 0.00/688 [00:00<?, ?B/s]

Downloading:   0%|          | 0.00/1.33G [00:00<?, ?B/s]

Downloading:   0%|          | 0.00/878k [00:00<?, ?B/s]

Downloading:   0%|          | 0.00/446k [00:00<?, ?B/s]

Downloading:   0%|          | 0.00/1.29M [00:00<?, ?B/s]

[{'label': 'NEUTRAL', 'score': 0.7313134074211121}]

많은 항목에서 파이프라인을 호출하려면 list를 사용하여 호출:

In [None]:
# ⚠️ 이 코드는 설명을 위해 가져온 코드이니 실행시키지 마세요!!! ⚠️
pipe = pipeline("text-classification")
pipe(["This restaurant is awesome", "This restaurant is awful"])

[{'label': 'POSITIVE', 'score': 0.9998743534088135},
 {'label': 'NEGATIVE', 'score': 0.9996669292449951}]

- `🤗 transformers`: 사전 학습된 최신 모델을 쉽게 다운로드하고 학습할 수 있는 API와 도구를 제공하는 라이브러리
  - [transformers 라이브러리에서 제공하는 모델들(feat. Pytorch를 배울 것)](https://huggingface.co/docs/transformers/index#supported-models)

- `🤗 datasets`:오디오, 컴퓨터 비전 및 자연어 처리(NLP) 작업을 위한 데이터 세트에 쉽게 액세스하고 공유할 수 있는 라이브러리

데이터셋으로 추론하기 위해 HuggingFace에서 제안하는 방법은 🤗 datasets를 사용하는 것임
- 전체 데이터세트를 한 번에 할당할 필요도 없고 직접 일괄 처리를 수행할 필요도 없어 GPU에서 사용자 정의 루프만큼 빠르게 작동함

In [None]:
# ⚠️ 이 코드는 설명을 위해 가져온 코드이니 실행시키지 마세요!!! ⚠️
import datasets
from transformers import pipeline
from transformers.pipelines.pt_utils import KeyDataset
from tqdm.auto import tqdm

pipe = pipeline("automatic-speech-recognition", model="facebook/wav2vec2-base-960h", device=0)
dataset = datasets.load_dataset("superb", name="asr", split="test")

# KeyDataset (only *pt*) will simply return the item in the dict returned by the dataset item
# as we're not interested in the *target* part of the dataset. For sentence pair use KeyPairDataset
for out in tqdm(pipe(KeyDataset(dataset, "file"))):
    print(out)
    # {"text": "NUMBER TEN FRESH NELLY IS WAITING ON YOU GOOD NIGHT HUSBAND"}
    # {"text": ....}
    # ....


`tqdm`은 파이썬 모듈 중 하나로 반복문에서 진행률을 시각적으로 표현하고 시간 정보를 확인하기 위해 사용함
- [tqdm's output explanation](https://stackoverflow.com/questions/52777424/explanation-of-output-of-python-tqdm)


In [None]:
# ⚠️ 이 코드는 설명을 위해 가져온 코드이니 실행시키지 마세요!!! ⚠️
from transformers import pipeline, AutoModelForTokenClassification, AutoTokenizer

# Sentiment analysis pipeline
analyzer = pipeline("sentiment-analysis")

# Question answering pipeline, specifying the checkpoint identifier
oracle = pipeline(
    "question-answering", model="distilbert-base-cased-distilled-squad", tokenizer="bert-base-cased"
)

# Named entity recognition pipeline, passing in a specific model and tokenizer
model = AutoModelForTokenClassification.from_pretrained("dbmdz/bert-large-cased-finetuned-conll03-english")
tokenizer = AutoTokenizer.from_pretrained("bert-base-cased")
recognizer = pipeline("ner", model=model, tokenizer=tokenizer)

## Section 5: 🖐️ Transformer 애플리케이션 실습

In [None]:
text = """Dear Amazon, last week I ordered an Optimus Prime action figure \
from your online store in Germany. Unfortunately, when I opened the package, \
I discovered to my horror that I had been sent an action figure of Megatron \
instead! As a lifelong enemy of the Decepticons, I hope you can understand my \
dilemma. To resolve the issue, I demand an exchange of Megatron for the \
Optimus Prime figure I ordered. Enclosed are copies of my records concerning \
this purchase. I expect to hear from you soon. Sincerely, Bumblebee."""

### 1) Text Classification 텍스트 분류

In [None]:
#hide_output
from transformers import pipeline

classifier = pipeline("text-classification")

Downloading:   0%|          | 0.00/629 [00:00<?, ?B/s]

Downloading:   0%|          | 0.00/255M [00:00<?, ?B/s]

Downloading:   0%|          | 0.00/48.0 [00:00<?, ?B/s]

Downloading:   0%|          | 0.00/226k [00:00<?, ?B/s]

In [None]:
import pandas as pd

outputs = classifier(text)
pd.DataFrame(outputs)

Unnamed: 0,label,score
0,NEGATIVE,0.901546


### 2) Named Entity Recognition 명명된 개체 인식

In [None]:
ner_tagger = pipeline("ner", aggregation_strategy="simple")
outputs = ner_tagger(text)
pd.DataFrame(outputs)

Unnamed: 0,entity_group,score,word,start,end
0,ORG,0.87901,Amazon,5,11
1,MISC,0.990859,Optimus Prime,36,49
2,LOC,0.999755,Germany,90,97
3,MISC,0.556571,Mega,208,212
4,PER,0.590256,##tron,212,216
5,ORG,0.669692,Decept,253,259
6,MISC,0.498349,##icons,259,264
7,MISC,0.775362,Megatron,350,358
8,MISC,0.987854,Optimus Prime,367,380
9,PER,0.812096,Bumblebee,502,511


### 3) Question Answering 질문 답변

In [None]:
reader = pipeline("question-answering")
question = "What does the customer want?"
outputs = reader(question=question, context=text)
pd.DataFrame([outputs])

Downloading:   0%|          | 0.00/473 [00:00<?, ?B/s]

Downloading:   0%|          | 0.00/249M [00:00<?, ?B/s]

Downloading:   0%|          | 0.00/29.0 [00:00<?, ?B/s]

Downloading:   0%|          | 0.00/208k [00:00<?, ?B/s]

Downloading:   0%|          | 0.00/426k [00:00<?, ?B/s]

Unnamed: 0,score,start,end,answer
0,0.631292,335,358,an exchange of Megatron


### 4) Summarization 요약

In [None]:
summarizer = pipeline("summarization")
outputs = summarizer(text, max_length=45, clean_up_tokenization_spaces=True)
print(outputs[0]['summary_text'])

Downloading:   0%|          | 0.00/1.76k [00:00<?, ?B/s]

Downloading:   0%|          | 0.00/1.14G [00:00<?, ?B/s]

Downloading:   0%|          | 0.00/26.0 [00:00<?, ?B/s]

Downloading:   0%|          | 0.00/878k [00:00<?, ?B/s]

Downloading:   0%|          | 0.00/446k [00:00<?, ?B/s]

 Bumblebee ordered an Optimus Prime action figure from your online store in
Germany. Unfortunately, when I opened the package, I discovered to my horror
that I had been sent an action figure of Megatron instead.


### 5) Translation 번역

In [None]:
translator = pipeline("translation_en_to_de",
                      model="Helsinki-NLP/opus-mt-en-de")
outputs = translator(text, clean_up_tokenization_spaces=True, min_length=100)
print(outputs[0]['translation_text'])

Sehr geehrter Amazon, letzte Woche habe ich eine Optimus Prime Action Figur aus
Ihrem Online-Shop in Deutschland bestellt. Leider, als ich das Paket öffnete,
entdeckte ich zu meinem Entsetzen, dass ich stattdessen eine Action Figur von
Megatron geschickt worden war! Als lebenslanger Feind der Decepticons, Ich
hoffe, Sie können mein Dilemma verstehen. Um das Problem zu lösen, Ich fordere
einen Austausch von Megatron für die Optimus Prime Figur habe ich bestellt.
Anbei sind Kopien meiner Aufzeichnungen über diesen Kauf. Ich erwarte, bald von
Ihnen zu hören. Aufrichtig, Bumblebee.


### 6) Text Generation 텍스트 생성

In [None]:
#hide
from transformers import set_seed
set_seed(42) # 재현 가능한 결과를 얻기 위해 특정 작업에서는 이처럼 시드를 설정하기도 합니다!

In [None]:
generator = pipeline("text-generation")
response = "Dear Bumblebee, I am sorry to hear that your order was mixed up."
prompt = text + "\n\nCustomer service response:\n" + response
outputs = generator(prompt, max_length=200)
print(outputs[0]['generated_text'])

Dear Amazon, last week I ordered an Optimus Prime action figure from your online
store in Germany. Unfortunately, when I opened the package, I discovered to my
horror that I had been sent an action figure of Megatron instead! As a lifelong
enemy of the Decepticons, I hope you can understand my dilemma. To resolve the
issue, I demand an exchange of Megatron for the Optimus Prime figure I ordered.
Enclosed are copies of my records concerning this purchase. I expect to hear
from you soon. Sincerely, Bumblebee.

Customer service response:
Dear Bumblebee, I am sorry to hear that your order was mixed up. The order was
completely mislabeled, which is very common in our online store, but I can
appreciate it because it was my understanding from this site and our customer
service of the previous day that your order was not made correct in our mind and
that we are in a process of resolving this matter. We can assure you that your
order


## Section 6: 🤗 허깅페이스 생태계 - 허브와 라이브러리 +@ 솔루션

<img alt="ecosystem" width="500" caption="An overview of the Hugging Face ecosystem of libraries and the Hub." src="https://github.com/nlp-with-transformers/notebooks/blob/main/images/chapter01_hf-ecosystem.png?raw=1" id="ecosystem"/>


- Transformers: 다양한 언어 및 이미지 모델 지원 (예: BERT, GPT-2)
- Tokenizers: 빠르고 효율적인 텍스트 토크나이징
- Datasets: 큰 데이터셋 효율적 로딩 & 전처리
- Accelerate: CPU, GPU, TPU 스케일링 지원


### [The Hugging Face Hub](https://huggingface.co/)


<img alt="hub-overview" width="1000" caption="The models page of the Hugging Face Hub, showing filters on the left and a list of models on the right." src="https://github.com/nlp-with-transformers/notebooks/blob/main/images/chapter01_hub-overview.png?raw=1" id="hub-overview"/>

<img alt="hub-model-card" width="1000" caption="A example model card from the Hugging Face Hub. The inference widget is shown on the right, where you can interact with the model." src="https://github.com/nlp-with-transformers/notebooks/blob/main/images/chapter01_hub-model-card.png?raw=1" id="hub-model-card"/>