In [1]:
!pip install ratsnlp

Collecting ratsnlp
  Downloading ratsnlp-1.0.53-py3-none-any.whl (42 kB)
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m42.2/42.2 kB[0m [31m1.9 MB/s[0m eta [36m0:00:00[0m
[?25hCollecting pytorch-lightning==1.6.1 (from ratsnlp)
  Downloading pytorch_lightning-1.6.1-py3-none-any.whl (582 kB)
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m582.5/582.5 kB[0m [31m9.5 MB/s[0m eta [36m0:00:00[0m
[?25hCollecting transformers==4.28.1 (from ratsnlp)
  Downloading transformers-4.28.1-py3-none-any.whl (7.0 MB)
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m7.0/7.0 MB[0m [31m32.0 MB/s[0m eta [36m0:00:00[0m
[?25hCollecting Korpora>=0.2.0 (from ratsnlp)
  Downloading Korpora-0.2.0-py3-none-any.whl (57 kB)
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m57.8/57.8 kB[0m [31m6.9 MB/s[0m eta [36m0:00:00[0m
Collecting flask-ngrok>=0.0.25 (from ratsnlp)
  Downloading flask_ngrok-0.0.25-py3-none-any.whl (3.1 kB)
Collect

# 구글 드라이브 연동하기
모델 체크포인트 등을 저장해 둘 구글 드라이브를 연결합니다. 자신의 구글 계정에 적용됩니다.

In [1]:
from google.colab import drive
drive.mount('/gdrive', force_remount=True)

Mounted at /gdrive


# 각종 설정
모델 하이퍼파라메터(hyperparameter)와 저장 위치 등 설정 정보를 선언

인자(argument)의 역할과 내용
- pretrained_model_name : 파인튜닝한 모델이 사용한 프리트레인 마친 언어모델 이름(단 해당 모델은 허깅페이스 라이브러리에 등록되어 있어야 합니다)
- downstream_model_dir : 파인튜닝한 모델의 체크포인트 저장 위치.
- max_seq_length : 토큰 기준 입력 문장 최대 길이. 아무 것도 입력하지 않으면 128입니다.

In [2]:
# 인퍼런스 설정
from ratsnlp.nlpbook.classification import ClassificationDeployArguments
args = ClassificationDeployArguments(
    pretrained_model_name="beomi/kcbert-base",
    downstream_model_dir="/gdrive/My Drive/nlpbook/checkpoint-doccls",
    max_seq_length=128,
)

downstream_model_checkpoint_fpath: /gdrive/My Drive/nlpbook/checkpoint-doccls/epoch=1-val_loss=0.28.ckpt


# 모델 로딩
파인튜닝을 마친 모델과 토크나이저를 읽어 들입니다.

- fine_tuned_model_ckpt['state_dict']: 파인튜닝된 모델의 상태를 가지고 있는 딕셔너리. 모델의 각 레이어에 대한 가중치와 bias 값들 저장
- 'model.classifier.bias': 분류기의 bias 텐서를 가져온다.이 분류기는 각 클래스에 대한 확률을 출력하며, bias 텐서 크기는 분류 클래스 수와 동일
- .shape.numel(): 텐서의 모든 원소의 개수를 반환. 이 경우에는 bias 텐서의 원소의 개수, 즉 클래스의 수를 반환


/usr/local/lib/python3.10/dist-packages/transformers/models/bert/configuration_bert.py

In [3]:
import torch
from transformers import BertConfig, BertForSequenceClassification
# 체크포인트 로드
# downstream_model_checkpoint_fpath: /gdrive/My Drive/nlpbook/checkpoint-doccls1/epoch=0-val_loss=0.27-v1.ckpt
fine_tuned_model_ckpt = torch.load(
    args.downstream_model_checkpoint_fpath,
    map_location=torch.device("cpu") # 체크포인트를 CPU 메모리에 로드
)
# 파인튜닝한 모델이 사용한 프리트레인 마친 언어모델의 설정 값들을 읽어 들일 수 있음
pretrained_model_config = BertConfig.from_pretrained(
    args.pretrained_model_name,
    # 파인튜닝된 BERT 모델의 분류기가 가지고 있는 바이어스 파라미터의 크기를 기반으로, 모델이 처리해야 할 클래스(레이블)의 총 개수를 동적으로 설정
    # 바이어스 파라미터의 총 개수는 모델이 예측해야 할 클래스의 총 개수와 직접적으로 일치합니다.
    num_labels=fine_tuned_model_ckpt['state_dict']['model.classifier.bias'].shape.numel(),
)
# 초기화한 BERT 모델에 체크포인트(fine_tuned_model_ckpt)를 읽어들이게 된다
model = BertForSequenceClassification(pretrained_model_config) # birt 모델 초기화
# 파인튜닝된 모델의 체크포인트 상태 딕셔너리를 현재 모델의 상태 딕셔너리 키 형식에 맞게 조정하여,
# 현재 모델에 파인튜닝된 가중치를 정확히 매핑하고 로드하는 데 사용
model.load_state_dict({k.replace("model.", ""): v for k, v in fine_tuned_model_ckpt['state_dict'].items()}) # 체크포인트 주입
# 모델이 평가 모드로 전환. 드롭아웃 등 학습 때만 사용하는 기법들을 무효화하는 역할을 한다.
model.eval()

The secret `HF_TOKEN` does not exist in your Colab secrets.
To authenticate with the Hugging Face Hub, create a token in your settings tab (https://huggingface.co/settings/tokens), set it as secret in your Google Colab and restart your session.
You will be able to reuse this secret in all of your notebooks.
Please note that authentication is recommended but still optional to access public models or datasets.


config.json:   0%|          | 0.00/619 [00:00<?, ?B/s]

BertForSequenceClassification(
  (bert): BertModel(
    (embeddings): BertEmbeddings(
      (word_embeddings): Embedding(30000, 768, padding_idx=0)
      (position_embeddings): Embedding(300, 768)
      (token_type_embeddings): Embedding(2, 768)
      (LayerNorm): LayerNorm((768,), eps=1e-12, elementwise_affine=True)
      (dropout): Dropout(p=0.1, inplace=False)
    )
    (encoder): BertEncoder(
      (layer): ModuleList(
        (0-11): 12 x BertLayer(
          (attention): BertAttention(
            (self): BertSelfAttention(
              (query): Linear(in_features=768, out_features=768, bias=True)
              (key): Linear(in_features=768, out_features=768, bias=True)
              (value): Linear(in_features=768, out_features=768, bias=True)
              (dropout): Dropout(p=0.1, inplace=False)
            )
            (output): BertSelfOutput(
              (dense): Linear(in_features=768, out_features=768, bias=True)
              (LayerNorm): LayerNorm((768,), eps=1e-12,

In [4]:
# 토크나이저 초기화
from transformers import BertTokenizer
tokenizer = BertTokenizer.from_pretrained(
    args.pretrained_model_name,
    do_lower_case=False,
)

vocab.txt:   0%|          | 0.00/250k [00:00<?, ?B/s]

tokenizer_config.json:   0%|          | 0.00/49.0 [00:00<?, ?B/s]

# 인퍼런스 함수 선언
- 문장(sentence)에 토큰화를 수행한 뒤 input_ids, attention_mask, token_type_ids를 만든다.
- 이들 입력값을 파이토치 텐서(tensor) 자료형으로 변환한 뒤 모델에 입력합니다. - 모델 출력 값(outputs.logits)은 소프트맥스 함수 적용 이전의 로짓(logit) 형태인데요. 여기에 소프트맥스 함수를 써서 모델 출력을 [부정일 확률, 긍정일 확률] 형태의 확률 형태로 바꾼다.
- 마지막으로 모델 출력을 약간 후처리하여 예측 확률의 최댓값이 부정 위치일 경우 해당 문장이 부정(positive), 반대의 경우 긍정(positive)이 되도록 pred 값을 만든다.

In [5]:
def inference_fn(sentence):
    inputs = tokenizer(
        [sentence],
        max_length=args.max_seq_length,
        padding="max_length",
        truncation=True,
    )
    with torch.no_grad():
        outputs = model(**{k: torch.tensor(v) for k, v in inputs.items()})
        # dim=1은 각 입력 샘플에 대해 각 클래스의 로짓을 확률로 변환하라는 의미. prob = [[0.2, 0.8]]
        prob = outputs.logits.softmax(dim=1)
        # 긍정 및 부정 클래스에 대한 확률을 계산하고, 이를 반올림하여 4자리 소수점까지 표시
        positive_prob = round(prob[0][1].item(), 4)
        negative_prob = round(prob[0][0].item(), 4)
        # 확률이 더 높은 클래스의 인데스 기반으로 최종 예측 결과(긍정 또는 부정)를 결정
        pred = "긍정 (positive)" if torch.argmax(prob) == 1 else "부정 (negative)"
    return {
        'sentence': sentence,
        'prediction': pred,
        'positive_data': f"긍정 {positive_prob}",
        'negative_data': f"부정 {negative_prob}",
        'positive_width': f"{positive_prob * 100}%",
        'negative_width': f"{round(negative_prob * 100,2)}%",
    }

In [6]:
sentence = '갈까 말까'
inference_fn(sentence)

{'sentence': '갈까 말까',
 'prediction': '부정 (negative)',
 'positive_data': '긍정 0.4293',
 'negative_data': '부정 0.5707',
 'positive_width': '42.93%',
 'negative_width': '57.07%'}

In [7]:
sentence = '3D만 아니었어도 별 다섯 개 줬을텐데.. 왜 3D로 나와서 제 심기를 불편하게 하죠??'
inference_fn(sentence)

{'sentence': '3D만 아니었어도 별 다섯 개 줬을텐데.. 왜 3D로 나와서 제 심기를 불편하게 하죠??',
 'prediction': '부정 (negative)',
 'positive_data': '긍정 0.4778',
 'negative_data': '부정 0.5222',
 'positive_width': '47.78%',
 'negative_width': '52.22%'}

In [None]:
!cp -r /gdrive/MyDrive/nlpbook/checkpoint-doccls1 /gdrive/MyDrive/kdt_231026/m7_nlp응용/data/

In [None]:
!rm -r /gdrive/MyDrive/nlpbook/checkpoint-doccls1g

## ngrok
ngrok 사이트에는 Secure tunnels to localhost이라고 설명되어 있습니다. 간단히 방화벽 넘어서 외부에서 로컬에 접속 가능하게 하는 터널 프로그램입니다. 만약 통신을 할 수 있는 프로그램을 개발했다면 서버의 역할이 필요한데 개발한 PC의 경우는 외부에서 접속가능한 상용 서버가 아니기때문에 도메인을 구입하고 서버를 호스팅 받아 연결해야 합니다. 말그대로 로컬서버죠.

ngrok은 이러한 로컬서버를 간단히 외부에서 접속가능한 환경으로 만들 수 있게 도와줍니다. 물론 이런 프로그램이 ngrok뿐인 것은 아니지만, 위에서 설명한 상황에서 유용하게 쓸 수 있게 최적화되어 있어서 아주 쉽게 사용할 수 있다.

## ngrok 설치
ngrok 사이트로 이동해서 [Get started for free]를 눌러 가입을 합니다. 이미 가입이 된 상태라면 Login을 하시면 됩니다.

# 웹서비스 만들기 준비

`ngrok`은 코랩 로컬에서 실행 중인 웹서비스를 안전하게 외부에서 접근 가능하도록 해주는 도구입니다. `ngrok`을 실행하려면 [회원가입](https://dashboard.ngrok.com/signup) 후 [로그인](https://dashboard.ngrok.com/login)을 한 뒤 [이곳](https://dashboard.ngrok.com/get-started/your-authtoken)에 접속해 인증 토큰(authtoken)을 확인해야 합니다. 예를 들어 확인된 `authtoken`이 `test111`이라면 다음과 같이 실행합니다.

```bash
!mkdir /root/.ngrok2 && echo "authtoken: test111" > /root/.ngrok2/ngrok.yml
```

 리눅스 환경에서 ngrok의 인증 토큰을 설정하는 과정을 자동화

- mkdir 명령어는 새로운 디렉토리를 생성합니다. 여기서는 /root/.ngrok2라는 이름의 디렉토리를 /root 아래에 생성합니다. ngrok는 이 디렉토리를 사용자의 인증 토큰을 저장하는 데 사용합니다.
- echo 명령어는 인자로 받은 텍스트를 출력합니다. 여기서는 인증 토큰을 포함하는 문자열 "authtoken: 29V4PgeN..."을 출력합니다.
- `>` 연산자는 왼쪽의 출력(여기서는 echo 명령어의 출력)을 오른쪽의 파일로 리디렉션합니다. 이 경우, 출력되는 인증 토큰 문자열이 /root/.ngrok2/ngrok.yml 파일로 저장됩니다.
- ngrok.yml 파일은 ngrok의 구성 파일로, 여기에 사용자의 인증 토큰과 같은 설정 정보를 저장할 수 있습니다. ngrok는 실행될 때 이 파일을 참조하여 사용자 인증을 자동으로 수행합니다.

In [8]:
!mkdir /root/.ngrok2 && echo "authtoken: 2cfYgWDdt4ctiOtnGbM6CRe4keh_3pYTCj4nqfVA6Np95psgA" > /root/.ngrok2/ngrok.yml

In [9]:
!ls /root -al

total 72
drwx------ 1 root root 4096 Feb 22 13:28 .
drwxr-xr-x 1 root root 4096 Feb 22 13:27 ..
-r-xr-xr-x 1 root root 1169 Jan  1  2000 .bashrc
drwxr-xr-x 1 root root 4096 Feb 22 13:07 .cache
drwx------ 1 root root 4096 Feb 22 13:06 .config
drwxr-xr-x 5 root root 4096 Feb 20 14:47 .ipython
drwx------ 1 root root 4096 Feb 20 14:47 .jupyter
drwxr-xr-x 2 root root 4096 Feb 22 12:51 .keras
drwx------ 3 root root 4096 Feb 20 14:20 .launchpadlib
drwxr-xr-x 1 root root 4096 Feb 20 14:47 .local
drwxr-xr-x 2 root root 4096 Feb 22 13:28 .ngrok2
drwxr-xr-x 4 root root 4096 Feb 20 14:47 .npm
-rw-r--r-- 1 root root  161 Jul  9  2019 .profile
-r-xr-xr-x 1 root root  254 Jan  1  2000 .tmux.conf
-rw-r--r-- 1 root root  165 Feb 20 14:47 .wget-hsts


# 웹서비스 개시
아래처럼 실행해 인퍼런스 함수를 웹서비스로 만듭니다.

get_web_service_app 모듈

https://github.com/ratsgo/ratsnlp/blob/master/ratsnlp/nlpbook/classification/deploy.py

In [10]:
from flask import Flask, request, jsonify, render_template


def get_web_service_app(inference_fn, is_colab=True):
    # Flask 애플리케이션 인스턴스를 생성
    app = Flask(__name__, template_folder='')
    #  Colab 환경에서도 외부에서 접근 가능한 웹 서비스를 구현
    if is_colab:
        from flask_ngrok import run_with_ngrok
        run_with_ngrok(app)
    else:
        from flask_cors import CORS
        CORS(app)
    # 루트 URL ('/')에 대한 요청을 처리하는 뷰 함수입니다. 이 함수는 'index.html' 템플릿을 렌더링하여 반환
    @app.route('/')
    def index():
        return render_template('index.html')
    # '/api' 경로에 대한 POST 요청을 처리하는 API 뷰 함수
    @app.route('/api', methods=['POST'])
    def api():
        query_sentence = request.json # 클라이언트로부터 받은 JSON 데이터를 파싱
        # 추론 함수를 호출하여 입력 데이터에 대한 추론을 수행하고, 결과를 output_data에 저장
        output_data = inference_fn(query_sentence)
        response = jsonify(output_data) # 추론 결과를 JSON 형태로 변환하여 응답 객체를 생성
        return response

    return app

In [11]:
from ratsnlp.nlpbook.classification import get_web_service_app
app = get_web_service_app(inference_fn)
app.run()

 * Serving Flask app 'ratsnlp.nlpbook.classification.deploy'
 * Debug mode: off


 * Running on http://127.0.0.1:5000
INFO:werkzeug:[33mPress CTRL+C to quit[0m
Exception in thread Thread-12:
Traceback (most recent call last):
  File "/usr/local/lib/python3.10/dist-packages/urllib3/connection.py", line 203, in _new_conn
    sock = connection.create_connection(
  File "/usr/local/lib/python3.10/dist-packages/urllib3/util/connection.py", line 85, in create_connection
    raise err
  File "/usr/local/lib/python3.10/dist-packages/urllib3/util/connection.py", line 73, in create_connection
    sock.connect(sa)
ConnectionRefusedError: [Errno 111] Connection refused

The above exception was the direct cause of the following exception:

Traceback (most recent call last):
  File "/usr/local/lib/python3.10/dist-packages/urllib3/connectionpool.py", line 791, in urlopen
    response = self._make_request(
  File "/usr/local/lib/python3.10/dist-packages/urllib3/connectionpool.py", line 497, in _make_request
    conn.request(
  File "/usr/local/lib/python3.10/dist-packages/urllib3