## 언어모델 제어하기

#### top_p

temperature가 확률분포를 조정하는 매개변수라면, top_p는 확률분포 내에서 선택할 단어의 범위를 결정하는 매개변수입니다. top_p는 확률 역순으로 단어를 정렬한 후, 그 순서대로 단어를 선택해 가다가 누적 확률이 top_p에 도달하는 순간 선택을 멈추는 방식으로 동작합니다. 예를 들어 temperature=0.25, top_p=0.6으로 설정했다면 다음 그래프처럼 “오른다”와 “간다”를 누적하는 순간 0.6에 도달합니다. 따라서 “왔다” 이후의 단어들은 선택에서 제외됩니다.

<center>
<img src='https://wikidocs.net/images/page/229816/%EC%8A%A4%ED%81%AC%EB%A6%B0%EC%83%B7_2024-02-04_093948.png' /><br>
</center>

이렇게 선택된 두 개의 단어는 다음의 확률분포로 다시 만들어집니다.

- “오른다” : 0.46 / (0.46 + 0.25) = 0.648

- “간다” : 0.25 / (0.46 + 0.25) = 0.352

그리고 이 두 개의 확률분포를 바탕으로 언어모델은 최종 문장을 만듭니다. 다음은 이러한 상황을 가정하고 100회 실시한 결과입니다.


probs = [0.46, 0.25]
probs = list(map(lambda x : round(x / sum(probs),3), probs)) #[0.648, 0.352]
context = "나는 내일 산에 "
word_occurrences = count_word_occurrences(context, ["오른다","간다"], probs, 100)
word_occurrences =  {k: v for k, v in sorted(word_occurrences.items(), key=lambda item: item[1], reverse=True)}

word_occurrences <br/>
{'나는 내일 산에 오른다': 67, '나는 내일 산에 간다': 33}

만일, top_p=0으로 설정한다면 확률분포 중 가장 높은 확률의 단어만 선택하게 되므로 temperature와 관계 없이 항상 일관된 답변을 기대할 수 있습니다.

In [1]:
import google.generativeai as genai

genai.configure(api_key="AIzaSyD0jMkUWWxa6O1qpGjMIz80zOVxM4KoyKU")
model = genai.GenerativeModel('gemini-pro')
user_message = "겨울에 대한 짧은 시를 20자 이내로 지으세요."

print("\ntop_p=0:")
generation_config = genai.GenerationConfig(top_p=0)
for _ in range(3):
    response = model.generate_content(user_message , generation_config=generation_config)
    print(f'{"="*50}\n{response.text}')

print("\ntop_p=1:")
generation_config = genai.GenerationConfig(top_p=1)
for _ in range(3):
    response = model.generate_content(user_message , generation_config=generation_config)
    print(f'{"="*50}\n{response.text}')

  from .autonotebook import tqdm as notebook_tqdm



top_p=0:
눈 내리고, 추위 몰아치고,
겨울의 품에 안겨.
눈 내리고, 추위 몰아치고,
겨울의 품에 안겨.
눈 내리고, 추위 몰아치고,
겨울의 품에 안겨.

top_p=1:
눈꽃 흩날리네
땅이 흰 옷 입었네
겨울이 왔네
흰 눈 내리는,
나뭇가지 우거진 겨울,
고요한 침묵.
백설이 쌓인 땅
추위가 물든 바람


top_p=0으로 설정하고 수행했을 때 기대했던 대로 3번 모두 동일한 결과가 출력되었습니다. 거기에 더해 temperature=0 일때와 동일한 내용의 시를 쓴 것을 확인할 수 있습니다. 이에 비해 top_p=1로 설정하고 수행했을 때는, temperature=0으로 설정했을 때와 마찬가지로, 매번 다른 내용의 시를 쓴 것을 확인할 수 있습니다.

알아두기=============================================<br/>
temperature=0이나 top_p=0으로 설정했다고 해서 매번 완전히 동일한 결과만 생성하는 것은 아닙니다. 거대언어모델은 클라우드 환경에서 여러 노드의 리소스를 병렬적으로 사용하는 방식으로 수많은 연산을 수행할 뿐만 아니라, 확률분포에 동일한 확률값을 갖는 단어들도 나타날 수 있으므로 항상 같은 결과를 보장하기는 어렵습니다.


#### top_k

top_p를 이해했다면, top_k를 이해하기는 매우 쉽습니다. top_p가 누적 확률을 기준으로 선택할 단어의 범위를 결정한다면, top_k는 그 기준이 누적 건수라는 점만 다르기 때문입니다. 가령 다음과 같이 temperature=0.25, top_k=2로 설정했다면 “오른다”와 “간다” 두 개의 단어만 선택되며, 그 이후의 동작은 top_p와 동일합니다.

<center>
<img src='https://wikidocs.net/images/page/229817/%EC%8A%A4%ED%81%AC%EB%A6%B0%EC%83%B7_2024-02-04_094622.png' /><br>
</center>

top_k는 top_p에 비해 매개변수 조정이 권장되지 않는 측면이 있습니다. 설명에서 알 수 있듯이 k개의 단어가 선택되는 과정에서 단어 간의 확률 편차가 고려되지 않기 때문입니다. 이에 비해 top_p는 확률 분포의 ‘긴 꼬리’를 자르기 때문에 보다 자연스러운 텍스트 생성을 가능하게 합니다. 구글 제미나이 API에서는 top_k의 초깃값을 64로 두고 있으며, 특별한 이유가 없다면 이 값을 그대로 사용하기 바랍니다.

#### 매개변수 요약표

지금까지 학습한 구글 제미나이 AI의 매개변수를 요약하면 다음과 같습니다.

<table>
<thead>
<tr>
<th>매개변수명</th>
<th>의미</th>
<th style="text-align: center;">초깃값</th>
<th style="text-align: center;">범위</th>
</tr>
</thead>
<tbody>
<tr>
<td>candidate_count</td>
<td>생성할 응답 후보 건수. 현재는 1만 가능</td>
<td style="text-align: center;">1</td>
<td style="text-align: center;">1</td>
</tr>
<tr>
<td>stop_sequences</td>
<td>언어 생성을 중지시킬 문자 시퀀스</td>
<td style="text-align: center;">없음</td>
<td style="text-align: center;">0 ~ 5</td>
</tr>
<tr>
<td>max_output_tokens</td>
<td>출력할 최대 토큰 수</td>
<td style="text-align: center;">8192</td>
<td style="text-align: center;">1 ~ 8192</td>
</tr>
<tr>
<td>temperature</td>
<td>출력의 무작위성을 제어</td>
<td style="text-align: center;">1.0</td>
<td style="text-align: center;">0.0 ~ 2.0</td>
</tr>
<tr>
<td>top_p</td>
<td>확률 내림차순으로 정렬 후 누적 확률 기준으로 <br>선택할 단어(토큰)의 범위를 설정</td>
<td style="text-align: center;">0.95</td>
<td style="text-align: center;">0.0 ~ 1.0</td>
</tr>
<tr>
<td>top_k</td>
<td>확률 내림차순으로 정렬 후 건수 기준으로<br> 선택할 단어(토큰)의 범위를 설정</td>
<td style="text-align: center;">64</td>
<td style="text-align: center;">0보다 큰 정수</td>
</tr>
</tbody>
</table>

한편, 매개변수의 초깃값은 다음 명령으로도 확인할 수 있습니다.

In [2]:
print(genai.get_model("models/gemini-1.5-flash"))

Model(name='models/gemini-1.5-flash',
      base_model_id='',
      version='001',
      display_name='Gemini 1.5 Flash',
      description='Fast and versatile multimodal model for scaling across diverse tasks',
      input_token_limit=1048576,
      output_token_limit=8192,
      supported_generation_methods=['generateContent', 'countTokens'],
      temperature=1.0,
      max_temperature=2.0,
      top_p=0.95,
      top_k=64)
