# Baichuan2-13B-Chat

Baichuan Intelligenceという中国の企業が開発した新しいオープンソースのLLMになります．中国語，英語，多言語において幾つかのデータセットで同じパラメータ数を持つモデルの中で最高精度を出したモデルになります．中国語に特化させたモデルで．数学やコード生成，医療や法律などの専門的な領域で高い性能を発揮しているそうです．日本語も学習データに含まれているため日本語の出力も行うことができます．
* [GitHub](https://github.com/baichuan-inc/Baichuan2/tree/main)

<a href="https://colab.research.google.com/github/fuyu-quant/data-science-wiki/blob/main/nlp/text_generation(multilingual)/baichuan2_13b_chat.ipynb" target="_blank" rel="noopener noreferrer"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

In [1]:
%%capture
!pip install transformers_stream_generator sentencepiece bitsandbytes accelerate

In [2]:
import torch
from transformers import AutoModelForCausalLM, AutoTokenizer
from transformers.generation.utils import GenerationConfig

In [None]:
tokenizer = AutoTokenizer.from_pretrained(
    "baichuan-inc/Baichuan2-13B-Chat", 
    use_fast=False, 
    trust_remote_code=True
    )
model = AutoModelForCausalLM.from_pretrained(
    "baichuan-inc/Baichuan2-13B-Chat", 
    device_map="auto", 
    torch_dtype=torch.bfloat16, 
    trust_remote_code=True
    )
model.generation_config = GenerationConfig.from_pretrained("baichuan-inc/Baichuan2-13B-Chat")

In [3]:
messages = []
messages.append({"role": "user", "content": "機械学習について教えてください"})
response = model.chat(tokenizer, messages)
print(response)

機械学習は、人工智能の一つの分野です。その目的は、データからプログラミングによる手動の介入を必要としないアルゴリズムやモデルを作成することです。機械学習は、画像認識、音声認識、自然言語処理、推論など、さまざまな分野で活用されています。

機械学習の基盤は、数学（特に線形代数、概率論、統計学）、電子情報工学、物理学、心理学、生物学、社会科学など多くの学問が交差しています。

機械学習の主要な手法の1つは、回帰分析です。これは、2次元の平面図上の点群から直線または回帰線を引くことで、各点の特徴量（x座標、y座標）と予測したい特徴量（y）の間の関係を捉える方法です。

また、機械学習の手法の1つは、決定木（Decision Tree）です。決定木は、木の幹、枝、葉の形を擬ねたもので、データの中でどのような決定を下すかを表現するための方法です。決定木は、予測結果が理解できるような明確な形で予測結果を出します。

最も知られている機械学習手法の1つは、神经網（Neural Network）です。これは、人の神経細胞の組み合わせを参考にしたもので、複数の層が存在し、各層のノードは相手のノードと通信し合い、情報を伝達することです。神经網は、画像認識、音声認識、自然言語処理など、さまざまな分野で活用されています。

機械学習の実行には、PythonのScikit-learn、TensorFlow、Kerasなどの機械学習ライブラリが利用できます。


In [5]:
messages = []
messages.append({"role": "user", "content": "ロジスティック回帰を学習するためのPythonのコードを生成してください．"})
response = model.chat(tokenizer, messages)
print(response)

以下は、Pythonでロジスティック回帰を学習するための簡単なサンプルコードです。このコードは、`sklearn` パッケージを使用します。

```python
# 必要なライブラリのインポート
import numpy as np
from sklearn.linear_model import LogisticRegression
from sklearn.model_selection import train_test_split
from sklearn.metrics import accuracy_score, classification_report

# データの読み込み
# ここでは、データフレーム形式の入力データを想定
X = [
    [1, 2, 3],
    [4, 5, 6],
    [7, 8, 9],
    [10, 11, 12]
]
y = [0, 1, 0, 1]  # 0: クラスA, 1: クラスB

# 学習データとテストデータに分割
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# ロジスティック回帰モデルの作成
log_reg = LogisticRegression()

# モデルを学習させる
log_reg.fit(X_train, y_train)

# 予測結果を出力
y_pred = log_reg.predict(X_test)
print("予測結果:", y_pred)

# 評価指標の算出
accuracy = accuracy_score(y_test, y_pred)
print("準確率:", accuracy)
print("分類報告:")
print(classification_report(y_test, y_pred))
```

このコードは、入力データ `X` と目標変数 `y` から学習データとテストデータを作成し、ロジスティック回帰モデルを学習させ、それらの評価指標を算出します。


In [6]:
messages = []
messages.append({"role": "user", "content": "Please tell me about quantum computers."})
response = model.chat(tokenizer, messages)
print(response)

Quantum computers are a relatively new and rapidly developing technology that uses the principles of quantum mechanics to perform calculations and solve problems. They are different from traditional digital computers, which use binary bits (0s and 1s) to represent information, in that they use qubits (quantum bits) as their basic units.

Here are some key features and differences between classical and quantum computers:

1. Speed: Quantum computers are believed to be exponentially faster than classical computers for certain tasks, such as factoring large numbers or searching large databases. This is because they can exploit the superposition and entanglement properties of qubits to perform complex calculations in parallel.

2. Simultaneous calculation: In a quantum computer, all qubits can be in multiple states at the same time, allowing them to process and analyze vast amounts of data simultaneously. This is known as quantum parallelism and can significantly increase the computational

In [39]:
messages = []
messages.append({"role": "user", "content": "31067+19345="})
response = model.chat(tokenizer, messages)
print(response)

31067 + 19345 = 50412


In [40]:
31067+19345

50412