In [None]:
import torch
from transformers import AutoModelForCausalLM, AutoTokenizer, TextIteratorStreamer
from threading import Thread

model_name = "LGAI-EXAONE/EXAONE-Deep-7.8B"
streaming = True    # choose the streaming option

model = AutoModelForCausalLM.from_pretrained(
    model_name,
    torch_dtype=torch.bfloat16,
    trust_remote_code=True,
    device_map="auto"
)
tokenizer = AutoTokenizer.from_pretrained(model_name)

# Choose your prompt:
#   Math example (AIME 2024)
prompt = r"""Let $x,y$ and $z$ be positive real numbers that satisfy the following system of equations:
\[\log_2\left({x \over yz}\right) = {1 \over 2}\]\[\log_2\left({y \over xz}\right) = {1 \over 3}\]\[\log_2\left({z \over xy}\right) = {1 \over 4}\]
Then the value of $\left|\log_2(x^4y^3z^2)\right|$ is $\tfrac{m}{n}$ where $m$ and $n$ are relatively prime positive integers. Find $m+n$.

Please reason step by step, and put your final answer within \boxed{}."""
#   Korean MCQA example (CSAT Math 2025)
prompt = r"""Question : $a_1 = 2$인 수열 $\{a_n\}$과 $b_1 = 2$인 등차수열 $\{b_n\}$이 모든 자연수 $n$에 대하여\[\sum_{k=1}^{n} \frac{a_k}{b_{k+1}} = \frac{1}{2} n^2\]을 만족시킬 때, $\sum_{k=1}^{5} a_k$의 값을 구하여라.

Options :
A) 120
B) 125
C) 130
D) 135
E) 140
 
Please reason step by step, and you should write the correct option alphabet (A, B, C, D or E) within \\boxed{}.
ANSWER IN KOREAN.
"""

messages = [
    {"role": "user", "content": prompt}
]
input_ids = tokenizer.apply_chat_template(
    messages,
    tokenize=True,
    add_generation_prompt=True,
    return_tensors="pt"
)

if streaming:
    streamer = TextIteratorStreamer(tokenizer)
    thread = Thread(target=model.generate, kwargs=dict(
        input_ids=input_ids.to("cuda"),
        eos_token_id=tokenizer.eos_token_id,
        max_new_tokens=32768,
        do_sample=True,
        temperature=0.6,
        top_p=0.95,
        streamer=streamer
    ))
    thread.start()

    for text in streamer:
        print(text, end="", flush=True)
else:
    output = model.generate(
        input_ids.to("cuda"),
        eos_token_id=tokenizer.eos_token_id,
        max_new_tokens=32768,
        do_sample=True,
        temperature=0.6,
        top_p=0.95,
    )
    print(tokenizer.decode(output[0]))

In [2]:
import torch
from transformers import AutoModelForCausalLM, AutoTokenizer, TextIteratorStreamer
from threading import Thread

model_name = "LGAI-EXAONE/EXAONE-Deep-7.8B"
streaming = True    # choose the streaming option

model = AutoModelForCausalLM.from_pretrained(
    model_name,
    torch_dtype=torch.bfloat16,
    trust_remote_code=True,
    device_map="auto"
)
tokenizer = AutoTokenizer.from_pretrained(model_name)


prompt = \
r"""질문: NASDAQ 100 개별 종목들의 주식 가격 예측을 위해, 최근 1년간의 일봉 주가 데이터들을 가져왔다. 가격 예측을 위해 어떤 모델들을 사용할 수 있을까?
"""

messages = [
    {"role": "user", "content": prompt}
]
input_ids = tokenizer.apply_chat_template(
    messages,
    tokenize=True,
    add_generation_prompt=True,
    return_tensors="pt"
)

if streaming:
    streamer = TextIteratorStreamer(tokenizer)
    thread = Thread(target=model.generate, kwargs=dict(
        input_ids=input_ids.to("cuda"),
        eos_token_id=tokenizer.eos_token_id,
        max_new_tokens=32768,
        do_sample=True,
        temperature=0.6,
        top_p=0.95,
        streamer=streamer
    ))
    thread.start()

    for text in streamer:
        print(text, end="", flush=True)
else:
    output = model.generate(
        input_ids.to("cuda"),
        eos_token_id=tokenizer.eos_token_id,
        max_new_tokens=32768,
        do_sample=True,
        temperature=0.6,
        top_p=0.95,
    )
    print(tokenizer.decode(output[0]))

Loading checkpoint shards: 100%|██████████| 4/4 [00:01<00:00,  2.20it/s]
Some parameters are on the meta device because they were offloaded to the cpu.


[|system|][|endofturn|]
[|user|]질문: NASDAQ 100 개별 종목들의 주식 가격 예측을 위해, 최근 1년간의 일봉 주가 데이터들을 가져왔다. 가격 예측을 위해 어떤 모델들을 사용할 수 있을까?

[|assistant|]<thought>

</thought>

NASDAQ 100 개별 종목들의 주식 가격 예측을 위해 사용할 수 있는 모델들은 다음과 같습니다:

### 1. **시계열 모델 (Time Series Models)**
   - **ARIMA (AutoRegressive Integrated Moving Average)**: 과거 데이터의 자기상관성과 이동성을 포착하여 예측하는 모델. 시계열 데이터에 적합하며, 계절성과 추세를 고려할 수 있습니다.
   - **SARIMA (Seasonal ARIMA)**: ARIMA에 계절성을 추가한 모델로, 주기적 패턴을 가진 데이터에 유용합니다.
   - **Prophet (페이스북이 개발한 오픈 소스 모델)**: 계절성, 트렌드, 홀리데이 효과 등을 고려한 유연한 모델로, 복잡한 패턴을 잘 처리합니다.

### 2. **기계 학습 모델 (Machine Learning Models)**
   - **랜덤 포레스트 (Random Forest)**: 다양한 피처를 활용해 예측하는 트리 기반 모델. 비선형 관계를 잘 학습할 수 있습니다.
   - **그래프 신경망 (Graph Neural Networks)**: 주식 시장의 복잡한 관계망을 고려할 때 유용합니다. 노드 간의 상호작용을 학습할 수 있습니다.
   - **LSTM (Long Short-Term Memory) 네트워크**: 시계열 데이터에 특화된 신경망으로, 장기적인 패턴을 학습하는 데 효과적입니다.
   - **Transformer 모델**: 자연어처리에서 유명한 모델로, 시계열 데이터에도 적용 가능하며 장기 의존성을 처리할 수 있습니다.

### 3. **특수 모델 (Specialized Models)**
   - **블랙-숄더 