In [1]:
# export CUDA_LAUNCH_BLOCKING=1

In [2]:
import torch
import sentencepiece as spm
from decoder_only_gpt import My_GPT_model

In [3]:
def load_model_only(model, ckpt_path, device):
    state_dict = torch.load(ckpt_path, map_location=device)
    model.load_state_dict(state_dict, strict=True)
    model.to(device)
    model.eval()
    print(f"тЬЕ Loaded weights from {ckpt_path}")
    return model

In [4]:
# @torch.no_grad()
# def generate(
#     model,
#     input_ids,
#     max_new_tokens,
#     temperature=0.6,
#     top_p=0.9
# ):
#     model.eval()

#     max_len = model.decoder.seq_len

#     for _ in range(max_new_tokens):
#         if input_ids.size(1) >= max_len:
#             break

#         logits = model(input_ids)
#         logits = logits[:, -1, :] / temperature

#         probs = torch.softmax(logits, dim=-1)

#         sorted_probs, sorted_idx = torch.sort(probs, descending=True)
#         cumulative = torch.cumsum(sorted_probs, dim=-1)

#         mask = cumulative > top_p
#         mask[..., 1:] = mask[..., :-1].clone()
#         mask[..., 0] = False

#         sorted_probs[mask] = 0
#         sorted_probs /= sorted_probs.sum(dim=-1, keepdim=True)

#         next_token = torch.multinomial(sorted_probs, 1)
#         next_token = sorted_idx.gather(-1, next_token)

#         input_ids = torch.cat([input_ids, next_token], dim=1)

#     return input_ids


@torch.no_grad()
def generate(
    model,
    input_ids,
    max_new_tokens=100,
    temperature=0.5,
    top_p=0.8,
    repetition_penalty=1.5):
    model.eval()

    for _ in range(max_new_tokens):

        logits = model(input_ids)          # (B, T, V)
        logits = logits[:, -1, :]          # last token

        # ЁЯФе REPETITION PENALTY
        if repetition_penalty != 1.0:
            for i in range(input_ids.size(0)):
                unique_tokens = torch.unique(input_ids[i])
                logits[i, unique_tokens] /= repetition_penalty

        # Temperature
        logits = logits / temperature

        # Top-p nucleus sampling
        probs = torch.softmax(logits, dim=-1)
        sorted_probs, sorted_idx = torch.sort(probs, descending=True)
        cumulative_probs = torch.cumsum(sorted_probs, dim=-1)

        # After zeroing out
        sorted_probs = sorted_probs / sorted_probs.sum(dim=-1, keepdim=True)
        
        # Add this safety
        sorted_probs = torch.nan_to_num(sorted_probs, nan=0.0)           # just in case
        sorted_probs = torch.where(
            sorted_probs.sum(dim=-1, keepdim=True) == 0,
            torch.full_like(sorted_probs, 1.0 / sorted_probs.size(-1)),   # uniform if everything was cut
            sorted_probs
        )

        next_token = torch.multinomial(sorted_probs, 1)
        next_token = sorted_idx.gather(-1, next_token)

        input_ids = torch.cat([input_ids, next_token], dim=1)

    return input_ids

In [5]:
sp = spm.SentencePieceProcessor()
sp.load("hindi_tokenizer_new.model")

DEVICE = "cuda" if torch.cuda.is_available() else "cpu"

model = My_GPT_model(
    vocab_size=32768,
    num_layers=12,
    d_model=512,     # ЁЯФе SAME AS CHECKPOINT
    d_ff=2048,       # ЁЯФе SAME
    num_heads=8,
    seq_len=512
).to(DEVICE)

state_dict = torch.load("full_sft_epoch4_step10000.pt", map_location=DEVICE)
model.load_state_dict(state_dict, strict=True)
model.eval()

prompt = "### рдкреНрд░рд╢реНрди:\nрдлреНрд░рд╛рдВрд╕ рдХреА рд░рд╛рдЬрдзрд╛рдиреА рдХреНрдпрд╛ рд╣реИ?\n\n### рдЙрддреНрддрд░:\n"
prompt_ids = torch.tensor([sp.encode(prompt)], device=DEVICE)

max_new = model.decoder.seq_len - prompt_ids.size(1) - 1

out = generate(model, prompt_ids, max_new_tokens=max_new)
print(sp.decode(out[0].tolist()))

 тБЗ  рдкреНрд░рд╢реНрди: тБЗ рдлреНрд░рд╛рдВрд╕ рдХреА рд░рд╛рдЬрдзрд╛рдиреА рдХреНрдпрд╛ рд╣реИ? тБЗ  рдЙрддреНрддрд░: тБЗ  рд╕рдВрдШрд░реНрд╖ рдХрд╛ рдпрд╣ рд╢рд╣рд░ рдкреЗрд░рд┐рд╕, рдлреНрд░рд╛рдВрд╕ рдХреЗ рд╕рд╛рде рдЕрдкрдиреА рд╕реАрдорд╛ рд╕рд╛рдЭрд╛ рдХрд░рддрд╛ рд╣реИред рдФрд░ рдпрд╣ рджреБрдирд┐рдпрд╛ рднрд░ рдореЗрдВ рдХрдИ рдкреНрд░рдореБрдЦ рд╢рд╣рд░реЛрдВ рд╕реЗ рд╣реЛрдХрд░ рдмрд╣рддреА рд╣реИред рдкреЗрд░рд┐рд╕ рднреА рдЕрдкрдиреЗ рд╢рд╛рдирджрд╛рд░ рд╕рдореБрджреНрд░ рдкрд░рд┐рджреГрд╢реНрдп рдФрд░ рдЬреАрд╡рдВрдд рд╕рдВрд╕реНрдХреГрддрд┐ рдХреЗ рд▓рд┐рдП рдЬрд╛рдирд╛ рдЬрд╛рддрд╛ рд╣реИ, рдЬрд┐рд╕рдореЗрдВ рд▓реЛрдХрдкреНрд░рд┐рдп рдЖрдХрд░реНрд╖рдгреЛрдВ рдХреЛ рджреЗрдЦрдиреЗ рд╡рд╛рд▓реЗ рд▓реЛрдЧ рдмрд╣реБрдд рд╕рд╛рд░реЗ рдмрд╛рд░ рджрд┐рдЦрд╛рдИ рджреЗрддреЗ рд╣реИрдВред рдЗрд╕рдХреЗ рдЕрддрд┐рд░рд┐рдХреНрдд, рд▓реЗрдХрд░ рдЖрдИ. рдП. рдПрд╕. рдмреА. рд╕реА. рдкреНрд░рдгрд╛рд▓реА рдПрдХ рдкреНрд░рддрд┐рд╖реНрдард┐рдд рд╕реНрдерд▓реЛрдВ рдХрд╛ рдШрд░ рд╣реИ р

In [6]:
sp = spm.SentencePieceProcessor()
sp.load("hindi_tokenizer_new.model")

DEVICE = "cuda" if torch.cuda.is_available() else "cpu"

model = My_GPT_model(
    vocab_size=32768,
    num_layers=12,
    d_model=512,     # ЁЯФе SAME AS CHECKPOINT
    d_ff=2048,       # ЁЯФе SAME
    num_heads=8,
    seq_len=512
).to(DEVICE)

state_dict = torch.load("full_sft_epoch5_step10000.pt", map_location=DEVICE)
model.load_state_dict(state_dict, strict=True)
model.eval()

My_GPT_model(
  (decoder): Decoder(
    (embedding): Embedding(32768, 512)
    (layers): ModuleList(
      (0-11): 12 x Decoder_GPT_Block(
        (swi_glu): SwiGLU_FFN(
          (w1): Linear(in_features=512, out_features=1536, bias=False)
          (w2): Linear(in_features=512, out_features=1536, bias=False)
          (w3): Linear(in_features=1536, out_features=512, bias=False)
          (act): SiLU()
        )
        (masked_mha): Masked_MHA(
          (Q): Linear(in_features=512, out_features=512, bias=True)
          (K): Linear(in_features=512, out_features=512, bias=True)
          (V): Linear(in_features=512, out_features=512, bias=True)
          (fc_out): Linear(in_features=512, out_features=512, bias=True)
        )
        (rms_norm0): RMSNorm()
        (rms_norm1): RMSNorm()
        (dropout): Dropout(p=0.1, inplace=False)
      )
    )
    (norm): RMSNorm()
  )
  (lm_head): Linear(in_features=512, out_features=32768, bias=False)
)

In [7]:
context = """рдорд╣рд╛рддреНрдорд╛ рдЧрд╛рдВрдзреА рдХреА рдЬреАрд╡рдиреА: рдорд╣рд╛рддреНрдорд╛ рдЧрд╛рдВрдзреА, рдЬрд┐рдиреНрд╣реЗрдВ рдмрд╛рдкреВ рдХрд╣рд╛ рдЬрд╛рддрд╛ рд╣реИ, рднрд╛рд░рдд рдХреЗ рд╕реНрд╡рддрдВрддреНрд░рддрд╛ рд╕рдВрдЧреНрд░рд╛рдо рдХреЗ рдкреНрд░рдореБрдЦ рдиреЗрддрд╛ рдереЗред рдЙрдирдХрд╛ рдЬрдиреНрдо 2 рдЕрдХреНрдЯреВрдмрд░ 1869 рдХреЛ рд╣реБрдЖ рдерд╛ред"""

question = "рдлреНрд░рд╛рдВрд╕ рдХреА рд░рд╛рдЬрдзрд╛рдиреА рдХреНрдпрд╛ рд╣реИ?"

prompt = f"рд╕рд┐рд░реНрдл рдиреАрдЪреЗ рджрд┐рдП рд╕рдВрджрд░реНрдн рд╕реЗ рд╣реА рдЬрд╡рд╛рдм рджреЗрдВ:\n\nрд╕рдВрджрд░реНрдн:\n{context}\n\nрдкреНрд░рд╢реНрди:\n{question}\n\nрдЙрддреНрддрд░:"

In [8]:
prompt_ids = torch.tensor([sp.encode(prompt)], device=DEVICE)
prompt_ids

tensor([[  982,  1688,   863,  4694,    32,   107,  1490,   884, 28911,     1,
         28851,   123,    30, 28875, 28911,     1,  9489,  2261,  1187,    26,
         16462, 28911,  5209,  1187, 28879,  2774, 10457,   149,   376,    15,
         28879,   329,    11,  3767, 10319,    11,  1237,   950,   241, 28869,
           834,  1424,  2704,  2227, 12589, 28948, 28940,    28,   382,   132,
         28869,     1,   571,  2326, 28911,     1,  2908,  1559,    26,  2375,
           496,    15, 28910,     1, 16102, 28911]], device='cuda:0')

In [9]:
EOS_ID = sp.eos_id()

@torch.no_grad()
def generate(
    model,
    input_ids,
    max_new_tokens=100,
    temperature=0.6,
    top_p=0.75,
    repetition_penalty=1.5,
    top_k=50
):
    model.eval()

    for _ in range(max_new_tokens):
        logits = model(input_ids)
        next_logits = logits[:, -1, :]

        # Repetition penalty
        if repetition_penalty != 1.0:
            for i in range(input_ids.size(0)):
                unique_tokens = torch.unique(input_ids[i])
                for token_id in unique_tokens:
                    if next_logits[i, token_id] < 0:
                        next_logits[i, token_id] *= repetition_penalty
                    else:
                        next_logits[i, token_id] /= repetition_penalty

        # Temperature scaling
        next_logits = next_logits / temperature

        probs = torch.softmax(next_logits, dim=-1)

        # Top-k filtering
        if top_k > 0:
            top_k_vals, top_k_indices = torch.topk(probs, top_k)
            probs_zeroed = torch.zeros_like(probs).scatter_(-1, top_k_indices, top_k_vals)
            probs = probs_zeroed / top_k_vals.sum(dim=-1, keepdim=True)

        # Top-p nucleus filtering
        sorted_probs, sorted_indices = torch.sort(probs, descending=True)
        cumulative_probs = torch.cumsum(sorted_probs, dim=-1)

        sorted_indices_to_remove = cumulative_probs > top_p
        sorted_indices_to_remove[..., 1:] = sorted_indices_to_remove[..., :-1].clone()
        sorted_indices_to_remove[..., 0] = False
        sorted_probs[sorted_indices_to_remove] = 0.0

        # Renormalize
        if sorted_probs.sum() == 0:
            next_token = torch.argmax(probs, dim=-1, keepdim=True)
        else:
            sorted_probs /= sorted_probs.sum(dim=-1, keepdim=True)
            next_token = torch.multinomial(sorted_probs, num_samples=1)
            next_token = sorted_indices.gather(-1, next_token)

        input_ids = torch.cat([input_ids, next_token], dim=1)

        # рдЕрдЧрд░ EOS token рд╣реЛ рддреЛ рдмреНрд░реЗрдХ (рдЕрдЧрд░ defined рд╣реИ)
        if next_token.item() == EOS_ID:
            break

    return input_ids

In [17]:
context = """
рдорд╣рд╛рддреНрдорд╛ рдЧрд╛рдВрдзреА, рдЬрд┐рдиреНрд╣реЗрдВ рдмрд╛рдкреВ рдХрд╣рд╛ рдЬрд╛рддрд╛ рд╣реИ, рднрд╛рд░рдд рдХреЗ рд╕реНрд╡рддрдВрддреНрд░рддрд╛ рд╕рдВрдЧреНрд░рд╛рдо рдХреЗ рдкреНрд░рдореБрдЦ рдиреЗрддрд╛ рдереЗред рдЙрдирдХрд╛ рдЬрдиреНрдо 2 рдЕрдХреНрдЯреВрдмрд░ 1869 рдХреЛ рд╣реБрдЖ рдерд╛ред
"""
# рд╕рдВрджрд░реНрдн: {context}

question = "рдорд╣рд╛рддреНрдорд╛ рдЧрд╛рдВрдзреА рдХрд╛ рдЬрдиреНрдо рдХрдм рд╣реБрдЖ рдерд╛? рдЙрдирдХрд╛ рдЬрдиреНрдо 2 рдЕрдХреНрдЯреВрдмрд░ 1869 рдХреЛ рд╣реБрдЖ рдерд╛ред"

prompt = f"""
рд╕рд┐рд░реНрдл рдиреАрдЪреЗ рджрд┐рдП рд╕рдВрджрд░реНрдн рд╕реЗ рд╣реА рдЬрд╡рд╛рдм рджреЛред рдЕрдЧрд░ рд╕рдВрджрд░реНрдн рдореЗрдВ рдЙрддреНрддрд░ рдирд╣реАрдВ рд╣реИ рддреЛ рд▓рд┐рдЦреЛ: "рд╕рдВрджрд░реНрдн рдореЗрдВ рдЬрд╛рдирдХрд╛рд░реА рдирд╣реАрдВ рд╣реИред"

{context}

рдкреНрд░рд╢реНрди: рдЙрдирдХрд╛ рдЬрдиреНрдо 2 рдЕрдХреНрдЯреВрдмрд░ 1869 рдХреЛ рд╣реБрдЖ рдерд╛ред

рдЙрддреНрддрд░:
"""

prompt_ids = torch.tensor([sp.encode(prompt)], device=DEVICE)
max_new = model.decoder.seq_len - prompt_ids.size(1) - 1
out = generate(model, prompt_ids, max_new_tokens=max_new)
generated_ids = out[0].tolist()
answer_ids = generated_ids[len(prompt_ids[0]):]
print(sp.decode(answer_ids).strip())

рднрд╛рд░рдд рдХреЗ рд╕реНрд╡рддрдВрддреНрд░ рд░реВрдк рд╕реЗ рд░рд╣рдиреЗ рд╡рд╛рд▓реЗ рд╡реНрдпрдХреНрддрд┐ рдХрд╛ рдирд╛рдо рдХреМрди рд╕рд╛ рд╣реИ? рдЙрдирдХреЗ рдЬрдиреНрдо рдХреЗ рдмрд╛рдж рдЙрдиреНрд╣реЗрдВ рдХрд┐рд╕ рджреЗрд╢ рдпрд╛ рдХреНрд╖реЗрддреНрд░ рдХреА рд╕рдмрд╕реЗ рдЕрдзрд┐рдХ рдЖрд╡рд╢реНрдпрдХрддрд╛ рдереА? рдЙрдирдХреА рдореГрддреНрдпреБ рдХреЗ рдмрд╛рдж рдЙрдирдХреЗ рд▓рд┐рдП рдХреМрди рд╕реА рдЙрдкрд▓рдмреНрдз рдереА? рд╡реЗ рдХрд┐рд╕ рд░рд╛рдЬреНрдп рдореЗрдВ рд░рд╣рддреЗ рд╣реИрдВ рдФрд░ рдЙрдирдХреЗ рдкрд╛рд╕ рдХреМрди рд╕рд╛ рдШрд░ рд╣реИ? рдпрд╣ рдзреНрдпрд╛рди рд░рдЦрдирд╛ рдорд╣рддреНрд╡рдкреВрд░реНрдг рд╣реИ рдХрд┐ рдЙрдирдХреЗ рд╕рд╛рде рдПрдХ рдЕрдЪреНрдЫрд╛ рд╕рдордп рдмрд┐рддрд╛рдиреЗ рд╕реЗ рдЙрдирдХреЗ рдЬреАрд╡рди рдкрд░ рд╕рдХрд╛рд░рд╛рддреНрдордХ рдкреНрд░рднрд╛рд╡ рдкрдбрд╝ рд╕рдХрддрд╛ рд╣реИред тБЗ рдЕрдВрддрддрдГ, рдпрджрд┐ рд╕рдВрджрд░реНрдн рдореЗрдВ рдХрд┐рд╕реА рдЕрдиреНрдп рджреЗрд╢ рдХреЗ рд▓реЛрдЧреЛрдВ рдиреЗ рдЗрд╕ рд╕реНрдерд┐рддрд┐

In [20]:
# prompt = """
# рдЖрдк рдПрдХ рдкреНрд░рддрд┐рднрд╛рд╢рд╛рд▓реА рдХрд╣рд╛рдиреАрдХрд╛рд░ рд╣реИрдВред рдХреГрдкрдпрд╛ рдПрдХ рд░реЛрдЪрдХ рдФрд░ рд╕реБрдВрджрд░ рд╣рд┐рдВрджреА рдХрд╣рд╛рдиреА рд▓рд┐рдЦреЗрдВред рдХрд╣рд╛рдиреА рдХреА рд╢реБрд░реБрдЖрдд рдПрдХ рдЫреЛрдЯреЗ рд╕реЗ рдЧрд╛рдБрд╡ рд╕реЗ рд╣реЛрддреА рд╣реИ, рдЬрд┐рд╕рдореЗрдВ рдПрдХ рдирд╛рдпрдХ рдпрд╛ рдирд╛рдпрд┐рдХрд╛ рд╣реЛрддрд╛ рд╣реИ рдЬреЛ рдПрдХ рдорд╣рддреНрд╡рдкреВрд░реНрдг рдЪреБрдиреМрддреА рдХрд╛ рд╕рд╛рдордирд╛ рдХрд░рддрд╛ рд╣реИред рдХрд╣рд╛рдиреА рдореЗрдВ рднрд╛рд╡рдирд╛рдПрдБ, рд░реЛрдорд╛рдВрдЪ рдФрд░ рдЬреАрд╡рди рдХреЗ рдорд╣рддреНрд╡рдкреВрд░реНрдг рд╕рдмрдХ рд╢рд╛рдорд┐рд▓ рд╣реЛрдВред

# рдХрд╣рд╛рдиреА рд╢реБрд░реВ рдХрд░реЗрдВ:
# """

# prompt = "рдПрдХ рдЦреВрдмрд╕реВрд░рдд рдФрд░ рднрд╛рд╡рдирд╛рддреНрдордХ рд╣рд┐рдВрджреА рдХрд╡рд┐рддрд╛ рд▓рд┐рдЦреЛ рдЬреЛ рдкреНрд░рдХреГрддрд┐ рдХреА рд╕реБрдВрджрд░рддрд╛ рдФрд░ рдЬреАрд╡рди рдХреЗ рд░рдВрдЧреЛрдВ рдХреЛ рджрд░реНрд╢рд╛рдПред рдХрд╡рд┐рддрд╛ рдореЗрдВ рд╕рд░рд▓ рднрд╛рд╖рд╛ рдФрд░ рдЧрд╣рд░реЗ рдЕрд░реНрде рд╣реЛрдВред"

context = """
рдорд╣рд╛рддреНрдорд╛ рдЧрд╛рдВрдзреА, рдЬрд┐рдиреНрд╣реЗрдВ рдмрд╛рдкреВ рдХрд╣рд╛ рдЬрд╛рддрд╛ рд╣реИ, рднрд╛рд░рдд рдХреЗ рд╕реНрд╡рддрдВрддреНрд░рддрд╛ рд╕рдВрдЧреНрд░рд╛рдо рдХреЗ рдкреНрд░рдореБрдЦ рдиреЗрддрд╛ рдереЗред рдЙрдирдХрд╛ рдЬрдиреНрдо 2 рдЕрдХреНрдЯреВрдмрд░ 1869 рдХреЛ рд╣реБрдЖ рдерд╛ред
"""
# рд╕рдВрджрд░реНрдн: {context}

question = "рдорд╣рд╛рддреНрдорд╛ рдЧрд╛рдВрдзреА рдХрд╛ рдЬрдиреНрдо рдХрдм рд╣реБрдЖ рдерд╛? рдЙрдирдХрд╛ рдЬрдиреНрдо 2 рдЕрдХреНрдЯреВрдмрд░ 1869 рдХреЛ рд╣реБрдЖ рдерд╛ред"

prompt = f"""
рд╕рд┐рд░реНрдл рдиреАрдЪреЗ рджрд┐рдП рд╕рдВрджрд░реНрдн рд╕реЗ рд╣реА рдЬрд╡рд╛рдм рджреЛред рдЕрдЧрд░ рд╕рдВрджрд░реНрдн рдореЗрдВ рдЙрддреНрддрд░ рдирд╣реАрдВ рд╣реИ рддреЛ рд▓рд┐рдЦреЛ: "рд╕рдВрджрд░реНрдн рдореЗрдВ рдЬрд╛рдирдХрд╛рд░реА рдирд╣реАрдВ рд╣реИред"

рдкреНрд░рд╢реНрди: рдПрдХ рдЦреВрдмрд╕реВрд░рдд рдФрд░ рднрд╛рд╡рдирд╛рддреНрдордХ рд╣рд┐рдВрджреА рдХрд╡рд┐рддрд╛ рд▓рд┐рдЦреЛ рдЬреЛ рдкреНрд░рдХреГрддрд┐ рдХреА рд╕реБрдВрджрд░рддрд╛ рдФрд░ рдЬреАрд╡рди рдХреЗ рд░рдВрдЧреЛрдВ рдХреЛ рджрд░реНрд╢рд╛рдПред рдХрд╡рд┐рддрд╛ рдореЗрдВ рд╕рд░рд▓ рднрд╛рд╖рд╛ рдФрд░ рдЧрд╣рд░реЗ рдЕрд░реНрде рд╣реЛрдВред

рдЙрддреНрддрд░:
"""

prompt_ids = torch.tensor([sp.encode(prompt)], device=DEVICE)
max_new = model.decoder.seq_len - prompt_ids.size(1) - 1
out = generate(model, prompt_ids, max_new_tokens=max_new)
generated_ids = out[0].tolist()
story = generated_ids[len(prompt_ids[0]):]
print(sp.decode(story).strip())

"рдПрдХ рдРрд╕реА рджреБрдирд┐рдпрд╛ рдЬрд╣рд╛рдБ рд╣рдо рд╕рднреА рдЬреАрд╡рд┐рдд рд╣реИрдВ" рдпрд╛ "рдЗрд╕ рддрд░рд╣ рдХреЗ рдПрдХ рдЕрджреНрднреБрдд, рд╡рд┐рдЪрд╛рд░рд╢реАрд▓ рдФрд░ рдЖрдХрд░реНрд╖рдХ рд╕рдорд╛рдЬ рдХрд╛ рдирд┐рд░реНрдорд╛рдг рдХрд░рдирд╛"-рдпрд╣ рд╕реБрдЭрд╛рд╡ рджреЗрддреЗ рд╣реБрдП рдХрд┐ рд╕рднреА рдорд╛рдирд╡ рдФрд░ рдордиреБрд╖реНрдпреЛрдВ рджреНрд╡рд╛рд░рд╛ рдХрд┐рдП рдЧрдП рдХрд╛рд░реНрдпреЛрдВ рдХреЛ рд╣рдо рдорд╣рддреНрд╡ рджреЗрддреЗ рд╣реИрдВ, рдпрд╣ рд╕реБрдЭрд╛рд╡ рджреЗрддрд╛ рд╣реИ рдХрд┐ рд╣рдорд╛рд░реЗ рдкрд╛рд╕ рдХреЗрд╡рд▓ рдПрдХ рдЙрджрд╛рд╣рд░рдг рд╣реЛрдирд╛ рдЪрд╛рд╣рд┐рдП рдХрд┐ рд╣рдо рдХреНрдпрд╛ рдХрд░ рд╕рдХрддреЗ рд╣реИрдВред рдпрд╣ рд╣рдореЗрдВ рдЕрдкрдиреЗ рдЖрд╕-рдкрд╛рд╕ рдХреА рджреБрдирд┐рдпрд╛ рдкрд░ рдирд┐рдпрдВрддреНрд░рдг рд░рдЦрдиреЗ рдХреЗ рд▓рд┐рдП рдкреНрд░реЛрддреНрд╕рд╛рд╣рд┐рдд рдХрд░рддрд╛ рд╣реИ, рдпрд╣ рдЬрд╛рдирддреЗ рд╣реБрдП рдХрд┐ рд╣рдо рдПрдХ рдмреЗрд╣рддрд░ рдЬрдЧрд╣ рдмрдирд╛ рд╕рдХрддреЗ рд╣реИрдВред тБЗ рдЕ

In [15]:
sp.decode(1)

' тБЗ '