In [6]:
from transformers import pipeline
fugu_translator = pipeline('translation', model='staka/fugumt-ja-en')

[{'translation_text': "are you tired today and you're losing your eyes?"}]

In [7]:
fugu_translator('今日 も 疲れ て 目 を 落とし て いる の ?')

[{'translation_text': "are you tired today and you're losing your eyes?"}]

In [8]:
fugu_translator('じゃあ , マッサ - ジ し て あげる .')

[{'translation_text': "well then, massa, i'll give it to you."}]

In [2]:
from transformers import (
    MBartForConditionalGeneration, MBartTokenizer
)

tokenizer = MBartTokenizer.from_pretrained("ken11/mbart-ja-en")
model = MBartForConditionalGeneration.from_pretrained("ken11/mbart-ja-en")

这段代码是用于机器翻译任务的一个例子，它使用了一个预训练的模型将日语文本（"こんにちは"）翻译成英语。以下是代码的详细解释：

1.inputs = tokenizer("こんにちは", return_tensors="pt")：这一行将日语文本 "こんにちは" 作为输入，并使用 tokenizer 对其进行编码。return_tensors="pt" 表示返回的张量类型为 PyTorch 张量。

2.translated_tokens = model.generate(**inputs, decoder_start_token_id=tokenizer.lang_code_to_id["en_XX"], early_stopping=True, max_length=48)：这一行使用预训练的模型 (model) 对输入进行翻译。decoder_start_token_id 参数表示翻译目标语言的起始 token ID（在这个例子中，目标语言是英语）。early_stopping=True 表示当翻译过程满足某个停止条件时，会提前结束翻译。max_length=48 限制了翻译结果的最大长度。

3.pred = tokenizer.batch_decode(translated_tokens, skip_special_tokens=True)[0]：这一行将翻译后的 token 序列解码为英语文本。skip_special_tokens=True 表示在解码过程中跳过特殊 token（如起始、结束、填充等 token）。

总结：这段代码使用了一个预训练的机器翻译模型，将日语文本 "こんにちは" 翻译成英语文本。

In [4]:
inputs = tokenizer("今日 も 疲れ て 目 を 落とし て いる の ?", return_tensors="pt")
translated_tokens = model.generate(**inputs, decoder_start_token_id=tokenizer.lang_code_to_id["en_XX"], early_stopping=True, max_length=48)
pred = tokenizer.batch_decode(translated_tokens, skip_special_tokens=True)[0]
print(pred)

are you tired today? are you losing your eye?


In [5]:
inputs = tokenizer("じゃあ , マッサ - ジ し て あげる .", return_tensors="pt")
translated_tokens = model.generate(**inputs, decoder_start_token_id=tokenizer.lang_code_to_id["en_XX"], early_stopping=True, max_length=48)
pred = tokenizer.batch_decode(translated_tokens, skip_special_tokens=True)[0]
print(pred)

well, then, i'll give you a masse.
