In [1]:
import torch
from transformers import AutoTokenizer, AutoModelForSeq2SeqLM

tokenizer_en2vi = AutoTokenizer.from_pretrained("vinai/vinai-translate-en2vi", src_lang="en_XX")
model_en2vi = AutoModelForSeq2SeqLM.from_pretrained("vinai/vinai-translate-en2vi")

def translate_en2vi(en_text: str) -> str:
    """Translate English text to Vietnamese

    Args:
        en_text (str): input text with the limit to 3000 CHARACTERS

    Returns:
        str: Vietnamese text
    """
    input_ids = tokenizer_en2vi(en_text, return_tensors="pt").input_ids
    output_ids = model_en2vi.generate(
        input_ids,
        decoder_start_token_id=tokenizer_en2vi.lang_code_to_id["vi_VN"],
        num_return_sequences=1,
        num_beams=5,
        early_stopping=True
    )
    vi_text = tokenizer_en2vi.batch_decode(output_ids, skip_special_tokens=True)
    vi_text = " ".join(vi_text)
    return vi_text

  from .autonotebook import tqdm as notebook_tqdm


In [None]:
en_text = "I haven't been to a public gym before. When I exercise in a private space, I feel more comfortable."
print(translate_en2vi(en_text))

en_text = "i haven't been to a public gym before when i exercise in a private space i feel more comfortable"
print(translate_en2vi(en_text))

In [21]:
import csv
from utils import write_list_to_csv
import os

def translate_text_segments(text_segment_file, out_dir='data/translated_texts/'):
    with open(text_segment_file) as csv_file:
        translated_segments = []
        csv_reader = csv.reader(csv_file, delimiter=',')
        for row in csv_reader:
            translated_text = translate_en2vi(row[2])
            print(translated_text)
            row[2] = translated_text
            translated_segments.append(row)
    
    file_name = os.path.basename(text_segment_file)
    file_path = os.path.join(out_dir, file_name)
    return write_list_to_csv(translated_segments, file_path)

In [22]:
text_file = "data/merged_texts/GPT_NEEDED_THIS___DALL-E_3_IS_HERE___YOU_CAN_TRY_IT_FREE.csv"
translate_text_segments(text_file)

OpenAI đã tiếp quản AI tạo văn bản với GPT, mô hình ngôn ngữ chịu trách nhiệm cho trình tạo văn bản lan truyền, ChatGPT. Bây giờ họ đang chuyển sang không gian tạo văn bản thành hình ảnh với trình tạo hình ảnh sắp ra mắt có tên Dali3. Bạn sẽ gọi công cụ AI tạo văn bản thành hình ảnh hàng đầu trên thị trường ngay bây giờ là gì? Mid-Journey, Deep Floyd hay có lẽ là Jasper Art? Dali3 dự kiến sẽ tạo ra hình ảnh chân thực hơn với màu sắc sắc nét hơn, hình dạng được xác định rõ hơn và chú ý đến chi tiết hơn. Đừng tin tôi? Hãy tiếp tục xem để tự mình xem và chúng tôi thậm chí sẽ chỉ cho bạn cách bạn có thể truy cập Dali3 miễn phí.
Dali3 là phiên bản mới nhất của các mô hình tổng hợp hình ảnh của OpenAI, tạo ra hình ảnh bằng cách làm theo các mô tả văn bản phức tạp. Người dùng gõ một mô tả chi tiết về một hình ảnh từ trí tưởng tượng của họ, và mô hình đu vào hành động, đưa giấc mơ vào cuộc sống.
Dali có thể tạo ra bất cứ thứ gì từ các đối tượng đơn lẻ đến toàn bộ khung cảnh của các đối tượng t