In [1]:
import os
help(os)


Help on module os:

NAME
    os - OS routines for NT or Posix depending on what system we're on.

MODULE REFERENCE
    https://docs.python.org/3.12/library/os.html

    The following documentation is automatically generated from the Python
    source files.  It may be incomplete, incorrect or include features that
    are considered implementation detail and may vary between Python
    implementations.  When in doubt, consult the module reference at the
    location listed above.

DESCRIPTION
    This exports:
      - all functions from posix or nt, e.g. unlink, stat, etc.
      - os.path is either posixpath or ntpath
      - os.name is either 'posix' or 'nt'
      - os.curdir is a string representing the current directory (always '.')
      - os.pardir is a string representing the parent directory (always '..')
      - os.sep is the (or a most common) pathname separator ('/' or '\\')
      - os.extsep is the extension separator (always '.')
      - os.altsep is the alternate pathname 

In [9]:
%pip install pandas

Collecting pandas
  Downloading pandas-2.1.4-cp312-cp312-win_amd64.whl.metadata (18 kB)
Collecting numpy<2,>=1.26.0 (from pandas)
  Downloading numpy-1.26.2-cp312-cp312-win_amd64.whl.metadata (61 kB)
     ---------------------------------------- 0.0/61.2 kB ? eta -:--:--
     --------------------------------- ------ 51.2/61.2 kB 2.7 MB/s eta 0:00:01
     ---------------------------------------- 61.2/61.2 kB 1.6 MB/s eta 0:00:00
Collecting pytz>=2020.1 (from pandas)
  Downloading pytz-2023.3.post1-py2.py3-none-any.whl.metadata (22 kB)
Collecting tzdata>=2022.1 (from pandas)
  Downloading tzdata-2023.3-py2.py3-none-any.whl (341 kB)
     ---------------------------------------- 0.0/341.8 kB ? eta -:--:--
     ---------------------------------------- 341.8/341.8 kB ? eta 0:00:00
Downloading pandas-2.1.4-cp312-cp312-win_amd64.whl (10.5 MB)
   ---------------------------------------- 0.0/10.5 MB ? eta -:--:--
   ------------------- -------------------- 5.1/10.5 MB 108.5 MB/s eta 0:00:01
   -

In [11]:
import pandas as pd
sample = pd.read_json('./충청도_학습데이터.zip/DCDG20000116.json', orient="records")
print(sample)

ValueError: All arrays must be of the same length

In [12]:
import json

# JSON 파일 읽어오기
file_path = "./충청도_학습데이터.zip/DCDG20000116.json"  # 실제 파일 경로 및 파일명으로 변경해야 합니다.

with open(file_path, 'r', encoding='utf-8') as file:
    json_data = json.load(file)

# 불러온 JSON 데이터 확인
print(json_data)


{'id': 'DCDG20000116', 'metadata': {'title': '충청방언 AI 학습데이터 DCDG20000116', 'creator': '솔트룩스', 'distributor': '솔트룩스', 'year': '2020', 'category': '충청방언 > 사적 대화 > 일상 대화', 'annotation_level': ['원시'], 'sampling': '본문 전체', 'author': '개인 발화자', 'publisher': '개인 발화 녹음', 'date': '20201022', 'topic': '영화'}, 'speaker': [{'id': '1', 'name': 'null', 'age': '20대', 'occupation': '무직/취업준비생', 'sex': '여성', 'birthplace': '충북', 'principal_residence': '충북', 'current_residence': '충북', 'education': '대졸'}, {'id': '2', 'name': 'null', 'age': '50대', 'occupation': '주부', 'sex': '여성', 'birthplace': '충북', 'principal_residence': '충북', 'current_residence': '충북', 'education': '대졸'}], 'setting': {'relation': '부모/자녀'}, 'utterance': [{'id': 'DCDG20000116.1.1.1', 'form': '이번에 유아인 새로 신작 영화 찍었잖아.', 'standard_form': '이번에 유아인 새로 신작 영화 찍었잖아.', 'dialect_form': '이번에 유아인 새로 신작 영화 찍었잖아.', 'speaker_id': '1', 'start': 0.01, 'end': 6.47, 'note': '', 'eojeolList': [{'id': 1, 'eojeol': '이번에', 'standard': '이번에', 'isDialect': False}, {'i

In [20]:
df_dict = {'age':[], 'sex':[], 'dialect_form':[], 'standard_form':[]}

def prep():
    for speaker in json_data['speaker']:
        df_dict['age'].append(speaker['age'])
        df_dict['sex'].append(speaker['sex'])
    for data in json_data['utterance']:
        df_dict['dialect_form'].append(data['dialect_form'])
        df_dict['standard_form'].append(data['standard_form'])

In [21]:
df_dict

{'age': ['20대', '50대'],
 'sex': ['여성', '여성'],
 'dialect_form': ['이번에 유아인 새로 신작 영화 찍었잖아.',
  '소리도 없이 그거 언제 보러 갈까?',
  '뭐~ 오늘 개봉한 지 됐으니까',
  '오늘 보러 가도 상관없지 뭐~',
  '오늘 몇 시?',
  '봐야지 상영 시간을.',
  '근데 유아인이 찍은 영화들은',
  '다 되게 -특- 특이한 거 같은 그 느낌이',
  '엄마는 유아인 되게 좋아.',
  '연기를 잘해서 좋아.',
  '난 그냥 그래.',
  '연기를 굉장히 그래도 잘하는 거 같애 젊은 애들 주',
  '젊은 애들 중에서 그래도 유아인이',
  '연기를 그래도 가장 잘하는 거 같애.',
  '젊은 영화배우 중에 유아인이 젤 좋아?',
  '지금까지는 유아인이 젤 나은 거 같애.',
  '연기 면에서 음~',
  '연기 면에서 유아인이 가장 잘하는 거 같아.',
  '나는 사람들이 막 다 영화배우 중에 최고는 송강호 송강호 하잖아.',
  '그래서 어 뭐가 그렇게 뭐가 그렇게 최고일까 하고 아직 막 최근까지도 좀 그게 되게 의심스러웠는데',
  '티비에서 요새 그런 예전에 흥행했던 영화들 막 차례도 해 주잖아.',
  '밀정이니 변호인이니.',
  '근데 다른 영화들은 그렇게 짧게 해 주면은 그 순간에 집중이 안 돼가지고 바로 다른 채널로 돌리는데',
  '송강호 나온 영화들은 송강호가 연기하는 그 짧은 순간',
  '찰나만 보는 건데도 확 집중이 돼서 그거를 계속 보게 되더라고.',
  '그래서 그때 느꼈어 아~ 이래서 대배우는 대배우구나.',
  '이런 걸 좀 느꼈어.',
  '그러니까 이게 연기하는 거 (()) 보면은',
  '뭐 인제 영화를 많이 뭐 이 사람 저 사람 많이 본 거는 아니지만 그래도',
  '나름대로 보고 생각한 게 외모가 일단은 바쳐 주고',
  '거기에 쁘라스 연기가 되면은 완전히 인제 금상첨환데',
  '응.',
  '연기는 안 되는데',
  '비주얼만 어떻게 

In [3]:
%pip install torch==2.0.1+cu118 torchvision==0.15.2+cu118 torchaudio==2.0.2+cu118 --extra-index-url https://download.pytorch.org/whl/cu118

Looking in indexes: https://pypi.org/simple, https://download.pytorch.org/whl/cu118
Collecting torch==2.0.1+cu118
  Downloading https://download.pytorch.org/whl/cu118/torch-2.0.1%2Bcu118-cp38-cp38-win_amd64.whl (2619.2 MB)
     ---------------------------------------- 0.0/2.6 GB ? eta -:--:--
     ---------------------------------------- 0.0/2.6 GB 61.0 MB/s eta 0:00:43
     ---------------------------------------- 0.0/2.6 GB 56.0 MB/s eta 0:00:47
     ---------------------------------------- 0.0/2.6 GB 71.8 MB/s eta 0:00:37
     ---------------------------------------- 0.0/2.6 GB 53.1 MB/s eta 0:00:50
     ---------------------------------------- 0.0/2.6 GB 54.4 MB/s eta 0:00:48
     ---------------------------------------- 0.0/2.6 GB 65.6 MB/s eta 0:00:40
     ---------------------------------------- 0.0/2.6 GB 93.0 MB/s eta 0:00:28
     ---------------------------------------- 0.0/2.6 GB 108.8 MB/s eta 0:00:24
      --------------------------------------- 0.0/2.6 GB 110.0 MB/s eta 0

  You can safely remove it manually.


In [1]:
import torch

if torch.cuda.is_available():
    print("GPU is available")
    print("Number of GPU(s) available: ", torch.cuda.device_count())
    print("GPU device name: ", torch.cuda.get_device_name(0))
else:
    print("GPU is not available. Using CPU instead.")


GPU is available
Number of GPU(s) available:  1
GPU device name:  NVIDIA GeForce RTX 2080 Ti


In [2]:
from transformers import AutoModel, AutoTokenizer

model = AutoModel.from_pretrained('facebook/hf-seamless-m4t-medium')
tokenizer = AutoTokenizer.from_pretrained('facebook/hf-seamless-m4t-medium')


Special tokens have been added in the vocabulary, make sure the associated word embeddings are fine-tuned or trained.
Special tokens have been added in the vocabulary, make sure the associated word embeddings are fine-tuned or trained.


In [5]:
from datasets import load_dataset
fleurs = load_dataset("google/fleurs", "ko_kr", split="train", streaming=True)
print(next(iter(fleurs)))


{'id': 114, 'num_samples': 350400, 'path': None, 'audio': {'path': 'train/10003190170698054799.wav', 'array': array([ 0.00000000e+00,  0.00000000e+00,  0.00000000e+00, ...,
        7.21216202e-06, -1.43051147e-06, -5.60283661e-06]), 'sampling_rate': 16000}, 'transcription': '호주의 전 보수 정부는 인도와 중국 같은 나라는 온실 가스 방출 목표에 제한을 받지 않는 반면 석탄 수출에 크게 의존하고 있는 자국 경제에는 악영향을 미칠 것이라며 교토 의정서 비준을 거부했다', 'raw_transcription': '호주의 전 보수 정부는 인도와 중국 같은 나라는 온실 가스 방출 목표에 제한을 받지 않는 반면, 석탄 수출에 크게 의존하고 있는 자국 경제에는 악영향을 미칠 것이라며 교토 의정서 비준을 거부했다.', 'gender': 1, 'lang_id': 48, 'language': 'Korean', 'lang_group_id': 6}


In [1]:
from transformers import AutoProcessor, SeamlessM4Tv2Model

processor = AutoProcessor.from_pretrained("facebook/seamless-m4t-v2-large")
model = SeamlessM4Tv2Model.from_pretrained("facebook/seamless-m4t-v2-large")


  from .autonotebook import tqdm as notebook_tqdm
preprocessor_config.json: 100%|██████████| 1.78k/1.78k [00:00<00:00, 297kB/s]
tokenizer_config.json: 100%|██████████| 19.7k/19.7k [00:00<00:00, 2.82MB/s]
sentencepiece.bpe.model: 100%|██████████| 5.17M/5.17M [00:00<00:00, 36.9MB/s]
added_tokens.json: 100%|██████████| 2.07k/2.07k [00:00<00:00, 318kB/s]
special_tokens_map.json: 100%|██████████| 2.34k/2.34k [00:00<00:00, 390kB/s]
Special tokens have been added in the vocabulary, make sure the associated word embeddings are fine-tuned or trained.
Special tokens have been added in the vocabulary, make sure the associated word embeddings are fine-tuned or trained.
config.json: 100%|██████████| 2.72k/2.72k [00:00<00:00, 454kB/s]
model.safetensors.index.json: 100%|██████████| 211k/211k [00:00<00:00, 529kB/s]
model-00001-of-00002.safetensors: 100%|██████████| 5.00G/5.00G [03:51<00:00, 21.6MB/s]
model-00002-of-00002.safetensors: 100%|██████████| 4.24G/4.24G [02:38<00:00, 26.8MB/s]
Downloading sha

In [6]:

# from text
text_inputs = processor(text = "Hello, my dog is cute", src_lang="eng", return_tensors="pt")
audio_array_from_text = model.generate(**text_inputs, tgt_lang="rus")[0].cpu().numpy().squeeze()
print(audio_array_from_text)

# # from audio
# import torchaudio
# audio, orig_freq =  torchaudio.load("https://www2.cs.uic.edu/~i101/SoundFiles/preamble10.wav")
# audio =  torchaudio.functional.resample(audio, orig_freq=orig_freq, new_freq=16_000) # must be a 16 kHz waveform array
# audio_inputs = processor(audios=audio, return_tensors="pt")
# audio_array_from_audio = model.generate(**audio_inputs, tgt_lang="rus")[0].cpu().numpy().squeeze()

[0.00030924 0.0004648  0.00049741 ... 0.00047521 0.00041266 0.00040459]


LibsndfileError: Error opening 'https://www2.cs.uic.edu/~i101/SoundFiles/preamble10.wav': System error.

In [15]:
import scipy

sample_rate = model.sampling_rate
scipy.io.wavfile.write("out_from_text.wav", rate=sample_rate, data=audio_array_from_text)
# scipy.io.wavfile.write("out_from_audio.wav", rate=sample_rate, data=audio_array_from_audio)

AttributeError: 'SeamlessM4Tv2Model' object has no attribute 'sampling_rate'

In [1]:
%pip install git+https://github.com/huggingface/transformers.git sentencepiece

Collecting git+https://github.com/huggingface/transformers.gitNote: you may need to restart the kernel to use updated packages.

  Cloning https://github.com/huggingface/transformers.git to c:\users\ict coc\appdata\local\temp\pip-req-build-x2q8_x0d


  ERROR: Error [WinError 2] 지정된 파일을 찾을 수 없습니다 while executing command git version
ERROR: Cannot find command 'git' - do you have 'git' installed and in your PATH?


In [14]:
help(SeamlessM4Tv2Model)

Help on class SeamlessM4Tv2Model in module transformers.models.seamless_m4t_v2.modeling_seamless_m4t_v2:

class SeamlessM4Tv2Model(SeamlessM4Tv2PreTrainedModel)
 |  SeamlessM4Tv2Model(config, current_modality='text')
 |  
 |  The original SeamlessM4Tv2 Model transformer which can be used for every tasks available (S2ST, S2TT, T2TT, T2ST).
 |  This model is a PyTorch [torch.nn.Module](https://pytorch.org/docs/stable/nn.html#torch.nn.Module) sub-class. Use
 |  it as a regular PyTorch Module and refer to the PyTorch documentation for all matter related to general usage and
 |  behavior.
 |  
 |  Parameters:
 |      config ([`~SeamlessM4Tv2Config`]): Model configuration class with all the parameters of the model.
 |          Initializing with a config file does not load the weights associated with the model, only the
 |          configuration. Check out the [`~PreTrainedModel.from_pretrained`] method to load the model weights.
 |  
 |      current_modality (`str`, *optional*, defaults to `

In [13]:
from transformers import Wav2Vec2ForCTC, Wav2Vec2Processor

In [3]:
import os
os.environ['CUDA_VISIBLE_DEVICES'] = '0'


In [2]:
import main

main()

usage: ipykernel_launcher.py [-h] [--data-dir DATA_DIR]
                             [--save-path SAVE_PATH] [--batch-size BATCH_SIZE]
                             [--epoch EPOCH] [--vocab-size VOCAB_SIZE]
                             [--hidden-dim HIDDEN_DIM] [--enc-layer ENC_LAYER]
                             [--dec-layer DEC_LAYER] [--enc-head ENC_HEAD]
                             [--dec-head DEC_HEAD] [--use-loc USE_LOC]
ipykernel_launcher.py: error: unrecognized arguments: --f="c:\Users\ICT CoC\AppData\Roaming\jupyter\runtime\kernel-v2-9076Ai3SvTmHtaLX.json"


SystemExit: 2

  warn("To exit: use 'exit', 'quit', or Ctrl-D.", stacklevel=1)


In [5]:
from test import inference
input_list = ['느그 서장 남천동 살제 ?','겅 행 빠젼','그놈은 그냥 미끼를 던져분 것이고 자네 딸래미는 고것을 확 물어분 것이여','고마해라 마이 묵었다 아이가']

mt_model = 

inference(,sp,device,input_list)

usage: ipykernel_launcher.py [-h] [--data-dir DATA_DIR] [--ckpt CKPT]
ipykernel_launcher.py: error: unrecognized arguments: --f="c:\Users\ICT CoC\AppData\Roaming\jupyter\runtime\kernel-v2-9076Ai3SvTmHtaLX.json"


SystemExit: 2

  warn("To exit: use 'exit', 'quit', or Ctrl-D.", stacklevel=1)
