<h1>Table of Contents<span class="tocSkip"></span></h1>
<div class="toc"><ul class="toc-item"><li><span><a href="#Google-Cloud-Speech-to-Text-API-Long_Running-example" data-toc-modified-id="Google-Cloud-Speech-to-Text-API-Long_Running-example-1">Google Cloud Speech-to-Text API Long_Running example</a></span></li></ul></div>

# Google Cloud Speech-to-Text API Long_Running example

- 긴 오디오 파일을 비동기 방식으로 처리하는 샘플
- **오디오 파일은 Google Cloud Storage에 업로드 후 사용**
- **오디오 파일 크기 제한은 없으나, 전체 파일을 모두 변환 후 응답을 받을 수 있음**
- https://cloud.google.com/speech-to-text/docs/async-recognize
- https://cloud.google.com/speech-to-text/docs/async-time-offsets
- Google Cloud Storage 설정 방법 : https://cloud.google.com/storage/docs/quickstart-console

In [1]:
"""Transcribe the given audio file asynchronously and output the word time offsets."""
from google.cloud import speech
from google.cloud.speech import enums
from google.cloud.speech import types

client = speech.SpeechClient()

gcs_uri = "gs://aiqa-stt/witch_hunt_2_online-audio-converter.com_16000.wav"

audio = types.RecognitionAudio(uri=gcs_uri)
config = types.RecognitionConfig(
    encoding=enums.RecognitionConfig.AudioEncoding.LINEAR16,
    sample_rate_hertz=16000,
    language_code='ko-KR',
    enable_automatic_punctuation=True,
    enable_word_time_offsets=True)

operation = client.long_running_recognize(config, audio)

In [2]:
print('Waiting for operation to complete...')
response = operation.result(timeout=360)
print('operation complete !!!')

Waiting for operation to complete...
operation complete !!!


In [3]:
type(response)

google.cloud.speech_v1.types.LongRunningRecognizeResponse

In [4]:
response.results[0]

alternatives {
  transcript: "\354\227\260\354\230\210\354\235\270 \354\244\221\354\227\220\354\204\234\353\217\204 \355\225\231\352\265\220 \354\225\210\353\202\264\353\260\251\354\206\241\354\235\204 \353\255\230 \355\225\230\352\262\214 \353\220\240 \354\235\274\354\235\264 \354\203\235\352\270\260\353\212\224 \353\247\211 \354\240\204\354\240\204\352\270\215\352\270\215\355\225\230\352\263\240 \354\226\230\352\270\260\355\225\264\354\204\234 \354\242\200 \353\271\274 \353\213\254\353\235\274 \353\202\230\353\212\224 \352\260\231\354\235\264 \354\247\200\352\270\210 \353\201\235\352\271\214\354\247\200 \352\267\270\353\237\260 \352\261\260 \354\241\260\354\213\254\355\225\230\353\212\224 \352\262\275\354\232\260\352\260\200 \354\236\210\352\263\240 \354\226\264\353\226\244 \353\266\204\353\223\244\354\235\200 \353\230\220 \354\262\234\354\227\260\353\215\225\354\212\244\353\237\275\352\262\214 \354\242\213\354\235\200 \352\267\200\354\260\256\352\263\240 \355\233\214\353\245\255\355

In [5]:
response.results[0].alternatives[0].transcript

'연예인 중에서도 학교 안내방송을 뭘 하게 될 일이 생기는 막 전전긍긍하고 얘기해서 좀 빼 달라 나는 같이 지금 끝까지 그런 거 조심하는 경우가 있고 어떤 분들은 또 천연덕스럽게 좋은 귀찮고 훌륭하게 대처하는 분들도 계시더라구요. 예 어때요 함께 방송에 나와요 뭐 예전에 잠깐 이렇게 사겼던 그럼 1월 사람인데 갑자기 많이 힘들죠 그냥 조금 안 맞는구나 세워진 가벼운 관계는 그래 우리 이모 친구는 계속 지내자 근데 정말 막 싸우고 막 그러다가 어쩔 수 없는 이유로 헤어졌으면 나중에 만났을 때 친구 잘 지내는가 이렇게 되는 거 이상한 거 아닌가요 잘 지내는가?'

In [6]:
response.results[0].alternatives[0].confidence

0.8978368639945984

In [7]:
print("start_time:", response.results[0].alternatives[0].words[0].start_time.seconds + \
      response.results[0].alternatives[0].words[0].start_time.nanos * 1e-9)

start_time: 0.0


In [8]:
print("end_time:", response.results[0].alternatives[0].words[-1].end_time.seconds + \
     response.results[0].alternatives[0].words[-1].end_time.seconds * 1e-9)

end_time: 57.000000057


In [9]:
for result in response.results:
    alternative = result.alternatives[0]
    print(u'Transcript: {}'.format(alternative.transcript))
    print('Confidence: {}'.format(alternative.confidence))

    start_time = alternative.words[0].start_time
    end_time = alternative.words[-1].end_time
    print('start_time: {} ~ end_time: {}'.format(start_time.seconds + start_time.nanos * 1e-9, \
            end_time.seconds + end_time.nanos * 1e-9))
    print()

Transcript: 연예인 중에서도 학교 안내방송을 뭘 하게 될 일이 생기는 막 전전긍긍하고 얘기해서 좀 빼 달라 나는 같이 지금 끝까지 그런 거 조심하는 경우가 있고 어떤 분들은 또 천연덕스럽게 좋은 귀찮고 훌륭하게 대처하는 분들도 계시더라구요. 예 어때요 함께 방송에 나와요 뭐 예전에 잠깐 이렇게 사겼던 그럼 1월 사람인데 갑자기 많이 힘들죠 그냥 조금 안 맞는구나 세워진 가벼운 관계는 그래 우리 이모 친구는 계속 지내자 근데 정말 막 싸우고 막 그러다가 어쩔 수 없는 이유로 헤어졌으면 나중에 만났을 때 친구 잘 지내는가 이렇게 되는 거 이상한 거 아닌가요 잘 지내는가?
Confidence: 0.8978368639945984
start_time: 0.0 ~ end_time: 57.6

Transcript: 좋아했던 사람 많은가 교통신호가 잘 안 되는 거예요 그냥 쉽게 쉽게 만나는 스타일이 수도 있을 거 같아요 근데 문제는이 여자가 딴 걸 못 해 그렇지 이런 데서 하는 거야이 말을 할 때 얼마나 많은게 맞는 얘기고 뭐 하는 얘기 아니야 지금 방송 생동하게 샘동이 헤어졌어요 상대방이 다시 연락 온 적 있어요 혹시 진짜 미친 거 같아 밤에 술 마시고 전화한 거야. 그러면서 막 약속할 수 없는 말들을 잡고 문자로 보내는 거예요 다음날 되면 꼭 해야 하거든 당연히 병원에 있어요 좀 받아 본 적이 있지요 기분이 되게 집 하지요 오빠 어디야 뭐 해 보고 싶어서 전화했지.
Confidence: 0.9091055393218994
start_time: 60.0 ~ end_time: 119.1

Transcript: 그렇지요 마이크가 어디야 씨가 그냥 지금 만나서 오늘 같이 있자 뭐 이런 느낌이었어요 그쵸 가지고 이렇게 만나서 세포를 풀 수 있겠죠 근데 없어 의미가 없고 하루 지나고 난 술도 깨고 나면 다 사라질 모든 탭 다 그런 경험 있지 않냐 술 취해서 전화한 거 그다음에 하는데 발신 열 두 번인데 0초 0초 0초 0초 12분 있잖아요 한참 술 먹었을 때 아침에 일어나자

In [10]:
# CSV 파일로 저장
import csv

with open('text/마녀사냥_Transcribe.csv', 'w', encoding='utf-8', newline='') as f:
    wr = csv.writer(f)
    wr.writerow(["start_time", "end_time", "transcript"])
    for result in response.results:
        alternative = result.alternatives[0]
        start_time = alternative.words[0].start_time.seconds + alternative.words[0].start_time.nanos * 1e-9
        end_time = alternative.words[-1].end_time.seconds + alternative.words[-1].end_time.nanos * 1e-9
        wr.writerow([start_time, end_time, alternative.transcript])

In [11]:
corpus = ""
for result in response.results:
    alternative = result.alternatives[0]
    corpus = corpus + alternative.transcript + " "

In [12]:
# !pip install nltk
import nltk
from nltk.tokenize import punkt
from nltk.tokenize import sent_tokenize

In [13]:
sentence = sent_tokenize(corpus)
len(sentence)

38

In [14]:
sentence

['연예인 중에서도 학교 안내방송을 뭘 하게 될 일이 생기는 막 전전긍긍하고 얘기해서 좀 빼 달라 나는 같이 지금 끝까지 그런 거 조심하는 경우가 있고 어떤 분들은 또 천연덕스럽게 좋은 귀찮고 훌륭하게 대처하는 분들도 계시더라구요.',
 '예 어때요 함께 방송에 나와요 뭐 예전에 잠깐 이렇게 사겼던 그럼 1월 사람인데 갑자기 많이 힘들죠 그냥 조금 안 맞는구나 세워진 가벼운 관계는 그래 우리 이모 친구는 계속 지내자 근데 정말 막 싸우고 막 그러다가 어쩔 수 없는 이유로 헤어졌으면 나중에 만났을 때 친구 잘 지내는가 이렇게 되는 거 이상한 거 아닌가요 잘 지내는가?',
 '좋아했던 사람 많은가 교통신호가 잘 안 되는 거예요 그냥 쉽게 쉽게 만나는 스타일이 수도 있을 거 같아요 근데 문제는이 여자가 딴 걸 못 해 그렇지 이런 데서 하는 거야이 말을 할 때 얼마나 많은게 맞는 얘기고 뭐 하는 얘기 아니야 지금 방송 생동하게 샘동이 헤어졌어요 상대방이 다시 연락 온 적 있어요 혹시 진짜 미친 거 같아 밤에 술 마시고 전화한 거야.',
 '그러면서 막 약속할 수 없는 말들을 잡고 문자로 보내는 거예요 다음날 되면 꼭 해야 하거든 당연히 병원에 있어요 좀 받아 본 적이 있지요 기분이 되게 집 하지요 오빠 어디야 뭐 해 보고 싶어서 전화했지.',
 '그렇지요 마이크가 어디야 씨가 그냥 지금 만나서 오늘 같이 있자 뭐 이런 느낌이었어요 그쵸 가지고 이렇게 만나서 세포를 풀 수 있겠죠 근데 없어 의미가 없고 하루 지나고 난 술도 깨고 나면 다 사라질 모든 탭 다 그런 경험 있지 않냐 술 취해서 전화한 거 그다음에 하는데 발신 열 두 번인데 0초 0초 0초 0초 12분 있잖아요 한참 술 먹었을 때 아침에 일어나자마자 처음 했던 거 핸드폰 확인했어요 누구한테 전화해 뜬지 누구한테 문자 보냈는지 그리고 무슨 사진 지르는지 사진도 찍어야 아니면 그냥 기억안날때 있는데 무슨 사진인지 술 먹고 싶네요.',
 '아니 근데 이렇게 보고 놀란 적이 있지요 왜 이런 사진 겁나게 왜 그런 거 

In [15]:
# 스크립트 만 Text 파일로 저장
with open('text/마녀사냥_Transcribe.txt', 'w', encoding='utf-8', newline='') as f:
    for sent in sentence:
        f.write(sent + "\n")