<h1>Table of Contents<span class="tocSkip"></span></h1>
<div class="toc"><ul class="toc-item"><li><span><a href="#Google-Cloud-Speech-to-Text-API-Streaming-example" data-toc-modified-id="Google-Cloud-Speech-to-Text-API-Streaming-example-1">Google Cloud Speech-to-Text API Streaming example</a></span></li></ul></div>

# Google Cloud Speech-to-Text API Streaming example

- 1분 이상의 긴 오디오 파일을 Streaming 방식으로 처리하는 샘플
- https://cloud.google.com/speech-to-text/docs/streaming-recognize
- google.cloud.speech.SpeechClient().**streaming_recognize(streaming_config, requests)**
- **Audio file size limit : 10M bytes**

In [1]:
def transcribe_streaming(stream_file):
    import io

    """Streams transcription of the given audio file."""
    from google.cloud import speech
    from google.cloud.speech import enums
    from google.cloud.speech import types
    
    client = speech.SpeechClient()

    with io.open(stream_file, 'rb') as audio_file:
        content = audio_file.read()

    # In practice, stream should be a generator yielding chunks of audio data.
    stream = [content]

    requests = (types.StreamingRecognizeRequest(audio_content=chunk)
                for chunk in stream)

    config = types.RecognitionConfig(
        encoding=enums.RecognitionConfig.AudioEncoding.LINEAR16,
        sample_rate_hertz=16000,
        language_code='ko-KR',
        enable_automatic_punctuation=True)
    streaming_config = types.StreamingRecognitionConfig(config=config)

    # streaming_recognize returns a generator.
    responses = client.streaming_recognize(streaming_config, requests)

    for response in responses:
        # Once the transcription has settled, the first result will contain the
        # is_final result. The other results will be for subsequent portions of
        # the audio.
        
        for result in response.results:
            print('Finished: {}'.format(result.is_final))
            print('Stability: {}'.format(result.stability))
            alternatives = result.alternatives
            # The alternatives are ordered from most likely to least.
            for alternative in alternatives:
                print('Confidence: {}'.format(alternative.confidence))
                print(u'Transcript: {}'.format(alternative.transcript))

In [2]:
import os

# Request payload size limit: 10485760 bytes
stream_file = os.path.join(os.getcwd(), 'audio_file', '황금종려상자랑봉준호_3명인터뷰_YTN_16000.wav')
transcribe_streaming(stream_file)

Finished: True
Stability: 0.0
Confidence: 0.9069861769676208
Transcript: 출장을 또 고생했지만 아직 팀장과의 면담은 남아있는 상태지만 일정에 대해서 좀 소개를 해 주죠네 한국영화가 100주년을 기념하는 해인데 올해가 겹경사를 맞았어요. 우리나라 영화 중에 유일하게 칸 영화제 경쟁부분에 진출한 영화 기생충이 최고상인 황금종려상을 받은 건데요. 그 역사적인 현장에 있었기 때문에 현장 분위기와 함께 보고들은 거 좀 낱낱이 설명해드리려고 시상식 때 참석을 해 달라는 요청을 받았기 때문에 약간 기대하는 분위기가 있었을 것 같은데 어땠어요? 시상식에 참석해 달라는 말이 곧 수선 가시권에 들었다라는 똑같거든요. 칸영화제에서는 이게 우리나라의 같은 경우는 시상식에 참석한다고 해서 모든 이들에게 사무실 않잖아요. 언제 칸영화제는 시상식에 참석해 달라 이렇게 얘기를 하면 뭐 하나 받겠구나.
Finished: True
Stability: 0.0
Confidence: 0.9066632986068726
Transcript: 이렇게 기대를 해도 되는 그런 또 독특한 점은 관례가 있어요. 송강호 씨한테 제가 직접 들어보니까 정오부터 1시 사이에 연락이 온다고 하는데 12시 41분 쯤에 연락이 왔다고 해요. 40분 동안 2분의 굉장히 피말리는 순간이었다. 이렇게 얘기해도 했었고요. 그렇기 때문에 일단 그렇게 알고 나서는 어떤 이제 상을 받을것인가? 그거에 대해서 좀 많이 이제 기자들도 그렇고 많이 집중을 하게 되었다 거 같아요. 황금종려상으로 사실을 뽑힐 거라고 예상을 했었나요? 21일 극장에서 처음으로 배를 벗었는데 당시부터 좀 심상치 않기는 상실했습니다. 상영 중에 이례적으로 길이 박스에 버금가는 박수갈채가 나왔었는데요. 그 어떤 장면에서 그렇게 영화 상영 중인 영화 전반적으로 영화 1부와 2부로 나누는 좀게 중요한 거지 분기점이 되는 장면이 있어요. 근데 좀 슬랩스틱 돋보기는 그런 장면인데 그 장면을 끝나고 나자마자 정말 공감