# 음성 인식: STT(Speech-to-Text)

### 구글 API 문서: https://developers.kakao.com/docs/latest/ko/voice/rest-api

###  사람이 말하는 음성 언어를 텍스트로 변환하는 서비스

### 음성이 인식 될 때마다 중간 인식 결과를 반환

### 음성이 끝날 때 최종 인식 결과를 반환

### 음성 데이터는 Mono channel, 16000 Hz samplerate, 16 bit depth인 RAW PCM 포맷만 지원

### 음성 데이터를 POST로 전송

### 실시간 또는 크기가 큰 음성 파일의 전송은 Transfer-Encoding: chunked 헤더를 추가하고, chunk 단위로 전송

### Request 
```
POST /v1/recognize HTTP/1.1
Host: kakaoi-newtone-openapi.kakao.com
Transfer-Encoding: chunked
Content-Type: application/octet-stream
Authorization: KakaoAK {REST_API_KEY}
```

## 1. 모듈 가져오기

In [24]:
import requests
import json
import speech_recognition as sr

## 2. Request 파라미터 설정

In [25]:
url = "https://kakaoi-newtone-openapi.kakao.com/v1/recognize"
key = "58df5a2afd5c776e6d4e95f5cabf709e"
headers = {
    "Content-Type": "application/octet-stream",
    "Authorization": "KakaoAK " + key,
}

## 3. 음성 녹음 함수

In [26]:
def RecordVoice():
    r = sr.Recognizer()
    with sr.Microphone(sample_rate=16000) as source:
        print("Speak Anything :")
        audio = r.listen(source)
        return audio

## 4. 함수 테스트

### 1) 음성 녹음
### 2) 음성 데이터 전송 => 텍스트로 변환된 데이터 수신
### 3) 텍스트 출력

In [27]:
if __name__ == "__main__":
    audio = RecordVoice()
    res = requests.post(url, headers=headers, data=audio.get_raw_data())
    print(res.text)

Speak Anything :
------newtone43Rec5ZJF5N9v8fi
Content-Type: application/json; charset=UTF-8

{"type":"beginPointDetection","value":"BPD"}
------newtone43Rec5ZJF5N9v8fi
Content-Type: application/json; charset=UTF-8

{"type":"partialResult","value":"한"}
------newtone43Rec5ZJF5N9v8fi
Content-Type: application/json; charset=UTF-8

{"type":"partialResult","value":"안녕하세요"}
------newtone43Rec5ZJF5N9v8fi
Content-Type: application/json; charset=UTF-8

{"type":"partialResult","value":"안녕하세요 오늘"}
------newtone43Rec5ZJF5N9v8fi
Content-Type: application/json; charset=UTF-8

{"type":"partialResult","value":"안녕하세요 오늘은"}
------newtone43Rec5ZJF5N9v8fi
Content-Type: application/json; charset=UTF-8

{"type":"partialResult","value":"안녕하세요 오늘은 토요일"}
------newtone43Rec5ZJF5N9v8fi
Content-Type: application/json; charset=UTF-8

{"type":"endPointDetection","value":"EPD"}
------newtone43Rec5ZJF5N9v8fi
Content-Type: application/json; charset=UTF-8
Speech-Length: 3

{"type":"finalResult","value":"안녕하세요 오늘은 토요일입니

In [29]:
    json_string = res.text[res.text.index('{"type":"finalResult"'):res.text.rindex('}')+1]
    result = json.loads(json_string)['value']
    print(result)

안녕하세요 오늘은 토요일입니다
