In [37]:
import os
import speech_recognition as sr
from pydub import AudioSegment
from pydub.exceptions import CouldntDecodeError
import pydub

def mp3_to_text(mp3_file_path, output_text_file):
    print("함수 시작")
    wav_file_path = "temp.wav"
    try:
        print(f"MP3 파일 경로: {mp3_file_path}")
        print("MP3 파일 변환 시작")
        audio = AudioSegment.from_mp3(mp3_file_path)
        audio.export(wav_file_path, format="wav")
        print("MP3 파일 변환 완료")

        print("음성 인식기 생성")
        recognizer = sr.Recognizer()

        print("WAV 파일 읽기 시작")
        with sr.AudioFile(wav_file_path) as source:
            audio_data = recognizer.record(source)
        print("WAV 파일 읽기 완료")

        print("음성 인식 시작")
        text = recognizer.recognize_google(audio_data, language="ko-KR")
    

        # 텍스트 파일로 저장
        with open(output_text_file, 'w', encoding='utf-8') as file:
            file.write(text)
        print(f"인식된 텍스트를 {output_text_file}에 저장했습니다.")

        return text

    except FileNotFoundError as e:
        print(f"파일을 찾을 수 없습니다: {e}")
    except CouldntDecodeError as e:
        print(f"오디오 파일을 디코딩할 수 없습니다: {e}")
    except sr.UnknownValueError:
        print("음성을 인식할 수 없습니다.")
    except sr.RequestError as e:
        print(f"Google 음성 인식 서비스 요청 오류: {e}")
    except Exception as e:
        print(f"예상치 못한 오류 발생: {type(e).__name__}, {str(e)}")
    finally:
        if os.path.exists(wav_file_path):
            os.remove(wav_file_path)
            print("임시 WAV 파일 삭제 완료")

# 함수 실행
print("프로그램 시작")
mp3_file_path = r"C:\Users\CAWCAW\강의자료\음성인식\data\Sample\01.원천데이터\gen\basi\C14782\U00001.wav"  # 실제 MP3 파일 경로로 변경하세요
output_text_file = "인식된_텍스트.txt"  # 출력될 텍스트 파일 이.름
mp3_to_text(mp3_file_path, output_text_file)
print("프로그램 종료")



프로그램 시작
함수 시작
MP3 파일 경로: C:\Users\CAWCAW\강의자료\음성인식\data\Sample\01.원천데이터\gen\basi\C14782\U00001.wav
MP3 파일 변환 시작
MP3 파일 변환 완료
음성 인식기 생성
WAV 파일 읽기 시작
WAV 파일 읽기 완료
음성 인식 시작
인식된 텍스트를 인식된_텍스트.txt에 저장했습니다.
임시 WAV 파일 삭제 완료
프로그램 종료
