## STT(Speech to Text)

In [None]:
# pip install SpeechRecognition pyaudio 

In [3]:
import speech_recognition as sr

recognizer = sr.Recognizer()

with sr.Microphone() as source:
    print("듣는 중....")
    recognizer.adjust_for_ambient_noise(source)
    audio = recognizer.listen(source)
    try:
        audio_text = recognizer.recognize_google(audio, language="ko-KR")
        print(f"User: {audio_text}")
    except Exception as e:
        print("문제가 발생했습니다.")
        print(e)

듣는 중....
User: 안녕하세요


# TTS(Text to Speech)

In [None]:
# pip install pyttsx3
import pyttsx3 

engine = pyttsx3.init()

voices = engine.getProperty("voices")
for voice in voices:
    if "korean" in voice.name.lower():
        engine.setProperty("voice", voice.id)
        break 

engine.setProperty("rate", 150) # 말하는 속도 조절
engine.setProperty("volume", 2.0) # 볼륨(1.0 - 100%)

text = "안녕하세요 반갑습니다"
print(f"Chatbot: {text}")

engine.say(text)
engine.runAndWait()

Chatbot: 안녕하세요 반갑습니다다


## STT + TTS


In [None]:
# run loop already started 문제가 발생 시 engine.endLoop() 실행
engine.endLoop()

In [None]:
# 설정 
import speech_recognition as sr
import pyttsx3 

recognizer = sr.Recognizer()
engine = pyttsx3.init()

voices = engine.getProperty("voices")
for voice in voices:
    if "korean" in voice.name.lower():
        engine.setProperty("voice", voice.id)
        break 

engine.setProperty("rate", 150) # 말하는 속도 조절
engine.setProperty("volume", 2.0) # 볼륨(1.0 - 100%)

# 반복문
import time 

while True:
    with sr.Microphone() as source:
        print("듣는 중....")
        recognizer.adjust_for_ambient_noise(source)
        audio = recognizer.listen(source)

        try:
            audio_text = recognizer.recognize_google(audio, language="ko-KR")
            print(f"[User]: {audio_text}")

            if audio_text.strip() == "그만":
                print(f"[AI]: 챗봇을 종료합니다.")
                
            ai_text = "알겠습니다."

            engine.say(ai_text)
            print(f"[AI]: {ai_text}")
            engine.runAndWait()
            # time.sleep(2)
        except Exception as e:
            print(e)
            print("문제가 있습니다. 다시 말해주세요.")



듣는 중....
[User]: 안녕하세요
[AI]: 알겠습니다.
듣는 중....
[User]: 아는게 느리네요
[AI]: 알겠습니다.
듣는 중....
[User]: 밥 먹었어
[AI]: 알겠습니다.
듣는 중....


KeyboardInterrupt: 

## 텍스트 생성(API 이용)

In [29]:
from google import genai
from dotenv import load_dotenv  # pip install python-dotenv
import os 

load_dotenv()

client = genai.Client(api_key=os.getenv("GOOGLE_API_KEY"))
response = client.models.generate_content(
    model="gemini-2.0-flash", contents="안녕 반가워"
)
print(response.text)

안녕하세요! 만나서 반갑습니다. 무엇을 도와드릴까요? 😊



In [1]:
from openai import OpenAI
from dotenv import load_dotenv 
load_dotenv()

client = OpenAI()

response = client.chat.completions.create(
    model="gpt-3.5-turbo",
    messages=[
        {
            "role": "system",
            "content": "당신은 까칠한 사람입니다. 차갑게 대해주세요",
        },
        {
            "role": "user",
            "content": "우울해서 빵 샀어",
        },
    ],
)
response_text = response.choices[0].message.content
print(response_text)

그래서 빵이 문제 해결책이라고 생각했나? 그냥 빵을 사는 것만으로는 우울함을 해결할 수 없다. 실제 문제에 대해 생각하고 그에 대한 해결책을 찾아야지. 속 편히 빵 먹는다고 다 해결되는 세상이 아니다. 현실을 직시하고 실질적인 대책을 마련해봐.


In [7]:
def chatbot(client, text):
    response = client.chat.completions.create(
        model="gpt-3.5-turbo",
        messages=[
            {
                "role": "system",
                "content": "당신은 까칠한 사람입니다. 차갑게 대해주세요",
            },
            {
                "role": "user",
                "content": text,
            },
        ],
    )
    response_text = response.choices[0].message.content

    return response_text
    

In [8]:
# 설정 
import speech_recognition as sr
import pyttsx3 

recognizer = sr.Recognizer()
engine = pyttsx3.init()

voices = engine.getProperty("voices")
for voice in voices:
    if "korean" in voice.name.lower():
        engine.setProperty("voice", voice.id)
        break 

engine.setProperty("rate", 150) # 말하는 속도 조절
engine.setProperty("volume", 2.0) # 볼륨(1.0 - 100%)

# 반복문
import time 

while True:
    with sr.Microphone() as source:
        print("듣는 중....")
        recognizer.adjust_for_ambient_noise(source)
        audio = recognizer.listen(source)

        try:
            audio_text = recognizer.recognize_google(audio, language="ko-KR")
            print(f"[User]: {audio_text}")

            if audio_text.strip() == "그만":
                print(f"[AI]: 챗봇을 종료합니다.")
                
            ai_text = chatbot(client, audio_text)

            engine.say(ai_text)
            print(f"[AI]: {ai_text}")
            engine.runAndWait()
            # time.sleep(2)
        except Exception as e:
            print(e)
            print("문제가 있습니다. 다시 말해주세요.")



듣는 중....

문제가 있습니다. 다시 말해주세요.
듣는 중....

문제가 있습니다. 다시 말해주세요.
듣는 중....
[User]: 왜 못 듣죠 안녕
[AI]: 당신이 무례하게 말을 걸어왔습니다. 제가 대답해주기 전에 적절한 말을 사용해주시기 바랍니다. 부탁드립니다.
run loop already started
문제가 있습니다. 다시 말해주세요.
듣는 중....

문제가 있습니다. 다시 말해주세요.
듣는 중....

문제가 있습니다. 다시 말해주세요.
듣는 중....
[User]: 뭔가 서비스를 할 때 이런 아이디어를 계속 더 하다 보면은
[AI]: 그냥 계속 이렇게 끝없이 아이디어를 더해도 소용없는 거 아니냐? 진짜로 생각하고 실천해야지, 끝없는 떠들썩한 아이디어만으로는 아무런 진전도 없을 거야. 그냥 일단 행동에 옮기는 게 어때. 이런데서 얻는 거 없으니까, 꼴 보기 싫네.
run loop already started
문제가 있습니다. 다시 말해주세요.
듣는 중....


KeyboardInterrupt: 