In [3]:
pip install opencv-python numpy pyautogui pyaudio wave

Collecting opencv-pythonNote: you may need to restart the kernel to use updated packages.

  Downloading opencv_python-4.11.0.86-cp37-abi3-win_amd64.whl.metadata (20 kB)
Collecting numpy
  Downloading numpy-2.2.2-cp313-cp313-win_amd64.whl.metadata (60 kB)
Collecting pyautogui
  Using cached PyAutoGUI-0.9.54.tar.gz (61 kB)
  Installing build dependencies: started
  Installing build dependencies: finished with status 'done'
  Getting requirements to build wheel: started
  Getting requirements to build wheel: finished with status 'done'
  Preparing metadata (pyproject.toml): started
  Preparing metadata (pyproject.toml): finished with status 'done'
Collecting pyaudio
  Downloading PyAudio-0.2.14-cp313-cp313-win_amd64.whl.metadata (2.7 kB)
Collecting wave
  Downloading Wave-0.0.2.zip (38 kB)
  Preparing metadata (setup.py): started
  Preparing metadata (setup.py): finished with status 'done'
Collecting pymsgbox (from pyautogui)
  Using cached PyMsgBox-1.0.9.tar.gz (18 kB)
  Installing buil

In [4]:
pip list

Package                   VersionNote: you may need to restart the kernel to use updated packages.

------------------------- --------------
anyio                     4.8.0
argon2-cffi               23.1.0
argon2-cffi-bindings      21.2.0
arrow                     1.3.0
asttokens                 3.0.0
async-lru                 2.0.4
attrs                     25.1.0
babel                     2.16.0
beautifulsoup4            4.12.3
bleach                    6.2.0
certifi                   2024.12.14
cffi                      1.17.1
charset-normalizer        3.4.1
colorama                  0.4.6
comm                      0.2.2
debugpy                   1.8.12
decorator                 5.1.1
defusedxml                0.7.1
executing                 2.2.0
fastjsonschema            2.21.1
fqdn                      1.5.1
h11                       0.14.0
httpcore                  1.0.7
httpx                     0.28.1
idna                      3.10
ipykernel                 6.29.5
ipython     

In [3]:
import cv2
import numpy as np
import mss
import pyaudio
import wave
import threading
import time

In [10]:
def record_screen(stop_event, video_filename, fps=20.0, monitor_index=1):
    """
    화면을 캡처하여 영상 파일로 저장하는 함수입니다.
    
    Args:
        stop_event (threading.Event): 녹화 중지를 알리는 이벤트.
        video_filename (str): 저장할 영상 파일 이름 (예: "output_video.avi").
        fps (float): 초당 프레임 수.
        monitor_index (int): 캡처할 모니터 인덱스 (mss에서는 1부터 시작).
    """
    with mss.mss() as sct:
        # 기본 모니터를 선택 (여러 모니터가 있을 경우 index 선택)
        monitor = sct.monitors[monitor_index]
        width = monitor["width"]
        height = monitor["height"]

        # OpenCV VideoWriter 설정 (XVID 코덱 사용)
        fourcc = cv2.VideoWriter_fourcc(*"XVID")
        out = cv2.VideoWriter(video_filename, fourcc, fps, (width, height))
        
        print("화면 녹화를 시작합니다...")
        last_time = time.time()
        while not stop_event.is_set():
            # 모니터 전체 캡처
            img = np.array(sct.grab(monitor))
            # mss는 기본적으로 BGRA 형식이므로 BGR로 변환
            frame = cv2.cvtColor(img, cv2.COLOR_BGRA2BGR)
            out.write(frame)
            
            # FPS를 맞추기 위한 딜레이 계산
            elapsed = time.time() - last_time
            sleep_time = max(0, 1/fps - elapsed)
            time.sleep(sleep_time)
            last_time = time.time()

        out.release()
        print("화면 녹화가 종료되었습니다.")

def record_audio(stop_event, audio_filename, channels=2, rate=44100, frames_per_buffer=1024):
    """
    마이크 입력을 녹음하여 WAV 파일로 저장하는 함수입니다.
    
    Args:
        stop_event (threading.Event): 녹음 중지를 알리는 이벤트.
        audio_filename (str): 저장할 오디오 파일 이름 (예: "output_audio.wav").
        channels (int): 채널 수.
        rate (int): 샘플링 레이트 (Hz).
        frames_per_buffer (int): 버퍼 크기.
    """
    p = pyaudio.PyAudio()
    stream = p.open(format=pyaudio.paInt16,
                    channels=channels,
                    rate=rate,
                    input=True,
                    frames_per_buffer=frames_per_buffer)
    frames = []
    print("오디오 녹음을 시작합니다...")
    while not stop_event.is_set():
        # exception_on_overflow=False로 설정하여 오버플로우 예외 방지
        data = stream.read(frames_per_buffer, exception_on_overflow=False)
        frames.append(data)

    stream.stop_stream()
    stream.close()
    p.terminate()

    wf = wave.open(audio_filename, "wb")
    wf.setnchannels(channels)
    wf.setsampwidth(p.get_sample_size(pyaudio.paInt16))
    wf.setframerate(rate)
    wf.writeframes(b"".join(frames))
    wf.close()
    print("오디오 녹음이 종료되었습니다.")

def main():
    video_filename = "output_video.avi"
    audio_filename = "output_audio.wav"
    stop_event = threading.Event()

    # 별도의 스레드에서 화면 녹화와 오디오 녹음을 실행합니다.
    video_thread = threading.Thread(target=record_screen, args=(stop_event, video_filename))
    audio_thread = threading.Thread(target=record_audio, args=(stop_event, audio_filename))
    
    video_thread.start()
    audio_thread.start()
    
    print("녹화를 진행 중입니다. 중지하려면 Ctrl+C를 누르세요...")
    try:
        # 메인 스레드에서 대기
        while True:
            time.sleep(1)
    except KeyboardInterrupt:
        print("\n녹화를 중지합니다...")
        stop_event.set()
    
    video_thread.join()
    audio_thread.join()
    
    print("녹화가 완료되었습니다.")
    print(f"영상 파일: {video_filename}")
    print(f"오디오 파일: {audio_filename}")
    print("\n두 파일을 하나로 합치려면 ffmpeg 등을 이용할 수 있습니다. 예:")
    print(f"  ffmpeg -y -i {video_filename} -i {audio_filename} -c:v copy -c:a aac output_merged.mp4")

if __name__ == "__main__":
    main()


Exception in thread Thread-7 (record_screen):
Traceback (most recent call last):
  File [35m"C:\anaconda3\envs\videoenv\Lib\threading.py"[0m, line [35m1041[0m, in [35m_bootstrap_inner[0m
    [31mself.run[0m[1;31m()[0m
    [31m~~~~~~~~[0m[1;31m^^[0m
  File [35m"C:\anaconda3\envs\videoenv\Lib\site-packages\ipykernel\ipkernel.py"[0m, line [35m766[0m, in [35mrun_closure[0m
    [31m_threading_Thread_run[0m[1;31m(self)[0m
    [31m~~~~~~~~~~~~~~~~~~~~~[0m[1;31m^^^^^^[0m
  File [35m"C:\anaconda3\envs\videoenv\Lib\threading.py"[0m, line [35m992[0m, in [35mrun[0m
    [31mself._target[0m[1;31m(*self._args, **self._kwargs)[0m
    [31m~~~~~~~~~~~~[0m[1;31m^^^^^^^^^^^^^^^^^^^^^^^^^^^^^[0m
  File [35m"C:\Users\손민구\AppData\Local\Temp\ipykernel_24512\3583464412.py"[0m, line [35m26[0m, in [35mrecord_screen[0m
    img = pyautogui.screenshot()  # 화면 캡처
  File [35m"C:\anaconda3\envs\videoenv\Lib\site-packages\pyautogui\__init__.py"[0m, line [35m228[0m, in

🎥 녹화를 시작했습니다. 중지하려면 Enter를 누르세요...
 


✅ 화면과 오디오 녹화가 완료되었습니다.
✅ 최종 파일 저장 완료: final_output.mp4


In [3]:
import pyaudio

p = pyaudio.PyAudio()
for i in range(p.get_device_count()):
    dev = p.get_device_info_by_index(i)
    print(f"Index: {i}, Name: {dev['name']}, Host API: {dev['hostApi']}, "
          f"Input Channels: {dev['maxInputChannels']}")
p.terminate()


Index: 0, Name: Microsoft 사운드 매퍼 - Input, Host API: 0, Input Channels: 2
Index: 1, Name: 스테레오 믹스(Realtek(R) Audio), Host API: 0, Input Channels: 2
Index: 2, Name: Microsoft 사운드 매퍼 - Output, Host API: 0, Input Channels: 0
Index: 3, Name: 헤드폰(WH-1000XM4), Host API: 0, Input Channels: 0
Index: 4, Name: 스피커(Realtek(R) Audio), Host API: 0, Input Channels: 0
Index: 5, Name: TFG32Q14F(NVIDIA High Definitio, Host API: 0, Input Channels: 0
Index: 6, Name: 스피커(Scarlett Solo USB), Host API: 0, Input Channels: 0
Index: 7, Name: 주 사운드 캡처 드라이버, Host API: 1, Input Channels: 2
Index: 8, Name: 스테레오 믹스(Realtek(R) Audio), Host API: 1, Input Channels: 2
Index: 9, Name: 주 사운드 드라이버, Host API: 1, Input Channels: 0
Index: 10, Name: 헤드폰(WH-1000XM4), Host API: 1, Input Channels: 0
Index: 11, Name: 스피커(Realtek(R) Audio), Host API: 1, Input Channels: 0
Index: 12, Name: TFG32Q14F(NVIDIA High Definition Audio), Host API: 1, Input Channels: 0
Index: 13, Name: 스피커(Scarlett Solo USB), Host API: 1, Input Channels: 0
In

In [4]:
import pyaudio

p = pyaudio.PyAudio()

# WASAPI 호스트 API 정보 가져오기
try:
    wasapi_info = p.get_host_api_info_by_type(pyaudio.paWASAPI)
    print("WASAPI 호스트 API 정보:")
    print(wasapi_info)
except Exception as e:
    print("WASAPI 호스트 API 정보를 가져올 수 없습니다:", e)
    p.terminate()
    exit()

# WASAPI를 사용하는 장치들을 출력
wasapi_index = wasapi_info['index']
print("\nWASAPI를 사용하는 장치 목록:")
for i in range(p.get_device_count()):
    device = p.get_device_info_by_index(i)
    if device['hostApi'] == wasapi_index:
        print(f"Index: {i}, Name: {device['name']}, Input Channels: {device['maxInputChannels']}")
        
p.terminate()


WASAPI 호스트 API 정보:
{'index': 2, 'structVersion': 1, 'type': 13, 'name': 'Windows WASAPI', 'deviceCount': 5, 'defaultInputDevice': 18, 'defaultOutputDevice': 17}

WASAPI를 사용하는 장치 목록:
Index: 14, Name: 스피커(Realtek(R) Audio), Input Channels: 0
Index: 15, Name: TFG32Q14F(NVIDIA High Definition Audio), Input Channels: 0
Index: 16, Name: 스피커(Scarlett Solo USB), Input Channels: 0
Index: 17, Name: 헤드폰(WH-1000XM4), Input Channels: 0
Index: 18, Name: 스테레오 믹스(Realtek(R) Audio), Input Channels: 2


In [5]:
import pyaudio

p = pyaudio.PyAudio()

# WASAPI 호스트 API 정보 가져오기
try:
    wasapi_info = p.get_host_api_info_by_type(pyaudio.paWASAPI)
    wasapi_index = wasapi_info['index']
except Exception as e:
    print("WASAPI 호스트 API 정보를 가져올 수 없습니다:", e)
    p.terminate()
    exit()

# WASAPI를 사용하는 장치 중, 입력 채널이 있는 장치를 찾기
loopback_device_index = None
for i in range(p.get_device_count()):
    device = p.get_device_info_by_index(i)
    if device['hostApi'] == wasapi_index and device['maxInputChannels'] > 0:
        # 보통 WASAPI 루프백은 출력 장치의 입력 채널로 표시됩니다.
        loopback_device_index = i
        break

if loopback_device_index is None:
    print("WASAPI 루프백에 사용할 수 있는 장치를 찾지 못했습니다.")
    p.terminate()
    exit()

print(f"WASAPI 루프백 장치로 사용할 장치 인덱스: {loopback_device_index}")

# 스트림 열기 시도 (as_loopback 옵션 사용)
try:
    stream = p.open(
        format=pyaudio.paInt16,
        channels=2,
        rate=44100,
        input=True,
        frames_per_buffer=1024,
        input_device_index=loopback_device_index,
        as_loopback=True  # WASAPI 루프백 모드 활성화
    )
    print("WASAPI 루프백 스트림이 성공적으로 열렸습니다.")
    stream.close()
except Exception as e:
    print("WASAPI 루프백 스트림을 열 수 없습니다:", e)

p.terminate()


WASAPI 루프백 장치로 사용할 장치 인덱스: 18
WASAPI 루프백 스트림을 열 수 없습니다: PyAudio.Stream.__init__() got an unexpected keyword argument 'as_loopback'


In [4]:
import sounddevice as sd
import soundfile as sf

In [13]:
# 녹음 설정
duration = 10  # 녹음 시간 (초)
fs = 48000     # 샘플링 레이트
channels = 2   # 채널 수

# 장치 목록 출력: WASAPI 루프백 장치가 있는지 확인합니다.
print(sd.query_devices())

# WASAPI 루프백 모드에서 사용할 장치 인덱스를 설정합니다.
# (출력된 장치 목록에서 "Loopback"이 포함된 장치를 선택하세요)
loopback_device_index = 17  # 예시 인덱스 (실제 시스템에 맞게 변경)

# 녹음 시작 (WASAPI 루프백 장치 사용)
print("녹음 시작...")
recording = sd.rec(int(duration * fs), samplerate=fs, channels=channels, device=loopback_device_index)
sd.wait()  # 녹음이 끝날 때까지 대기
print("녹음 완료.")

# 녹음 파일로 저장
sf.write('output.wav', recording, fs)
print("파일 저장: output.wav")

   0 Microsoft 사운드 매퍼 - Input, MME (2 in, 0 out)
>  1 스테레오 믹스(Realtek(R) Audio), MME (2 in, 0 out)
   2 Microsoft 사운드 매퍼 - Output, MME (0 in, 2 out)
<  3 헤드폰(WH-1000XM4), MME (0 in, 2 out)
   4 스피커(Realtek(R) Audio), MME (0 in, 8 out)
   5 TFG32Q14F(NVIDIA High Definitio, MME (0 in, 2 out)
   6 스피커(Scarlett Solo USB), MME (0 in, 2 out)
   7 주 사운드 캡처 드라이버, Windows DirectSound (2 in, 0 out)
   8 스테레오 믹스(Realtek(R) Audio), Windows DirectSound (2 in, 0 out)
   9 주 사운드 드라이버, Windows DirectSound (0 in, 2 out)
  10 헤드폰(WH-1000XM4), Windows DirectSound (0 in, 2 out)
  11 스피커(Realtek(R) Audio), Windows DirectSound (0 in, 8 out)
  12 TFG32Q14F(NVIDIA High Definition Audio), Windows DirectSound (0 in, 2 out)
  13 스피커(Scarlett Solo USB), Windows DirectSound (0 in, 2 out)
  14 스피커(Realtek(R) Audio), Windows WASAPI (0 in, 2 out)
  15 TFG32Q14F(NVIDIA High Definition Audio), Windows WASAPI (0 in, 2 out)
  16 스피커(Scarlett Solo USB), Windows WASAPI (0 in, 2 out)
  17 헤드폰(WH-1000XM4), Windows WASAPI (0 

PortAudioError: Error opening InputStream: Invalid number of channels [PaErrorCode -9998]

In [15]:
import sounddevice as sd

device_info = sd.query_devices(16)
print(device_info)

{'name': '스피커(Scarlett Solo USB)', 'index': 16, 'hostapi': 2, 'max_input_channels': 0, 'max_output_channels': 2, 'default_low_input_latency': 0.0, 'default_low_output_latency': 0.003, 'default_high_input_latency': 0.0, 'default_high_output_latency': 0.01, 'default_samplerate': 44100.0}
