In [1]:
import os
from pysurveycto import SurveyCTOObject
from dotenv import load_dotenv

In [2]:
load_dotenv()
scto = SurveyCTOObject(
    server_name = os.getenv("SCTO_server"), 
    username    = os.getenv("SCTO_user"), 
    password    = os.getenv("SCTO_password")
)

In [3]:
data = scto.get_form_data(
    form_id     = "llamadas", 
    format      = "csv"
)

In [4]:
import pandas as pd
from io import StringIO

df = pd.read_csv(StringIO(data))

In [5]:
url = df["llamada"].iloc[0]
url

'https://tutoriastel.surveycto.com/view/submission-attachment/1739502374447.m4a?blobKey=2'

In [6]:
audio_bytes = scto.get_attachment(url)

In [7]:
import ffmpeg
import tempfile

# Save bytes to a temp file
with tempfile.NamedTemporaryFile(delete=False, suffix=".mp3") as temp_audio:
    temp_audio.write(audio_bytes)
    temp_audio_path = temp_audio.name

# Play audio using ffplay (part of ffmpeg)
import os
os.system(f'ffplay -nodisp -autoexit {temp_audio_path}')


ffplay version 7.1 Copyright (c) 2003-2024 the FFmpeg developers
  built with Apple clang version 16.0.0 (clang-1600.0.26.4)
  configuration: --prefix=/opt/homebrew/Cellar/ffmpeg/7.1_4 --enable-shared --enable-pthreads --enable-version3 --cc=clang --host-cflags= --host-ldflags='-Wl,-ld_classic' --enable-ffplay --enable-gnutls --enable-gpl --enable-libaom --enable-libaribb24 --enable-libbluray --enable-libdav1d --enable-libharfbuzz --enable-libjxl --enable-libmp3lame --enable-libopus --enable-librav1e --enable-librist --enable-librubberband --enable-libsnappy --enable-libsrt --enable-libssh --enable-libsvtav1 --enable-libtesseract --enable-libtheora --enable-libvidstab --enable-libvmaf --enable-libvorbis --enable-libvpx --enable-libwebp --enable-libx264 --enable-libx265 --enable-libxml2 --enable-libxvid --enable-lzma --enable-libfontconfig --enable-libfreetype --enable-frei0r --enable-libass --enable-libopencore-amrnb --enable-libopencore-amrwb --enable-libopenjpeg --enable-libspeex --e

31488

In [9]:
import assemblyai as aai

load_dotenv()
aai.settings.api_key = os.getenv("aai_key")

target       = "audio_session_4"
audio_file   = f"../recordings/{target}.wav"
# speech_model = aai.SpeechModel.best
speech_model = aai.SpeechModel.nano
n_speakers   = 3
language     = "es"

In [10]:
config = aai.TranscriptionConfig(
    speech_model      = speech_model,
    speaker_labels    = True,
    speakers_expected = n_speakers,
    language_code     = language
)

transcriber = aai.Transcriber()
transcript = transcriber.transcribe(
  temp_audio_path,
  config = config
)

In [11]:
transcript_best = [f"Speaker {utterance.speaker}: {utterance.text}" for utterance in transcript.utterances]
full_transcript = "\n".join(transcript_best)

In [12]:
full_transcript

'Speaker A: ¿Hola, qué tal profa much bien? Sí, ahora sí. ¿Qué tal? ¿Cómo estás, señor Luis?\nSpeaker B: Muy bien, acá ya todoce conoc cuadenito.\nSpeaker A: Me alegra. Le quiero comunicar que esta llamada va a ser grabada para que esté en conocimiento y también para que pueda colocar en altavoz su teléfono.\nSpeaker B: Muy ahora voy a colocar está bien, porque noi ya me comentó eso también. Entonces vamos a avanzar.\nSpeaker A: Está bieno cualquier cosita, si tenemos problema.\nSpeaker B: Con la señal para intentar llamar a la otra el niño, pero si nos escucha bien, entonces podemos avanzar con este.\nSpeaker A: ¿Ok? Está bien. Bueno, está por ahí Benjam Benjamín. Hola. Hola, Benjamín. ¿Cómo estás?\nSpeaker C: ¿Bien?\nSpeaker A: Qué suerte. ¿Ya estás preparado? ¿Estás listo? ¿Tens tu cuadernito? Qué suerte. Me alegra. ¿Bueno, decimos un poquito primero cómo pasó tu semana? ¿Qué tal? ¿Estuviste practicando? ¿Estuviste practicando? Qué suerte. ¿Bueno, yo entonces te voy a dictar unos nu