Una aplicación moderna y profesional para convertir archivos de audio a texto utilizando reconocimiento de voz mediante Google Speech Recognition API.
- ✅ Soporte para archivos MP3 y WAV
- ✅ Reconocimiento de voz automático
- ✅ Barra de progreso en tiempo real
- ✅ Cancelación de conversión en curso
- ✅ Interfaz amigable y responsiva
- 🌍 8 idiomas soportados:
- Español (es-ES)
- Inglés (en-US)
- Francés (fr-FR)
- Alemán (de-DE)
- Italiano (it-IT)
- Portugués (pt-BR)
- Japonés (ja-JP)
- Chino Simplificado (zh-CN)
- 🌍 Transcripción milimétrica en todos los idiomas: la aplicación detecta el idioma real del audio y retranscribe automáticamente para máxima precisión.
- 🧠 Detección automática de idioma y retranscripción precisa.
- ⚙️ Selector de idioma antes de convertir
- 💾 Configuración persistente
- ✏️ Modo edición activable/desactivable
- 🔍 Búsqueda y reemplazo de texto (Ctrl+H)
- 📊 Contador de palabras y caracteres
- 📋 Copiar al portapapeles (Ctrl+C)
- ↩️ Deshacer/Rehacer
- 📄 Texto plano (.txt)
- 📕 Documento Word (.docx)
- 📑 PDF (.pdf)
- 🔤 Markdown (.md)
- 📜 Guarda las últimas 20 conversiones
- 🔄 Restaurar conversiones previas
- 📊 Información detallada (fecha, archivo, vista previa, cantidad de palabras)
- 🗑️ Limpiar historial completo
- ⏱️ Duración del archivo de audio
- 📝 Cantidad de palabras extraídas
- 🔤 Cantidad de caracteres
- 🎯 Idioma detectado
- 📈 Confianza del reconocimiento
- ⚡ Tiempo de procesamiento
- 🎨 Tema oscuro profesional
- 📱 Interfaz maximizada por defecto
- 🖱️ Soporte para Drag & Drop (arrastra archivos)
- ⌨️ Atajos de teclado
- 📋 Menú completo y intuitivo
- 🖼️ Icono personalizado
| Atajo | Función |
|---|---|
| Ctrl+O | Abrir audio |
| Ctrl+S | Guardar texto |
| Ctrl+C | Copiar texto |
| Ctrl+H | Buscar y reemplazar |
| Ctrl+Q | Salir |
- Python 3.10 o superior
- Windows, macOS o Linux
- Conexión a Internet (para reconocimiento de voz)
- Micrófono (opcional, para grabar audio en tiempo real)
SpeechRecognition=3.14.0
moviepy=2.1.2
PyQt6=6.8.0
python-docx=0.8.11
reportlab=4.0.9
markdown=3.5.1
git clone https://github.com/tu-usuario/ConvertidorAudio-Texto.git
cd ConvertidorAudio-Textopython -m venv venvEn Windows:
venv\Scripts\activateEn macOS/Linux:
source venv/bin/activatepip install -r requirements.txtpython gui.py- Haz clic en "Cargar audio" o arrastra un archivo a la ventana
- Selecciona el idioma en el menú desplegable
- Haz clic en "Convertir"
- Espera a que se complete la conversión
- El texto aparecerá en el área de texto
- Haz clic en "Guardar" o usa Ctrl+S
- Selecciona el formato y ubicación
- El archivo se guardará en la ubicación especificada
- Ve a Ver → Historial de conversiones
- Selecciona una conversión anterior
- Haz clic en "Restaurar" para cargar el texto
ConvertidorAudio-Texto/
│
├── gui.py # Interfaz gráfica principal
├── converter.py # Lógica de conversión de audio
├── styles.py # Estilos CSS/PyQt6
├── config.py # Gestión de configuración
├── history.py # Gestión del historial
├── requirements.txt # Dependencias del proyecto
├── setup.py # Script de instalación
├── README.md # Este archivo
├── CHANGELOG.md # Historial de versiones
├── favicon.ico # Icono de la aplicación
└── config.json # Configuración persistente (creado en ejecución)
La configuración se guarda automáticamente en config.json:
{
"language": "es-ES",
"max_duration": 300,
"auto_save": true,
"window_geometry": null,
"last_path": "C:\\Users\\Usuario\\Documents"
}- Ve a Herramientas → Configuración
- Modifica los parámetros deseados
- Haz clic en "Guardar"
- Comprueba que la conexión a Internet esté activa
- Verifica que el audio sea claro y en el idioma configurado
- Intenta con otro archivo de audio
- Asegúrate de que el archivo es MP3 o WAV
- Verifica que el archivo no está corrupto
- Intenta renombrar el archivo sin caracteres especiales
pip install --upgrade -r requirements.txt- Cierra otras aplicaciones
- Intenta con un archivo de audio más pequeño
- Comprueba la velocidad de Internet
- Google Speech Recognition: Utilizado para el reconocimiento de voz
- PyQt6: Framework para la interfaz gráfica
- MoviePy: Para conversión de formatos de audio
Este proyecto está bajo la licencia MIT. Ver el archivo LICENSE para más detalles.
Desarrollado por tu nombre/equipo
Las contribuciones son bienvenidas. Por favor:
- Fork el proyecto
- Crea una rama para tu feature
- Commit tus cambios
- Push a la rama
- Abre un Pull Request
Para reportar bugs o solicitar features, abre un issue en GitHub.
Versión Actual: 2.0 Última Actualización: Febrero 2026