Python AI Applications

Modern AI applications showcasing computer vision, audio processing, and natural language understanding.

Projects

Computer Vision

Image Classification - PyTorch-based image classifier with pre-trained models
Image Captioning - Automatic image description generation
Image Captioning V2 - Alternative image captioning approach
Interactive Image Captioning - Web interface for real-time image analysis

Audio Processing

Audio Transcription (Whisper) - Speech-to-text using OpenAI's Whisper model
MP3 Transcription - Audio file transcription pipeline

Conversational AI

Chatbot - Interactive conversational agent implementation

User Interfaces

Gradio Examples - Building interactive web interfaces for ML models
Widget Utilities - UI components for AI applications

Technologies

Deep Learning: PyTorch, TensorFlow
Pre-trained Models: Whisper (OpenAI), Vision models
UI Frameworks: Gradio, widgets
Audio/Vision: Librosa, OpenCV, PIL
Python: 3.9+

Features

✅ Pre-trained model integration (Whisper, Vision transformers)
✅ Real-time inference examples
✅ Interactive web interfaces with Gradio
✅ Production-ready code patterns
✅ Multi-modal AI (vision + language + audio)

Name		Name	Last commit message	Last commit date
Latest commit History 35 Commits
Another_Image_caption_V1.ipynb		Another_Image_caption_V1.ipynb
Audio_transcription_V1.ipynb		Audio_transcription_V1.ipynb
Gradio_Example.ipynb		Gradio_Example.ipynb
Image_Caption_with_Interface_V1.ipynb		Image_Caption_with_Interface_V1.ipynb
Image_Captioning_V1.ipynb		Image_Captioning_V1.ipynb
Image_Classify_PyTorch.ipynb		Image_Classify_PyTorch.ipynb
README.md		README.md
Remove_Widgets.ipynb		Remove_Widgets.ipynb
Screenshot 2025-04-25 143723.png		Screenshot 2025-04-25 143723.png
Whisper_mp3.ipynb		Whisper_mp3.ipynb
chatbot.py		chatbot.py
downloaded_audio.mp3		downloaded_audio.mp3

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

Python AI Applications

Projects

Computer Vision

Audio Processing

Conversational AI

User Interfaces

Technologies

Features

About

Uh oh!

Releases

Packages

Languages

ElsonFilho/Python-AI-Applications

Folders and files

Latest commit

History

Repository files navigation

Python AI Applications

Projects

Computer Vision

Audio Processing

Conversational AI

User Interfaces

Technologies

Features

About

Topics

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages