Bu repo, en son yapay zeka modellerini kullanarak ses, görüntü ve metin oluşturma ve işleme için Python betikleri içerir. Projeler, Streamlit aracılığıyla kullanıcı dostu arayüzlerle entegre edilerek kolay etkileşim imkanı sunar. Aşağıda, bu repoda bulunan temel bileşenlerin ve özelliklerin bir özeti bulunmaktadır.
Ses İşlemleri (audio_ops.py
)
- Metinden Konuşmaya (Text-to-Speech): OpenAI modellerini kullanarak gerçekçi ve yüksek kaliteli ses üretimi sağlar.
- Ses Transkripsiyonu: Whisper ve AssemblyAI'nin Conformer modellerini kullanarak ses dosyalarını metne çevirir.
- Çeviri: Transkribe edilen sesleri farklı dillere çevirerek çok dilli erişilebilirlik sunar.
Görüntü İşlemleri (image_ops.py
)
- Görüntü Oluşturma: DALL-E ve Stable Diffusion modelleriyle özgün ve yaratıcı görseller üretir.
- Varyasyonlar: Mevcut görsellerin farklı versiyonlarını üreterek yaratıcı keşifler yapmanıza olanak tanır.
- Özel Sanat Eserleri: Stable Diffusion kullanarak kişiselleştirilmiş sanat eserleri oluşturur.
- Metin Üretimi: OpenAI'nin dil modellerini kullanarak yaratıcı ve etkileyici metinler üretir.
- Özetleme: Uzun metinleri hızlıca özetleyerek içeriğin kısa versiyonlarını oluşturur.
- Çeviri: Girilen metni farklı dillere çevirerek geniş bir kitleye hitap eder.
- Chatbot Arayüzü: OpenAI'nin dil modelleriyle etkileşimli diyalog deneyimi sunan bir sohbet botu içerir.
- Python 3.8+
- Streamlit
- OpenAI API
- StabilityAI API
- Repoyu klonlayın:
git clone https://github.com/melisacevik/Generative-AI.git
- Gerekli paketleri yükleyin:
pip install -r requirements.txt
VoiceDraw, kullanıcıların sesli komutlarla görseller oluşturmasını sağlayan bir uygulamadır. Uygulama, ses kaydını alıp metne çevirir ve ardından yapay zeka modelleriyle görsel üretir.
- Ses Kaydı: Kullanıcıdan sesli giriş alır.
- Metne Dönüştürme: OpenAI Whisper API ile sesi metne çevirir.
- Görsel Üretimi:
- OpenAI DALL-E 3 kullanarak metinden görsel üretir.
- Google Gemini Vision Pro kullanarak görsel bazlı düzenlemeler yapar.
- Streamlit Arayüzü: Kullanıcı dostu bir arayüz sunar.
- Görsel İndirme: Üretilen görselleri indirilebilir hale getirir.
Bu çalışma, farklı yapay zeka dil modellerinin performanslarını karşılaştırmak için bir arayüz sunar.
- Model Karşılaştırma:
- GPT-4 Turbo
- Gemini Pro
- Deepseek Chat
- Kullanıcı girdisine bağlı olarak farklı modellerin yanıtlarını karşılaştırır ve süre ölçümü yapar.
streamlit run module4/model.py
├── model.py # Streamlit tabanlı model karşılaştırma arayüzü
├── modelhelper.py # Farklı yapay zeka modellerinin API entegrasyonu
Bu çalışma, bellek genişletme teknikleri kullanarak modelin dış kaynaklardan bilgi almasını sağlar.
- Web Üzerinden Bilgi Alma: Belirtilen URL’den içerik toplayarak sorulara daha kapsamlı yanıt verir.
- PDF Desteği: PDF dosyalarını işler ve metinden bilgi çıkararak yanıt oluşturur.
- Özel Prompt Kullanımı: Modelin dış bilgi kaynaklarına erişimini sağlayarak daha bilinçli yanıtlar oluşturmasını destekler.
streamlit run module4/rag.py
├── rag.py # Streamlit tabanlı bellek genişletme uygulaması
├── raghelper.py # Web ve PDF üzerinden içerik alarak bellek genişletme işlevselliği
Bu modül, farklı büyük dil modellerinin karşılaştırmasını yaparak kullanıcıların en iyi modeli seçmesine yardımcı olmayı ve ek bellek genişletme teknikleriyle daha verimli bilgi edinmesini sağlamayı amaçlamaktadır.