Skip to content

ITheEqualizer/Computer-Vision-CIFAR-10

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

10 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

🧠 Computer Vision Project | پروژه بینایی ماشین

📘 Overview | معرفی

This project is a Deep Learning-based Computer Vision system that identifies objects in images using a trained Convolutional Neural Network (CNN). It was developed to demonstrate end-to-end image classification workflows, including data preprocessing, model training, evaluation, and deployment.

این پروژه یک سیستم بینایی ماشین مبتنی بر یادگیری عمیق است که قادر است اشیاء موجود در تصاویر را شناسایی کند. این مدل با استفاده از شبکه‌های عصبی کانولوشنی (CNN) آموزش دیده و شامل مراحل آماده‌سازی داده، آموزش مدل، ارزیابی و ذخیره‌سازی خروجی نهایی است.


📚 Full Documentation (Wiki) | مستندات کامل (ویکی)

A complete, step-by-step wiki explaining every line of code — including all code blocks, English + Persian explanations, model breakdown, training pipeline, evaluation, and deployment — is available here:

👉 Visit the Full Wiki:
https://github.com/ITheEqualizer/Computer-Vision/wiki

🔹 The wiki includes the following full sections:

  1. Setup & Imports
  2. Data Loading & Preprocessing
  3. Model Architecture
  4. Training Configuration & Execution
  5. Evaluation, Visualization & Saving

📌 If you want to understand the logic behind every part of the project, the wiki contains the full learning roadmap.


⚙️ Features | ویژگی‌ها

  • ✅ Image classification using CNN (Keras/TensorFlow)
  • 🧩 Trained model saved as .keras and .h5 files
  • 📊 Evaluation with test data for accuracy & loss metrics
  • 🖼️ Example images included (img.jpg, img2.jpg)
  • 💾 Supports model loading and reusability

📂 Repository Structure | ساختار مخزن

Computer-Vision/
├── saved_model/
│   ├── cnn_cifar10.keras              # Trained CNN model
│   ├── best_weights.weights.h5        # Saved model weights
├── img.jpg                            # Sample image 1
├── img2.jpg                           # Sample image 2
├── LICENSE                            # License file
├── README.md                          # Readme file
└── .gitignore / .gitattributes        # Git configuration

🧠 Model Architecture | معماری مدل

The model is a Convolutional Neural Network (CNN) trained on the CIFAR-10 dataset (or similar custom dataset). It consists of:

  • Multiple convolutional and pooling layers
  • Dense fully-connected layers
  • Softmax output for 10-class classification

این مدل از شبکه‌های عصبی کانولوشنی (CNN) برای استخراج ویژگی‌ها و طبقه‌بندی تصاویر استفاده می‌کند و برای مجموعه داده‌ای مشابه CIFAR-10 طراحی شده است. ساختار آن شامل چندین لایه کانولوشن، Pooling و لایه‌های Fully Connected است.


🚀 Installation & Usage | نصب و اجرا

1️⃣ Prerequisites | پیش‌نیازها

Ensure Python 3.8+ is installed and install the following dependencies:

pip install tensorflow numpy matplotlib

2️⃣ Run Model | اجرای مدل

To load and test the trained model:

from tensorflow import keras
from tensorflow.keras.preprocessing import image
import numpy as np

model = keras.models.load_model('saved_model/cnn_cifar10.keras')

img = image.load_img('img.jpg', target_size=(32, 32))
img_array = image.img_to_array(img)
img_array = np.expand_dims(img_array, axis=0) / 255.0

predictions = model.predict(img_array)
print('Predicted class:', np.argmax(predictions))

برای اجرای مدل کافی است آن را با استفاده از Keras بارگذاری کرده و تصویر مورد نظر را برای پیش‌بینی وارد کنید.


📊 Results & Evaluation | نتایج و ارزیابی

After training, the model achieves high accuracy (>85%) on the CIFAR-10 test set. You can visualize the accuracy/loss graphs or confusion matrix using matplotlib.

پس از آموزش، مدل دقت بالایی (بیش از ۸۵٪) بر روی داده‌های آزمایشی دارد. برای مشاهده عملکرد می‌توانید از نمودارهای دقت و خطا استفاده کنید.


🔮 Future Work | کارهای آینده

  • Expand dataset for more real-world classes
  • Convert model to TensorFlow Lite for mobile deployment
  • Integrate webcam-based real-time detection

📜 License | مجوز

This project is licensed under the MIT License. See the LICENSE file for details.

این پروژه تحت مجوز MIT منتشر شده است. برای اطلاعات بیشتر فایل LICENSE را مطالعه کنید.


👤 Author | نویسنده

Developed by: ITheEqualizer

تهیه و توسعه توسط: ITheEqualizer


🌍 A fully bilingual README to help both English and Persian speakers understand and use this project effectively.
📘 For full project documentation, visit the wiki!

About

A deep learning project which can identify the item of the given picture.

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Sponsor this project

Packages

 
 
 

Contributors