In [None]:
import pandas as pd
import requests
from io import StringIO
import matplotlib.pyplot as plt
import seaborn as sns

In [None]:
def download_dataset(url):
    response = requests.get(url)
    if response.status_code == 200:
        return response.text
    else:
        raise ValueError("فشل تنزيل ملف البيانات")


In [None]:
def read_dataset(data, file_type):
    if file_type == "csv":
        dataset = pd.read_csv(StringIO(data))
    elif file_type == "excel":
        dataset = pd.read_excel(StringIO(data))
    elif file_type == "sql":
        # اكتب هنا الكود الخاص بقراءة من قاعدة بيانات SQL
        pass
    else:
        raise ValueError("نوع الملف غير معترف به")
        return dataset


In [None]:
def infer_column_types(dataset):
    column_types = dataset.dtypes
    return column_types

In [None]:
def handle_missing_values(dataset):
    for column in dataset.columns:
        if dataset[column].dtype == 'float64':
            # قم بتعبئة القيم المفقودة في البيانات المستمرة بالوسط الحسابي
            dataset[column].fillna(dataset[column].mean(), inplace=True)
        elif dataset[column].dtype == 'int64':
            # قم بتعبئة القيم المفقودة في البيانات المنفصلة بالمنوال
            dataset[column].fillna(dataset[column].mode()[0], inplace=True)

In [None]:
def visualize_data(data, column_name, plot_type):
    plt.figure(figsize=(10, 6))  # تحديد حجم الشكل
    
    if plot_type == 'histogram':
        # عمل هستوغرام للبيانات
        sns.histplot(data[column_name], kde=True)
        plt.title(f'هستوغرام لعمود {column_name}')
        plt.xlabel(column_name)
        plt.ylabel('التكرارات')
    elif plot_type == 'box':
        # عمل بوكس بلوت للبيانات
        sns.boxplot(x=data[column_name])
        plt.title(f'بوكس بلوت لعمود {column_name}')
        plt.xlabel(column_name)
    elif plot_type == 'scatter':
        # عمل سكاتر بلوت لبيانات اثنين من الأعمدة
        # يجب توفير اسمي العمودين كمدخلات إضافية
        x_column, y_column = column_name.split(',')
        sns.scatterplot(data=data, x=x_column, y=y_column)
        plt.title(f'سكاتر بلوت لأعمدة {x_column} و{y_column}')
        plt.xlabel(x_column)
        plt.ylabel(y_column)
    elif plot_type == 'bar':
        # عمل بار شارت للبيانات
        sns.countplot(data=data, x=column_name)
        plt.title(f'بار شارت لعمود {column_name}')
        plt.xlabel(column_name)
        plt.ylabel('التكرارات')

    plt.show()


In [None]:
def visualize_all_features(data):
    for feature in data.columns:
        visualize_data(data, feature, 'histogram')  # هستوغرام
        visualize_data(data, feature, 'box')       # بوكس بلوت
        visualize_data(data, feature, 'scatter')   # سكاتر بلوت
        visualize_data(data, feature, 'bar')       # بار شارت


In [None]:

def main():
    
        # ضع رابط مباشر إلى ملف البيانات الذي ترغب في قراءته هنا
        dataset_url = 'https://www.kaggle.com/parulpandey/us-international-air-traffic-data/download/data'

        try:
            data = download_dataset(dataset_url)
            dataset = read_dataset(data, 'csv')
            print("مجموعة البيانات:")
            print(dataset)

            column_types = infer_column_types(dataset)
            print("أنواع الأعمدة:")
            print(column_types)

            handle_missing_values(dataset)  # فحص ومعالجة القيم المفقودة
            print("مجموعة البيانات بعد معالجة القيم المفقودة:")
            print(dataset)

            # قم بعرض التصورات البيانية لجميع السمات
            visualize_all_features(dataset)

        except ValueError as e:
            print(e)
        except Exception as e:
            print("حدث خطأ أثناء تنزيل أو قراءة الملف:", e)

    if __name__ == "__main__":
    main()
