-
Notifications
You must be signed in to change notification settings - Fork 11
RK_1
Для заданного набора данных проведите корреляционный анализ. В случае наличия пропусков в данных удалите строки или колонки, содержащие пропуски. Сделайте выводы о возможности построения моделей машинного обучения и о возможном вкладе признаков в модель.
- https://scikit-learn.org/stable/modules/generated/sklearn.datasets.load_boston.html#sklearn.datasets.load_boston
- https://scikit-learn.org/stable/modules/generated/sklearn.datasets.load_iris.html#sklearn.datasets.load_iris
- https://scikit-learn.org/stable/modules/generated/sklearn.datasets.load_wine.html#sklearn.datasets.load_wine
- https://www.kaggle.com/carlolepelaars/toy-dataset
- https://www.kaggle.com/ronitf/heart-disease-uci
- https://www.kaggle.com/mohansacharya/graduate-admissions (файл Admission_Predict.csv)
- https://www.kaggle.com/mohansacharya/graduate-admissions (файл Admission_Predict_Ver1.1.csv)
- https://www.kaggle.com/lava18/google-play-store-apps
Для заданного набора данных проведите обработку пропусков в данных для одного категориального и одного количественного признака. Какие способы обработки пропусков в данных для категориальных и количественных признаков Вы использовали? Какие признаки Вы будете использовать для дальнейшего построения моделей машинного обучения и почему?
- https://www.kaggle.com/karangadiya/fifa19
- https://www.kaggle.com/fivethirtyeight/fivethirtyeight-comic-characters-dataset (файл dc-wikia-data.csv)
- https://www.kaggle.com/fivethirtyeight/fivethirtyeight-comic-characters-dataset (файл marvel-wikia-data.csv)
- https://www.kaggle.com/noriuk/us-education-datasets-unification-project (файл states_all.csv)
- https://www.kaggle.com/noriuk/us-education-datasets-unification-project (файл states_all_extended.csv)
- https://www.kaggle.com/mehdidag/black-friday
- https://www.kaggle.com/san-francisco/sf-restaurant-scores-lives-standard
- https://www.kaggle.com/mathan/fifa-2018-match-statistics
Для заданного набора данных произведите масштабирование данных (для одного признака) и преобразование категориальных признаков в количественные двумя способами (label encoding, one hot encoding) для одного признака. Какие методы Вы использовали для решения задачи и почему?
- https://www.kaggle.com/karangadiya/fifa19
- https://www.kaggle.com/fivethirtyeight/fivethirtyeight-comic-characters-dataset (файл dc-wikia-data.csv)
- https://www.kaggle.com/fivethirtyeight/fivethirtyeight-comic-characters-dataset (файл marvel-wikia-data.csv)
- https://www.kaggle.com/noriuk/us-education-datasets-unification-project (файл states_all.csv)
- https://www.kaggle.com/noriuk/us-education-datasets-unification-project (файл states_all_extended.csv)
- https://www.kaggle.com/mehdidag/black-friday
- https://www.kaggle.com/san-francisco/sf-restaurant-scores-lives-standard
- https://www.kaggle.com/mathan/fifa-2018-match-statistics
Для заданного набора данных постройте основные графики, входящие в этап разведочного анализа данных. В случае наличия пропусков в данных удалите строки или колонки, содержащие пропуски. Какие графики Вы построили и почему? Какие выводы о наборе данных Вы можете сделать на основании построенных графиков?
- https://scikit-learn.org/stable/modules/generated/sklearn.datasets.load_boston.html#sklearn.datasets.load_boston
- https://scikit-learn.org/stable/modules/generated/sklearn.datasets.load_iris.html#sklearn.datasets.load_iris
- https://scikit-learn.org/stable/modules/generated/sklearn.datasets.load_wine.html#sklearn.datasets.load_wine
- https://www.kaggle.com/carlolepelaars/toy-dataset
- https://www.kaggle.com/ronitf/heart-disease-uci
- https://www.kaggle.com/mohansacharya/graduate-admissions (файл Admission_Predict.csv)
- https://www.kaggle.com/mohansacharya/graduate-admissions (файл Admission_Predict_Ver1.1.csv)
- https://www.kaggle.com/lava18/google-play-store-apps