Skip to content

Latest commit

 

History

History
128 lines (91 loc) · 8.74 KB

README.md

File metadata and controls

128 lines (91 loc) · 8.74 KB

Piscine Python Data Science

Day 00

Инструменты командной строки UNIX

Описание: В первый день мы поможем вам приобрести навыки использования инструментов командной строки UNIX для решения базовых задач по обработке и анализу данных. Вы узнаете, как использовать curl, sort, uniq, jq, sed и cat для сбора и предварительной обработки данных.

Начало работы

Чтобы работала JQ подключаем в ENV home brew, которую мы установли в папку goinfre

eval "$(~/goinfre/homebrew/bin/brew shellenv)"

Запускаем hh.sh с параметром data scientist для нашего задания и любой профессией для парсинга остального

sh hh.sh "data scientist"

Сырые данне складываем в JSON файл и затем преобразовываем его в CSV файл, сортируем, заменяем строки и разделяем/объединяем по файлам.

Day 01

Введение в Python: синтаксис и семантика

Резюме: Сегодня мы поможем вам приобрести базовые знания о синтаксисе и семантикеиз Питона.

Day 02

Введение в Python: навыки ООП

Резюме: сегодня мы поможем вам получить базовые знания об ООП-подходе в Python.

Day 03

Введение в Python: управление пакетами и виртуальная среда

Резюме: Сегодня мы поможем вам получить базовые знания о том, как управлять библиотеками в Python и работать с виртуальными средами (virtual environment venv).

  1. Установка venv
  • python3.10 -m venv venv - установка
  • . venv/bin/activate - запускаем так
  • source venv/bin/activate - или так
  • pip install --upgrade pip - oбновляем pip
  • deactivate - и выход из окружения
  1. Установка библиотек:
  1. Полезное:

Day 04

Введение в Python: эффективные методы написания кода

Резюме: Сегодня мы поможем вам написать код, который работает быстрее.

Day 05

Pandas: работа с фреймами данных

Резюме: сегодня мы поможем вам приобрести навыки с Pandas.

Day 06

Pandas: SQL and Pandas

Резюме: сегодня мы поможем вам приобрести навыки работы с SQL

  • Методы объекта Connection SQLite3.
  • strftime функция SQLite

Day 07

Pandas, SQL и визуализация данных

Резюме: Сегодня мы поможем вам с визуализацией данных в Matplotlib, Seaborn и Plotly.

Day 08

Введение в машинное обучение

Резюме: Сегодня мы поможем вам с основными задачами, связанными с машинным обучением в Python.

Day 09

Машинное обучение: продвинутый уровень

Резюме: сегодня мы поможем вам справиться с сложными задачами, связанными с машинным обучением в Python.

Rush 00

Аналитика MovieLens

Резюме: Этот раш поможет вам укрепить навыки, полученные в предыдущие дни.

  • Класс OrderedDict модуля collections в Python.

Rush 01

Продовольствие и питание

Резюме: Этот раш поможет вам укрепить навыки, полученные в предыдущие дни. Датасет epi_r.csv скачать здесь