### Введение

**Цель урока**:  
Этот урок поможет вам познакомиться с основами Python, которые необходимы для аналитической работы с данными. Основное внимание уделяется базовым операциям с данными и инструментам, используемым в Python. Мы рассмотрим, как Python может помочь вам эффективно управлять и анализировать данные.


### Почему Python — ключевой инструмент для аналитиков

#### Языки программирования и их роль в современном мире данных

Сегодня существует множество языков программирования, которые используются для различных задач в сфере IT и анализа данных. Вот несколько примеров:

- **C/C++**: Используется для разработки системного программного обеспечения, игр и высокопроизводительных приложений.
- **Java**: Часто применяется для создания крупных корпоративных систем и мобильных приложений.
- **R**: Популярен среди статистиков и используется для анализа данных и визуализации.
- **SQL**: Применяется для работы с базами данных и извлечения данных.
- **JavaScript**: Основной язык для создания веб-приложений и интерфейсов.
- **Python**: Один из самых универсальных языков, который активно используется для анализа данных, машинного обучения, автоматизации задач и создания приложений.

Из всех этих языков **Python** занимает особое место в аналитике данных благодаря своему простому синтаксису, широким возможностям и богатой экосистеме библиотек.

#### Преимущества Python для анализа данных и машинного обучения

Python стал основным инструментом для анализа данных и машинного обучения по ряду причин:

1. **Простота и читабельность кода**: Python легко учить и использовать даже для начинающих аналитиков. Его синтаксис интуитивно понятен, а большое количество готовых библиотек делает работу с данными более эффективной.
2. **Широкий выбор библиотек и фреймворков**: Python предоставляет такие мощные инструменты, как:
   - **pandas** для работы с таблицами данных (DataFrame);
   - **numpy** для числовых вычислений;
   - **matplotlib** и **seaborn** для визуализации данных;
   - **scikit-learn** для машинного обучения;
   - **TensorFlow** и **PyTorch** для глубинного обучения.
3. **Гибкость и масштабируемость**: Python можно использовать как для небольших аналитических задач, так и для сложных проектов в области больших данных и искусственного интеллекта.
4. **Сообщество и поддержка**: Python имеет большое и активное сообщество, которое помогает развивать язык и создавать новые библиотеки. Это означает, что вы всегда найдете поддержку и решения для своих задач.

#### Специализации аналитиков и использование Python

Python используется во многих аналитических специальностях. Вот несколько примеров:

1. **Бизнес-аналитики**: Используют Python для анализа данных о продажах, поведении клиентов, а также для автоматизации отчетов и создания прогнозов.
2. **Аналитики данных**: Основное применение Python — обработка больших объемов данных, их очистка, преобразование и визуализация.
3. **Стратегические аналитики**: Применяют Python для анализа рыночных данных и конкурентной разведки, что позволяет делать точные прогнозы и принимать обоснованные решения.
4. **Финансовые аналитики**: Используют Python для моделирования финансовых данных, прогнозирования прибыли и управления рисками.
5. **Аналитики данных в области машинного обучения и ИИ**: Основное применение Python — разработка и обучение моделей машинного обучения для создания прогнозных моделей, классификации данных и автоматизации процессов.

#### Преимущества Python перед Excel и дашбордами

Excel и визуальные дашборды, такие как Tableau или Power BI, — отличные инструменты для визуализации данных и выполнения базовых аналитических операций. Однако, у Python есть несколько ключевых преимуществ:

1. **Работа с большими объемами данных**: Excel и дашборды могут не справляться с большими объемами данных или сложными расчетами. Python позволяет обрабатывать данные в больших объемах, автоматизировать процессы и оптимизировать ресурсы.
2. **Автоматизация**: Python позволяет автоматизировать рутинные задачи, такие как сбор данных, их обработка и создание отчетов. В Excel такие задачи часто требуют ручного выполнения или использования сложных макросов.
3. **Гибкость и расширяемость**: В то время как Excel и дашборды предлагают ограниченные возможности для программирования, Python предоставляет практически неограниченные возможности благодаря множеству библиотек и фреймворков.
4. **Машинное обучение и прогнозирование**: В Excel нет встроенных инструментов для машинного обучения, в то время как Python предлагает множество инструментов для создания прогнозных моделей и анализа данных с использованием искусственного интеллекта.

#### Почему важно изучать Python, если вы работаете в аналитике

1. **Адаптация к будущему**: Все больше компаний переходят на Python для автоматизации аналитики и работы с большими данными. Знание Python открывает больше возможностей для карьерного роста и позволяет оставаться конкурентоспособным на рынке труда.
2. **Широкие возможности анализа**: С помощью Python вы сможете не только работать с данными, но и применять их для создания прогнозов, разработки моделей машинного обучения и проведения сложных исследований.
3. **Повышение эффективности**: Python помогает автоматизировать рутинные задачи, что сокращает время на выполнение операций и снижает вероятность ошибок. Это делает процесс анализа данных более точным и эффективным.
4. **Доступ к передовым технологиям**: Python используется в передовых технологиях, таких как машинное обучение, искусственный интеллект и анализ больших данных. Знание Python поможет вам быть в авангарде этих инноваций.

Изучение Python — это важный шаг для любого аналитика, который хочет улучшить свои навыки, работать с передовыми технологиями и быть востребованным на современном рынке труда.

### Установка Python и среды разработки

Для аналитиков важно выбрать удобную среду для работы с кодом. В нашем случае мы рассмотрим два основных варианта: **Anaconda** с Jupyter Notebook и **Google Colab**. Эти среды удобны для работы с Python, особенно при анализе данных, и широко используются в сфере аналитики.

#### 1. Установка Anaconda и Jupyter Notebook

**Anaconda** — это дистрибутив Python, который включает все необходимые инструменты для анализа данных и работы с большими объемами данных, включая Jupyter Notebook. Anaconda удобно устанавливается и позволяет работать с Jupyter Notebook локально на вашем компьютере.

##### Шаги для установки Anaconda на Windows и Mac:

1. **Скачивание Anaconda**:  
   Перейдите на официальный сайт [Anaconda](https://www.anaconda.com/products/individual) и скачайте инсталлятор, соответствующий вашей операционной системе (Windows или Mac).

2. **Установка Anaconda**:
   - **На Windows**:  
     Запустите скачанный установочный файл и следуйте инструкциям на экране. По умолчанию Anaconda будет установлена в папку `C:\Users\<Ваше имя>\Anaconda3`. В процессе установки можно выбрать опцию "Добавить Anaconda в PATH", однако это не обязательно.
   - **На Mac**:  
     Откройте скачанный `.pkg` файл и следуйте инструкциям на экране для установки.

3. **Запуск Jupyter Notebook**:
   - После завершения установки откройте Anaconda Navigator (поиск через меню Пуск на Windows или через Finder на Mac).
   - В интерфейсе Anaconda Navigator найдите иконку **Jupyter Notebook** и нажмите кнопку **Launch** для запуска.
   - Jupyter Notebook откроется в вашем браузере, и вы сможете начать работу.

##### Альтернативный способ запуска Jupyter Notebook через терминал:
- **На Windows**: Откройте "Anaconda Prompt" (в поиске системы наберите "Anaconda Prompt"), затем введите команду:
  ``` bash
  jupyter notebook
  ```
- **На Mac**: Откройте приложение "Terminal" и введите команду:
  ```
  jupyter notebook
  ```

После выполнения этой команды Jupyter Notebook откроется в вашем браузере, и вы сможете создавать новые блокноты для работы с Python.

#### 2. Работа с Google Colab

**Google Colab** — это облачная платформа, которая позволяет вам запускать Jupyter Notebook без установки каких-либо программ на ваш компьютер. Colab отлично подходит для анализа данных и экспериментов с Python, предоставляя бесплатный доступ к вычислительным ресурсам Google.

##### Шаги для начала работы с Google Colab:

1. **Перейдите на сайт Google Colab**:  
   Откройте [Google Colab](https://colab.research.google.com) в вашем браузере. Для работы с Colab вам понадобится аккаунт Google.

2. **Создание нового блокнота**:
   - После входа на сайт нажмите на кнопку **New Notebook** (Новый блокнот).
   - Вам откроется интерфейс Jupyter Notebook, который работает прямо в браузере.

3. **Сохранение блокнотов**:
   - Colab автоматически сохраняет ваш прогресс в Google Drive. Вы можете скачать блокноты на свой компьютер в формате `.ipynb` (формат Jupyter Notebook) или в других форматах (например, `.py` — Python-скрипт).

##### Преимущества Google Colab:
- **Нет необходимости в установке программ**: всё, что нужно, это доступ в интернет и Google-аккаунт.
- **Облачные вычисления**: Colab позволяет использовать мощные вычислительные ресурсы Google, включая графические процессоры (GPU), для более сложных вычислений.
- **Совместная работа**: Google Colab поддерживает совместную работу, позволяя делиться блокнотами и редактировать их одновременно с коллегами.

#### Как выбрать среду

- **Anaconda с Jupyter Notebook** подходит, если вы предпочитаете работать локально на вашем компьютере и у вас есть стабильное рабочее окружение для регулярной работы с данными.
- **Google Colab** является хорошим выбором, если вы хотите быстро начать работу без установки программного обеспечения или если вам нужны мощные вычислительные ресурсы для анализа.

Обе среды позволяют эффективно работать с Python и предоставляют удобный интерфейс для написания и выполнения кода.



#### Краткий обзор Python

Python — это высокоуровневый язык программирования, известный своей простотой и читабельностью. Он широко используется в разных отраслях, включая аналитику данных. Вот несколько ключевых причин, почему Python является одним из самых популярных языков для аналитиков данных:

1. **Простота и читабельность кода**:  
   Python имеет понятный синтаксис, который делает его доступным для начинающих. Структура кода интуитивно понятна, а из-за минималистичности синтаксиса его легко читать и поддерживать.
   - Например, сложение чисел в Python выглядит просто:  
     ```python
     a = 5
     b = 3
     print(a + b)  # Вывод: 8
     ```

2. **Богатая экосистема библиотек**:  
   Для аналитиков Python предлагает большое количество готовых библиотек, которые значительно упрощают обработку и анализ данных. Вот несколько примеров:
   - **pandas** — библиотека для работы с таблицами данных (DataFrame).
   - **numpy** — библиотека для работы с массивами и числовыми данными.
   - **matplotlib и seaborn** — библиотеки для визуализации данных.

3. **Широкие возможности автоматизации и интеграции**:  
   Python позволяет автоматизировать многие рутинные процессы, такие как сбор данных, их очистка и предварительный анализ. Это экономит время и силы аналитиков.
   - Например, можно легко написать скрипт для автоматической загрузки данных из Excel-файла:
     ```python
     import pandas as pd
     data = pd.read_excel('data.xlsx') # Измените имя файла
     print(data.head())
     ```

4. **Масштабируемость и гибкость**:  
   Python подходит для решения как небольших аналитических задач, так и для сложных проектов, требующих обработки больших объемов данных. Язык легко интегрируется с различными инструментами и платформами, такими как базы данных и системы отчетности.

#### Основные направления применения Python в аналитике данных

1. **Обработка и анализ данных**:  
   Python позволяет работать с большими наборами данных, очищать их, трансформировать, агрегировать и проводить статистический анализ. Например, можно отфильтровать данные или выполнить расчеты по определенным столбцам:
   ```python
   filtered_data = data[data['Age'] > 30]  # Фильтрация по условию
   ```

2. **Визуализация данных**:  
   С помощью таких библиотек, как `matplotlib` и `seaborn`, вы можете строить графики и диаграммы, которые помогают наглядно представить результаты анализа.
   - Пример построения графика:
     ```python
     import matplotlib.pyplot as plt
     data['Age'].hist()
     plt.show()
     ```

3. **Машинное обучение и прогнозирование**:  
   Python активно используется для построения моделей машинного обучения и прогнозирования. Библиотеки `scikit-learn` и `tensorflow` позволяют создавать модели для предсказания трендов, кластеризации данных и многого другого.

4. **Автоматизация отчетов и визуализаций**:  
   Python позволяет автоматизировать создание отчетов и обновляемых визуализаций, которые могут быть нацелены на регулярное предоставление обновленной информации.

Это краткий обзор Python и его возможностей для аналитиков. В следующих разделах мы перейдём к практическому освоению основных инструментов и понятий Python.

### Работа с ячейками в Jupyter Notebook

Вы можете выполнять код примеров добавляя ячейки или используя пустые, после блоков.

- **Изменение типа ячейки**:
![image.png](attachment:495fe1cf-fe84-49f2-91ff-9a418377d159.png)
  Чтобы изменить тип ячейки (например, с кода на Markdown), выберите ячейку и используйте выпадающий список в верхнем меню, где указано "Code", выберите "Markdown". Также можно использовать сочетание клавиш:  
  - **Для кода**: `Esc` → `Y` - в ячейке такого типа, вы можете выполнять код.  
  - **Для Markdown**: `Esc` → `M` - в данном случае введеный текст будет интерпретирован как Markdown - язык форматирования документов.

- **Добавление новой ячейки**:  
  Чтобы добавить новую ячейку, нажмите `Esc` (выйти в командный режим), затем нажмите `B` (добавить ячейку ниже текущей) или `A` (добавить выше текущей).

- **Выполнение ячейки**:  
  Для выполнения кода или Markdown-ячейки используйте сочетание клавиш `Shift + Enter`.

- **Редактирование ячейки Markdown**:
  Дважды щелкните по ней левой кнопкой мыши, ячейка перейдет в режим редактирования. Затем просто выполните ее.

Обязательно пробуйте выполнять все примеры и изменяйте их. Эксперементируйте!

**Если код не работает или нужны пояснения, воспользуйтесь ИИ:**
- https://labs.perplexity.ai/ (модель llama-3.1-70b-instruct)
- https://chat.mistral.ai/chat (выбирайте модель Codestral и просите отвечать ее на русском языке).

Вы можете просто попросить написать нужный вам код или скопировать код с ошибкой и расшифровку ошибки, ИИ поможет ее исправить. 

### Ошибки 
![image.png](attachment:e7c96e44-89af-479b-b621-cfef55542b80.png)

Интерпретатор Python выдает развернутое пояснение ошибки. Обращайте внимание на текст в самом низу. Как правило, он по сути возникшей проблемы.

### Markdown в Jupyter Notebook

Markdown — это язык разметки, который используется для форматирования текста. В Jupyter Notebook вы можете создавать ячейки с текстом, написанным на Markdown, чтобы документировать код и делать ваши блокноты более информативными и удобными для чтения.

Markdown позволяет добавлять заголовки, списки, ссылки, изображения и выделение текста, делая ваши рабочие документы более структурированными и наглядными.

#### Зачем использовать Markdown?

- **Документирование кода**: вы можете писать пояснения к своему коду, чтобы сделать его понятнее для других и для себя.
- **Структурирование данных**: с помощью заголовков и списков можно логически разделить данные и шаги анализа.
- **Отчеты**: Markdown упрощает создание отчетов прямо в Jupyter Notebook, что позволяет сочетать код, результаты анализа и текстовые описания.

Markdown — это простой, но мощный инструмент для создания понятных и структурированных ноутбуков, которые делают ваши аналитические работы более ясными и профессиональными.

#### Основные возможности Markdown

1. **Заголовки**
   Вы можете использовать заголовки разных уровней для разделения вашего документа на логические части. В Markdown заголовки создаются с помощью символа решетки `#`. Чем больше символов решетки, тем ниже уровень заголовка:
   - Пример:
     ```
     # Заголовок первого уровня
     ## Заголовок второго уровня
     ### Заголовок третьего уровня
     ```
   Результат:
   # Заголовок первого уровня  
   ## Заголовок второго уровня  
   ### Заголовок третьего уровня

2. **Списки**
   Markdown поддерживает как нумерованные, так и ненумерованные списки:
   - Ненумерованный список создается с помощью символов `-` или `*`:
     ```
     - Первый элемент
     - Второй элемент
     - Третий элемент
     ```
   Результат:
   - Первый элемент  
   - Второй элемент  
   - Третий элемент  

   - Нумерованный список создается с помощью чисел:
     ```
     1. Первый элемент
     2. Второй элемент
     3. Третий элемент
     ```
   Результат:
   1. Первый элемент  
   2. Второй элемент  
   3. Третий элемент  

3. **Выделение текста**
   В Markdown вы можете выделить текст курсивом или жирным шрифтом:
   - Курсив: текст заключается в одиночные символы подчеркивания или звездочки:
     ```
     _Это курсив_
     *Это курсив*
     ```
     Результат: _Это курсив_

   - Жирный шрифт: текст заключается в двойные символы подчеркивания или звездочки:
     ```
     __Это жирный текст__
     **Это жирный текст**
     ```
     Результат: **Это жирный текст**

4. **Ссылки**
   Для добавления ссылок в Markdown используйте следующую конструкцию:
   ```
   [Текст ссылки](https://example.com)
   ```
   Пример:
   ```
   [Сайт Python](https://www.python.org)
   ```
   Результат: [Сайт Python](https://www.python.org)

5. **Изображения**
   Вставка изображения в Markdown очень похожа на вставку ссылки. Отличие заключается в добавлении восклицательного знака `!` перед квадратными скобками:
   ```
   ![Альтернативный текст](ссылка_на_изображение)
   ```
   Пример:
   ```
   ![Логотип Python](https://www.python.org/static/community_logos/python-logo.png)
   ```
   Результат:
   ![Логотип Python](https://www.python.org/static/community_logos/python-logo.png)

6. **Код**
   Чтобы вставить фрагмент кода, вы можете использовать обратные кавычки (``):
   - Встроенный код:  
     ```  
     `print("Пример")`  
     ```  
     Результат: `print("Пример")`

   - Блок кода:
     ```
     ```
     print("Это блок кода")
     ```
     ```
     Результат:
     ```python
     print("Это блок кода")
     ```

### Синтаксис Python и комментарии

Правильное понимание синтаксиса Python и умение использовать комментарии — это основа хорошего кода, особенно при работе с большими проектами. Понимание структуры кода помогает не только вам, но и другим аналитикам, работающим с вашим кодом.

#### 1. Синтаксис Python

Python отличается своей простотой и понятностью. Одной из ключевых особенностей Python является использование **отступов** для обозначения блоков кода, вместо фигурных скобок `{}`, как это принято в других языках программирования. Это делает код более читаемым, но также требует внимательности.

##### Пример правильного отступа:
```python
x = 10
if x > 5:
    print("x больше 5")  # Эта строка выполнится, если условие истинно
else:
    print("x меньше или равно 5")  # Эта строка выполнится в противном случае
```

Отступы обычно составляют 4 пробела или 1 табуляцию. Важно следить, чтобы весь код в блоке имел одинаковый отступ. Ошибки в отступах могут привести к синтаксическим ошибкам.

##### Пример с ошибкой в отступе:
```python
x = 10
if x > 5:
    print("x больше 5")
   print("Эта строка вызовет ошибку")  # Ошибка из-за неправильного отступа
```


#### 2. Операторы сравнения и логические выражения

Python поддерживает стандартные операторы сравнения, такие как:
- `==`: равно
- `!=`: не равно
- `>`: больше
- `<`: меньше
- `>=`: больше или равно
- `<=`: меньше или равно

Эти операторы часто используются для создания логических выражений в условиях.

##### Пример:
```python
a = 10
b = 20

if a == b:
    print("a равно b")
elif a > b:
    print("a больше b")
else:
    print("a меньше b")  # Выводит: "a меньше b"
```

#### 3. Комментарии в Python

Комментарии — это важная часть любого кода. Они помогают объяснить, что делает тот или иной фрагмент кода, что особенно полезно при работе над большими проектами или для совместной работы с другими аналитиками. Python поддерживает два типа комментариев:

##### Однострочные комментарии

Однострочные комментарии начинаются с символа `#`. Все, что написано после `#`, игнорируется Python.

##### Пример:
```python
# Это однострочный комментарий
x = 10  # Комментарий в конце строки кода
```

##### Многострочные комментарии

Для многострочных комментариев можно использовать тройные кавычки `"""` или `'''`. Важно отметить, что тройные кавычки также могут использоваться для создания многострочных строк, поэтому многострочные комментарии — это лишь один из вариантов использования тройных кавычек.

##### Пример:
```python
"""
Это многострочный комментарий.
Он может занимать несколько строк.
"""
x = 10
```

#### 4. Как писать читаемый код

Для поддержания высокого качества кода и его читабельности важно придерживаться некоторых общих рекомендаций:
- Используйте **говорящие имена переменных**. Переменные должны ясно отражать, какие данные они содержат. Например, `x` — это плохо, а `средний_возраст` — это хорошо.
- **Разделяйте блоки кода пустыми строками** для лучшей читаемости.
- Используйте **комментарии** для сложных участков кода или бизнес-логики, которую может быть трудно понять с первого взгляда.
- Соблюдайте **единообразие отступов** (4 пробела или 1 табуляция).

##### Пример хорошего стиля кода:
```python
# Рассчитываем средний возраст сотрудников
age_sum = 30 + 25 + 40  # Sum of employee ages
employee_count = 3  # Total number of employees

average_age = age_sum / employee_count
print("Средний возраст сотрудников:", average_age)
```

### Важное замечание о выборе названий переменных

В Python, как и в любом другом языке программирования, вы можете использовать русские названия переменных. Однако **лучше избегать использования кириллических символов**, поскольку это может вызвать путаницу при работе с кодом, особенно если в команде есть разработчики, привыкшие к английским названиям.

#### Причины избегать русских названий переменных:
1. **Смешивание языков**: При написании кода с русскими переменными может быть сложно поддерживать единообразие, особенно в международных командах.
2. **Похожие символы**: Некоторые кириллические и латинские буквы выглядят одинаково, но на самом деле различны. Например:
   - **а (кириллическая "а")** и **a (латинская "a")**
   - **о (кириллическая "о")** и **o (латинская "o")**
   - **р (кириллическая "р")** и **p (латинская "p")**

Использование похожих символов может привести к ошибкам, которые сложно отследить, особенно если среда разработки не поддерживает кодировки кириллицы.

#### Буквы, которых стоит избегать, даже в латинице:

1. **l** (маленькая латинская "L") и **1** (цифра один) — эти символы выглядят почти одинаково, особенно в некоторых шрифтах.
2. **b** (маленькая латинская "b") и **6** (цифра шесть) — могут быть спутаны, особенно в курсивных шрифтах.
3. **n** и **m** — часто схожи визуально, если написаны слишком близко.
4. **l** и **I** (маленькая "L" и заглавная "i") — могут быть перепутаны в некоторых шрифтах.

#### Рекомендации:

- **Используйте понятные английские названия переменных**: Это помогает избежать путаницы и сделать код более читаемым для других разработчиков.
- **Проверяйте, на каком языке вводите переменные**: Будьте внимательны, особенно с похожими символами.
- **Избегайте букв, которые могут выглядеть схоже**: Это снизит вероятность ошибок и улучшит читаемость кода.


#### Итоги

Правильное использование синтаксиса и комментариев помогает писать код, который легко поддерживать и расширять. Это важный навык для аналитиков, работающих с большими объемами данных и сложными алгоритмами.

### Основы Python: Типы данных и операции

Python — это язык программирования, известный своей простотой и интуитивностью. Для работы с данными важно понимать основные типы данных, операции, которые можно с ними выполнять, и как организовать данные в структуре, с которыми удобно работать.

#### 1. Основные типы данных в Python

Python поддерживает несколько базовых типов данных, которые часто используются в аналитике:

- **int** (целые числа): это числа без дробной части, например 5, 10, -3.
- **float** (числа с плавающей запятой): это числа с дробной частью, например 3.14, -0.001.
- **str** (строки): это последовательность символов, например "Python", "Аналитика".
- **bool** (логические значения): это тип данных, который может иметь только два значения: `True` (истина) и `False` (ложь).

##### Пример кода:
```python
# Примеры основных типов данных
a = 10  # int
b = 3.14  # float
name = "Аналитик"  # str
is_active = True  # bool

print(a)  # Выводит 10
print(b)  # Выводит 3.14
print(name)  # Выводит "Аналитик"
print(is_active)  # Выводит True
```

##### Комментирование кода:

Испольуйте знак `#` - все что идет после него в строке, не воспринимается интерпретатором как команда.

#### 2. Операции с основными типами данных

##### Арифметические операции

Python позволяет выполнять все стандартные арифметические операции с числами:

- Сложение: `+`
- Вычитание: `-`
- Умножение: `*`
- Деление: `/`
- Возведение в степень: `**`

##### Пример кода:
```python
x = 5
y = 3

# Арифметические операции
print(x + y)  # Сложение: 8
print(x - y)  # Вычитание: 2
print(x * y)  # Умножение: 15
print(x / y)  # Деление: 1.6667
print(x ** y)  # Возведение в степень: 125
```

##### Операции со строками

- **Конкатенация (объединение строк)**: Строки можно объединять с помощью оператора `+`.
- **Повторение строк**: Строку можно умножить на число для её повторения.
- **Длина строки**: Функция `len()` возвращает количество символов в строке.

##### Пример кода:
```python
first_name = "Аналитик"
last_name = "Данных"

# Конкатенация строк
full_name = first_name + " " + last_name
print(full_name)  # Выводит "Аналитик Данных"

# Повторение строк
print(first_name * 3)  # Выводит "АналитикАналитикАналитик"

# Длина строки
print(len(full_name))  # Выводит 14
```

##### Операции с логическими значениями

- **Логическое И (and)**: возвращает `True`, если оба значения истинны.
- **Логическое ИЛИ (or)**: возвращает `True`, если хотя бы одно значение истинно.
- **Логическое НЕ (not)**: меняет значение на противоположное.

##### Пример кода:
```python
x = True
y = False

# Логические операции
print(x and y)  # Выводит False
print(x or y)  # Выводит True
print(not x)  # Выводит False
```

#### 3. Преобразование типов данных

Иногда требуется преобразовать значение одного типа данных в другой. Python поддерживает преобразование типов с помощью встроенных функций:

- `int()`: преобразование в целое число.
- `float()`: преобразование в число с плавающей запятой.
- `str()`: преобразование в строку.
- `bool()`: преобразование в логическое значение.

##### Пример кода:
```python
# Преобразование типов
a = "10"
b = 3.14

# Преобразование строки в число
a_int = int(a)
print(a_int)  # Выводит 10

# Преобразование числа в строку
b_str = str(b)
print(b_str)  # Выводит "3.14"
```

#### 4. Пример использования нескольких типов данных в одном коде

Предположим, вам нужно посчитать средний возраст сотрудников компании:

```python
ages = [25, 30, 35, 40]  # Список возрастов
total_age = sum(ages)  # Сумма всех возрастов
count = len(ages)  # Количество сотрудников

# Рассчет среднего возраста
average_age = total_age / count
print("Средний возраст сотрудников:", average_age)
```

В этом примере используется список, арифметические операции, а также функции для работы с данными, что показывает, как основные типы данных могут быть объединены в одной задаче.

### Списки и их адресация

Списки (или массивы) в Python — это упорядоченные коллекции элементов, которые могут быть любого типа данных. Списки удобны для хранения и обработки больших наборов данных, что делает их одним из самых популярных инструментов для работы в аналитике.

#### 1. Создание списка

Список создается с помощью квадратных скобок `[]`, а его элементы разделяются запятыми. В одном списке можно хранить данные разных типов, хотя чаще всего в аналитике используются списки с элементами одного типа, например, числовые данные.

##### Пример кода:
```python
# Создание списка
numbers = [1, 2, 3, 4, 5]  # Список целых чисел
mixed_list = [10, "Аналитик", 3.14, True]  # Список с разными типами данных

print(numbers)  # Выводит: [1, 2, 3, 4, 5]
print(mixed_list)  # Выводит: [10, 'Аналитик', 3.14, True]
```

#### 2. Доступ к элементам списка (индексация)

Каждый элемент списка имеет свой индекс, начиная с 0. Для доступа к элементу можно использовать его индекс, записывая его в квадратных скобках. Индексация в Python начинается с 0, что означает, что первый элемент имеет индекс 0, второй — 1, и так далее.

##### Пример кода:
```python
# Доступ к элементам списка
numbers = [1, 2, 3, 4, 5]

print(numbers[0])  # Первый элемент: 1
print(numbers[2])  # Третий элемент: 3
print(numbers[-1])  # Последний элемент: 5
```
В Python можно использовать отрицательные индексы для доступа к элементам с конца списка. Например, индекс `-1` означает последний элемент, `-2` — предпоследний и так далее.

#### 3. Изменение элементов списка

Вы можете изменять значения элементов списка, обращаясь к ним по индексу и присваивая новые значения.

##### Пример кода:
```python
# Изменение элемента списка
numbers = [1, 2, 3, 4, 5]
numbers[1] = 10  # Изменяем второй элемент

print(numbers)  # Выводит: [1, 10, 3, 4, 5]
```

#### 4. Добавление и удаление элементов списка

Python предоставляет несколько встроенных методов для работы со списками:

- **append()**: добавляет элемент в конец списка.
- **insert()**: вставляет элемент по указанному индексу.
- **remove()**: удаляет первое вхождение элемента в список.
- **pop()**: удаляет элемент по индексу и возвращает его.

##### Пример кода:
```python
# Добавление и удаление элементов списка
numbers = [1, 2, 3, 4, 5]

# Добавление элемента в конец списка
numbers.append(6)
print(numbers)  # Выводит: [1, 2, 3, 4, 5, 6]

# Вставка элемента на второй позиции (индекс 1)
numbers.insert(1, 10)
print(numbers)  # Выводит: [1, 10, 2, 3, 4, 5, 6]

# Удаление элемента со значением 10
numbers.remove(10)
print(numbers)  # Выводит: [1, 2, 3, 4, 5, 6]

# Удаление последнего элемента и его возвращение
last_number = numbers.pop()
print(last_number)  # Выводит: 6
print(numbers)  # Выводит: [1, 2, 3, 4, 5]
```

#### 5. Срезы (slicing)

Срезы позволяют выбрать несколько элементов из списка, указывая диапазон индексов. Синтаксис среза: `[start:stop]`, где `start` — начальный индекс, а `stop` — индекс, на котором нужно остановиться (не включается в результат).

##### Пример кода:
```python
numbers = [1, 2, 3, 4, 5, 6]

# Срез от 2-го до 4-го элемента (индексы 1 и 4)
print(numbers[1:4])  # Выводит: [2, 3, 4]

# Срез с начала до третьего элемента
print(numbers[:3])  # Выводит: [1, 2, 3]

# Срез с третьего элемента до конца списка
print(numbers[3:])  # Выводит: [4, 5, 6]

# Срез всего списка
print(numbers[:])  # Выводит: [1, 2, 3, 4, 5, 6]
```

#### 6. Циклы для работы со списками

Часто возникает необходимость пройти по всем элементам списка и выполнить над ними какие-то действия. Для этого можно использовать цикл `for`.

##### Пример кода:
```python
numbers = [1, 2, 3, 4, 5]

# Пройдем по каждому элементу и умножим его на 2
for num in numbers:
    print(num * 2)
```

#### 7. Вложенные списки (списки в списках)

Python поддерживает вложенные списки, что позволяет создавать двумерные структуры данных, аналогичные таблицам.

##### Пример кода:
```python
# Вложенные списки
matrix = [
    [1, 2, 3],
    [4, 5, 6],
    [7, 8, 9]
]

# Доступ к элементам вложенного списка
print(matrix[0][0])  # Первый элемент первой строки: 1
print(matrix[1][2])  # Третий элемент второй строки: 6
```

#### Пример практического использования

Предположим, у вас есть список чисел, и вам нужно вывести только те числа, которые больше 3:

```python
numbers = [1, 2, 3, 4, 5, 6]

# Фильтрация списка
filtered_numbers = []
for num in numbers:
    if num > 3:
        filtered_numbers.append(num)

print(filtered_numbers)  # Выводит: [4, 5, 6]
```

Таким образом, списки являются универсальным инструментом для работы с наборами данных и предоставляют множество возможностей для их обработки.


### Работа с DataFrame

Одним из самых важных инструментов для аналитиков в Python является библиотека `pandas`, которая предоставляет возможность работать с данными в табличном формате через структуру **DataFrame**. DataFrame можно представить как таблицу, где строки — это записи, а столбцы — это разные переменные (фичи).

#### 1. Импорт библиотеки pandas

Первое, что нужно сделать для работы с DataFrame, — это импортировать библиотеку `pandas`. В большинстве примеров используется сокращение `pd`, чтобы упростить доступ к функциям библиотеки.

##### Пример кода:
```python
import pandas as pd
```

#### 2. Создание DataFrame

DataFrame можно создать несколькими способами: вручную, загрузив данные из файла (например, Excel), или на основе существующих данных, таких как списки или словари.

##### Пример создания DataFrame вручную:
```python
# Создание DataFrame вручную с помощью словаря
data = {
    'Имя': ['Алексей', 'Мария', 'Иван'],
    'Возраст': [29, 22, 35],
    'Должность': ['Аналитик', 'Маркетолог', 'Разработчик']
}

df = pd.DataFrame(data)
print(df)
```
Вывод:
```
       Имя  Возраст    Должность
0  Алексей       29     Аналитик
1   Мария       22  Маркетолог
2    Иван       35  Разработчик
```

#### 3. Загрузка данных из Excel

В реальных задачах чаще всего данные хранятся в файлах, таких как Excel. `pandas` позволяет легко загружать такие данные и работать с ними.

##### Пример загрузки данных из Excel:
```python
# Загрузка данных из Excel
df = pd.read_excel('data.xlsx') # измените название файла

# Просмотр первых 5 строк DataFrame
print(df.head())
```

Функция `head()` выводит первые несколько строк таблицы, что помогает быстро оценить содержимое DataFrame.

#### 4. Основные операции с DataFrame

##### Просмотр информации о данных

`pandas` предоставляет полезные методы для получения общей информации о данных.

- **`info()`**: показывает информацию о структуре DataFrame, включая количество строк, столбцов и типы данных.
- **`describe()`**: выводит статистическое описание числовых столбцов, включая среднее, стандартное отклонение и диапазон значений.

##### Пример:
```python
# Общая информация о DataFrame
df.info()

# Статистическое описание числовых данных
df.describe()
```

##### Доступ к данным по столбцам

Для того чтобы получить доступ к определённому столбцу DataFrame, можно использовать его название в квадратных скобках.

##### Пример:
```python
# Доступ к столбцу "Возраст"
ages = df['Возраст']
print(ages)
```

##### Индексация строк и столбцов

`pandas` поддерживает индексацию с помощью методов **`loc`** (доступ по меткам) и **`iloc`** (доступ по индексам).

##### Пример использования `loc`:
```python
# Доступ к строке с меткой 1 и столбцу "Имя"
print(df.loc[1, 'Имя'])  # Выводит: Мария
```

##### Пример использования `iloc`:
```python
# Доступ к элементу в первой строке и втором столбце
print(df.iloc[0, 1])  # Выводит: 29 (возраст Алексея)
```

#### 5. Фильтрация данных

Вы можете фильтровать данные в DataFrame, используя условия. Например, можно выбрать только те строки, где возраст больше 30 лет.

##### Пример фильтрации данных:
```python
# Фильтрация данных: возраст больше 30
filtered_df = df[df['Возраст'] > 30]
print(filtered_df)
```

Вывод:
```
   Имя  Возраст   Должность
2  Иван       35  Разработчик
```

#### 6. Добавление и удаление столбцов

Вы можете легко добавлять новые столбцы в DataFrame, создавая вычисляемые поля, или удалять ненужные столбцы.

##### Пример добавления нового столбца:
```python
# Добавление нового столбца с увеличенным возрастом
df['Возраст через 5 лет'] = df['Возраст'] + 5
print(df)
```

##### Пример удаления столбца:
```python
# Удаление столбца "Должность"
df = df.drop(columns=['Должность'])
print(df)
```

#### 7. Группировка данных

Метод **`groupby()`** позволяет группировать данные по определённому признаку и выполнять над ними агрегирующие функции, такие как сумма, среднее и т.д.

##### Пример группировки данных:
```python
# Группировка по должности и расчет среднего возраста
grouped_df = df.groupby('Должность')['Возраст'].mean()
print(grouped_df)
```

#### Пример практического использования

Предположим, у вас есть таблица с данными о сотрудниках, и вы хотите посчитать средний возраст по каждому департаменту:

```python
# Загрузка данных
df = pd.read_excel('employees.xlsx')

# Группировка по департаменту и расчет среднего возраста
average_age_per_department = df.groupby('Департамент')['Возраст'].mean()

print(average_age_per_department)
```

DataFrame — это мощный инструмент для работы с данными, который позволяет легко загружать, фильтровать, анализировать и агрегировать данные, а также производить над ними всевозможные вычисления.

### Практическое задание

Это задание поможет вам закрепить основные концепции работы с Python, которые вы уже изучили. Выполняя его, вы сможете применить свои знания о типах данных, операциях с ними, работе со списками и DataFrame, а также попрактикуетесь в написании кода с комментариями.

#### Задание 1: Работа с переменными и операциями

1. Создайте три переменные для хранения чисел, представляющих возраста сотрудников: `age1`, `age2` и `age3`. Присвойте им значения 30, 25 и 40 соответственно.
2. Вычислите сумму возрастов этих сотрудников и сохраните результат в переменной `total_age`.
3. Вычислите средний возраст сотрудников, разделив сумму на количество сотрудников, и сохраните результат в переменной `average_age`.
4. Выведите результат на экран с помощью функции `print()`.

##### Пример кода:
```python
# Задание 1: Рассчет среднего возраста сотрудников
age1 = 30  # Возраст первого сотрудника
age2 = 25  # Возраст второго сотрудника
age3 = 40  # Возраст третьего сотрудника

# Рассчитываем сумму возрастов
total_age = age1 + age2 + age3

# Рассчитываем средний возраст
employee_count = 3  # Количество сотрудников
average_age = total_age / employee_count

# Вывод среднего возраста
print("Средний возраст сотрудников:", average_age)
```

#### Задание 2: Работа со списками

1. Создайте список с возрастами сотрудников: `ages = [30, 25, 40]`.
2. Добавьте возраст нового сотрудника в список, используя метод `append()`.
3. Вычислите и выведите средний возраст всех сотрудников, используя цикл `for`.

##### Пример кода:
```python
# Задание 2: Работа со списками
ages = [30, 25, 40]  # Список возрастов сотрудников

# Добавляем возраст нового сотрудника
ages.append(35)

# Рассчитываем сумму возрастов с помощью цикла
total_age = 0
for age in ages:
    total_age += age

# Рассчитываем средний возраст
average_age = total_age / len(ages)

# Вывод среднего возраста
print("Средний возраст всех сотрудников:", average_age)
```

#### Задание 3: Работа с DataFrame

1. Создайте DataFrame, используя библиотеку `pandas`, для хранения данных о сотрудниках:
   - Столбцы: `Name` (Имя), `Age` (Возраст), `Position` (Должность).
   - Данные: `["Alex", "Maria", "Ivan"]` для `Name`, `[30, 25, 40]` для `Age`, `["Analyst", "Marketing", "Developer"]` для `Position`.
2. Выведите первые строки DataFrame с помощью метода `head()`.
3. Отфильтруйте DataFrame, чтобы оставить только тех сотрудников, чей возраст больше 30 лет.

##### Пример кода:
```python
# Задание 3: Работа с DataFrame
import pandas as pd

# Создаем DataFrame
data = {
    'Name': ['Alex', 'Maria', 'Ivan'],
    'Age': [30, 25, 40],
    'Position': ['Analyst', 'Marketing', 'Developer']
}

df = pd.DataFrame(data)

# Выводим первые строки DataFrame
print(df.head())

# Фильтрация сотрудников старше 30 лет
filtered_df = df[df['Age'] > 30]
print(filtered_df)
```

#### Дополнительные задачи (по желанию):

1. Добавьте новый столбец в DataFrame, который будет содержать возраст сотрудников через 5 лет.
2. Используйте метод `groupby()` для вычисления среднего возраста сотрудников по каждой должности.

---

Эти задания помогут вам лучше понять, как работать с основными типами данных, списками и DataFrame в Python.