# Базовые основы Python, виды графиков в Matplotlib и азы Pandas

Этот ноутбук предназначен для тех, кто никогда не работал с Python, но хочет разобраться с основами за пару часов.

## Содержание
1. [Введение](#intro)  
2. [Основы Python](#python_basics)  
    1. [Переменные, типы данных, вывод](#variables)  
    2. [Условные операторы, циклы](#conditions_loops)  
    3. [Функции](#functions)  
3. [Построение графиков с Matplotlib](#matplotlib)  
    1. [Линейный график](#line_plot)  
    2. [Диаграмма рассеяния (scatter plot)](#scatter_plot)  
    3. [Столбиковая диаграмма (bar plot) и гистограмма (histogram)](#bar_hist)  
4. [Основы Pandas](#pandas)  
    1. [Создание и работа с DataFrame](#dataframe)  
    2. [Чтение файлов и базовые операции](#reading_files)  
    3. [Описательная статистика и простые графики](#basic_stats)  
5. [Заключение](#conclusion)  


# 1. Введение <a name="intro"></a>

В этом ноутбуке мы познакомимся с основами языка программирования **Python**, научимся строить графики с помощью библиотеки **Matplotlib**, а также освоим базовые приёмы работы с данными в библиотеке **Pandas**. Если вы ранее не программировали, не переживайте: мы разберёмся с самыми главными концепциями и попробуем сразу применять их на практике.

> **Совет**: Чтобы выполнить код в ячейках Google Colab:
> 1. Кликните внутри ячейки с кодом.
> 2. Нажмите кнопку «▶» слева от ячейки или используйте сочетание клавиш `Shift+Enter`.


# 2. Основы Python <a name="python_basics"></a>

## 2.1 Переменные, типы данных, вывод <a name="variables"></a>

В Python не нужно объявлять переменную заранее — она создаётся при первом присвоении. Давайте рассмотрим примеры базовых типов данных: **числа** (int, float), **строки** (str), **логические значения** (bool).

In [None]:
# Пример 1: вывод в консоль
print("Hello, world!")

In [None]:
# Пример 2: переменные, числа и строки
x = 10                # целое число (int)
pi = 3.14             # число с плавающей точкой (float)
name = "Alice"        # строка (str)
is_student = True     # логическое значение (bool)

print("x =", x)
print("pi =", pi)
print("name =", name)
print("is_student =", is_student)

### Упражнение 1
1. Создайте переменную `my_age` и присвойте ей ваш возраст (целое число).  
2. Создайте переменную `my_height` и присвойте ей ваш рост (число с плавающей точкой).  
3. Выведите обе переменные, используя функцию `print()`.

**Пример кода** (раскомментируйте и заполните сами):

In [None]:
# my_age = ...
# my_height = ...

# print("Мой возраст:", my_age)
# print("Мой рост:", my_height)

---
## 2.2 Условные операторы, циклы <a name="conditions_loops"></a>

### Условные операторы `if`, `elif`, `else`
Условные операторы позволяют выполнять определённый код только при соблюдении некоторого условия.

In [None]:
age = 20

if age < 18:
    print("Несовершеннолетний")
elif age < 65:
    print("Взрослый")
else:
    print("Пожилой человек")

### Циклы `for` и `while`
Циклы упрощают повторение однотипных операций.

In [None]:
# Пример: цикл for
numbers = [1, 2, 3, 4, 5]
for num in numbers:
    print(num, num**2)

In [None]:
# Пример: цикл while
count = 0
while count < 5:
    print("Count is:", count)
    count += 1

### Упражнение 2
1. Напишите цикл `for`, который выводит квадраты чисел от 1 до 10.  
2. С помощью цикла `while` выведите только нечётные числа от 1 до 10.

---
## 2.3 Функции <a name="functions"></a>

Функции помогают структурировать код, делая его повторно используемым и читабельным.

In [None]:
def greet_user(name):
    """
    Функция выводит приветственное сообщение,
    принимая на вход имя пользователя.
    """
    print(f"Привет, {name}!")

greet_user("Татьяна")

In [None]:
def add_numbers(a, b):
    return a + b

result = add_numbers(5, 7)
print("Результат сложения:", result)

### Упражнение 3
1. Создайте функцию `multiply_numbers(a, b)`, которая принимает два числа и возвращает их произведение.  
2. Вызовите функцию с любыми аргументами и выведите результат.

# 3. Построение графиков с Matplotlib <a name="matplotlib"></a>

[Matplotlib](https://matplotlib.org/) — одна из наиболее популярных библиотек для визуализации данных в Python. С её помощью можно строить практически любые графики.

Для начала импортируем библиотеку:

In [None]:
import matplotlib.pyplot as plt
import numpy as np  # NumPy пригодится для генерации данных

## 3.1 Линейный график <a name="line_plot"></a>

Создадим простые данные и отобразим их на линейном графике:

In [None]:
# Создадим массив из 10 точек от 0 до 9
x = np.arange(10)
y = x ** 2

plt.plot(x, y, marker='o', linestyle='-', color='b', label='y = x^2')
plt.title("Линейный график (y = x^2)")
plt.xlabel("x")
plt.ylabel("y")
plt.legend()
plt.grid(True)
plt.show()

## 3.2 Диаграмма рассеяния (scatter plot) <a name="scatter_plot"></a>

Диаграмма рассеяния удобно показывает взаимосвязь между двумя наборами чисел.

In [None]:
# Генерируем случайные данные
np.random.seed(42)
x_scatter = np.random.rand(50)
y_scatter = np.random.rand(50)

plt.scatter(x_scatter, y_scatter, color='red', label='Random Points')
plt.title("Диаграмма рассеяния (Scatter Plot)")
plt.xlabel("X")
plt.ylabel("Y")
plt.legend()
plt.show()

## 3.3 Столбиковая диаграмма (bar plot) и гистограмма (histogram) <a name="bar_hist"></a>

**Столбиковая диаграмма**:

In [None]:
labels = ['A', 'B', 'C', 'D']
values = [10, 24, 36, 18]

plt.bar(labels, values, color=['blue', 'green', 'orange', 'red'])
plt.title("Столбиковая диаграмма")
plt.xlabel("Категории")
plt.ylabel("Значения")
plt.show()

**Гистограмма** (распределение значений):

In [None]:
data = np.random.randn(1000)  # Генерируем 1000 значений из нормального распределения
plt.hist(data, bins=30, color='purple', edgecolor='black')
plt.title("Гистограмма")
plt.xlabel("Значение")
plt.ylabel("Частота")
plt.show()

# 4. Основы Pandas <a name="pandas"></a>

[Pandas](https://pandas.pydata.org/) — ключевая библиотека Python для работы с табличными данными. Основная структура данных в Pandas — это `DataFrame`.

In [None]:
import pandas as pd

## 4.1 Создание и работа с DataFrame <a name="dataframe"></a>

Создадим DataFrame из словаря Python:

In [None]:
data = {
    'Name': ['Alice', 'Bob', 'Charlie', 'Diana'],
    'Age': [24, 30, 18, 35],
    'City': ['New York', 'Moscow', 'Berlin', 'Tokyo']
}

df = pd.DataFrame(data)
df

## 4.2 Чтение файлов и базовые операции <a name="reading_files"></a>

Обычно данные хранятся в CSV или Excel-файлах. Предположим, у нас есть файл `data.csv` в той же папке. Тогда можно прочитать его так:
```python
# df_csv = pd.read_csv("data.csv")
# df_csv.head()  # Показываем первые 5 строк
```

**Базовые методы** для DataFrame:

In [None]:
print(df.info())      # общая информация о столбцах и типах данных
print(df.describe())  # описательная статистика для числовых столбцов
print(df.columns)     # список столбцов
print(df.shape)       # размер таблицы (строки, столбцы)

### Индексация и выборка

In [None]:
# Выбрать один столбец:
ages = df['Age']

# Выбрать несколько столбцов:
subset = df[['Name', 'Age']]

# Фильтрация по условию (люди старше 20):
older_20 = df[df['Age'] > 20]

older_20

## 4.3 Описательная статистика и простые графики <a name="basic_stats"></a>

Для числовых столбцов можно быстро получить средние, медиану, минимум/максимум и т.д.:

In [None]:
print("Средний возраст:", df['Age'].mean())
print("Максимальный возраст:", df['Age'].max())

### Построение графиков средствами Pandas
Pandas умеет строить простые графики «из коробки», используя Matplotlib:

In [None]:
df['Age'].plot(kind='hist', bins=5, title='Распределение возрастов')
plt.xlabel("Возраст")
plt.show()

> **Важно:** Для более тонкой кастомизации графиков удобнее использовать Matplotlib напрямую (или другие библиотеки вроде Seaborn).

# 5. Заключение <a name="conclusion"></a>

Поздравляем! Вы прошли экспресс-знакомство с:
1. **Базовыми конструкциями Python** (переменные, типы данных, условия, циклы, функции).  
2. **Построением графиков** при помощи библиотеки Matplotlib (линейные графики, scatter plot, столбиковые диаграммы, гистограммы).  
3. **Работой с таблицами** в Pandas (создание DataFrame, чтение данных, базовые методы анализа и визуализации).

### Куда двигаться дальше?
- Изучить **конструкции Python** глубже: списки, словари, кортежи, множества, генераторы, ООП и др.  
- Попробовать расширенные возможности **Matplotlib** (подписи, стили, subplot'ы).  
- Изучить **Pandas** подробнее: группировки (`groupby`), слияние/соединение таблиц (`merge`, `join`), сводные таблицы (`pivot_table`) и т.д.  
- Обратить внимание на другие библиотеки для визуализации, например, **Seaborn**, **Plotly**.

Удачи в дальнейшем обучении и экспериментах с данными!

---
## Дополнительно
- [Официальная документация по Python](https://docs.python.org/3/)  
- [Документация по NumPy](https://numpy.org/doc/)  
- [Документация по Matplotlib](https://matplotlib.org/stable/contents.html)  
- [Документация по Pandas](https://pandas.pydata.org/docs/)

---
**Сохраните этот ноутбук на Google Drive**, чтобы вернуться к нему в любой момент, а также делитесь им с коллегами и друзьями, которые хотят быстро освоить основы Python.

Если есть вопросы — задавайте! Хорошего обучения.