## Загрузка данных из CSV файла и вывод первых 5 строк

In [None]:
# Импортируем библиотеку pandas
import pandas as pd

# Загружаем данные из CSV файла в DataFrame (табличную структуру данных)
df = pd.read_csv('data.csv')

# Выводим первые 5 строк DataFrame
print(df.head())


## Фильтрация данных по условию

In [None]:
# Импортируем библиотеку pandas
import pandas as pd

# Загружаем данные из CSV файла в DataFrame
df = pd.read_csv('data.csv')

# Фильтруем данные, оставляя только те строки, где значение в столбце 'age' больше 30
filtered_df = df[df['age'] > 30]

# Выводим отфильтрованные данные
print(filtered_df)


## Группировка данных и агрегация

In [None]:
# Импортируем библиотеку pandas
import pandas as pd

# Загружаем данные из CSV файла в DataFrame
df = pd.read_csv('data.csv')

# Группируем данные по столбцу 'country' и вычисляем среднее значение столбца 'salary'
grouped_df = df.groupby('country')['salary'].mean()

# Выводим результат группировки и агрегации
print(grouped_df)

## Создание нового столбца на основе существующих данных

In [None]:
# Импортируем библиотеку pandas
import pandas as pd

# Загружаем данные из CSV файла в DataFrame
df = pd.read_csv('data.csv')

# Создаем новый столбец 'full_name', объединяя значения столбцов 'first_name' и 'last_name'
df['full_name'] = df['first_name'] + ' ' + df['last_name']

# Выводим результат
print(df)


## Сортировка данных по столбцу

In [None]:
# Импортируем библиотеку pandas
import pandas as pd

# Загружаем данные из CSV файла в DataFrame
df = pd.read_csv('data.csv')

# Сортируем данные по столбцу 'age' в порядке возрастания
sorted_df = df.sort_values('age')

# Выводим результат
print(sorted_df)


##  Применение функции к столбцу

In [None]:
# Импортируем библиотеку pandas
import pandas as pd

# Загружаем данные из CSV файла в DataFrame
df = pd.read_csv('data.csv')

# Определяем функцию, которая преобразует возраст в категорию
def age_to_category(age):
    if age < 18:
        return 'child'
    elif age < 65:
        return 'adult'
    else:
        return 'senior'

# Применяем функцию age_to_category к столбцу 'age' и создаем новый столбец 'age_category'
df['age_category'] = df['age'].apply(age_to_category)

# Выводим результат
print(df)


## Сохранение DataFrame в CSV файл

In [None]:
# Импортируем библиотеку pandas
import pandas as pd

# Загружаем данные из CSV файла в DataFrame
df = pd.read_csv('data.csv')

# Удаляем столбец 'age' из DataFrame
df.drop('age', axis=1, inplace=True)

# Сохраняем измененный DataFrame в новый CSV файл
df.to_csv('modified_data.csv', index=False)

# Успешно сохранено в файл modified_data.csv


## Выбор данных с использованием индекса и меток столбцов

In [None]:
# Импортируем библиотеку pandas
import pandas as pd

# Загружаем данные из CSV файла в DataFrame
df = pd.read_csv('data.csv')

# Выбираем данные из строки с индексом 3 и столбца 'salary'
value = df.loc[3, 'salary']

# Выводим результат
print(value)


## Изменение индекса на уникальное значение столбца

In [None]:
# Импортируем библиотеку pandas
import pandas as pd

# Загружаем данные из CSV файла в DataFrame
df = pd.read_csv('data.csv')

# Устанавливаем столбец 'id' в качестве индекса
df.set_index('id', inplace=True)

# Выводим результат
print(df)


## Транспонирование DataFrame

In [None]:
# Импортируем библиотеку pandas
import pandas as pd

# Загружаем данные из CSV файла в DataFrame
df = pd.read_csv('data.csv')

# Транспонируем DataFrame (меняем местами строки и столбцы)
transposed_df = df.T

# Выводим результат
print(transposed_df)


## Вычисление скользящего среднего

In [22]:
# Импортируем библиотеку pandas
import pandas as pd

# Загружаем данные из CSV файла в DataFrame
df = pd.read_csv('time_series_data.csv')

# Преобразуем столбец 'date' в формат datetime и устанавливаем его в качестве индекса
df['date'] = pd.to_datetime(df['date'])
df.set_index('date', inplace=True)

# Вычисляем скользящее среднее с окном в 3 периода для столбца 'value'
df['rolling_mean'] = df['value'].rolling(window=3).mean()

# Выводим результат
print(df)



            value  rolling_mean
date                           
2022-01-01    100           NaN
2022-01-02    120           NaN
2022-01-03    110    110.000000
2022-01-04    115    115.000000
2022-01-05    105    110.000000
2022-01-06    140    120.000000
2022-01-07    135    126.666667
2022-01-08    130    135.000000
2022-01-09    145    136.666667
2022-01-10    150    141.666667
