**Pandas** — это мощная библиотека для языка программирования Python, которая используется для анализа и обработки данных. Она предоставляет удобные инструменты для работы с табличными данными, а также с данными из различных источников, таких как CSV, Excel, SQL базы данных и другие форматы.

Основные возможности Pandas включают:

- **DataFrame** — это двухмерная структура данных, похожая на таблицы в базе данных или электронные таблицы Excel. С помощью DataFrame можно легко манипулировать данными, добавлять и удалять столбцы, фильтровать строки и выполнять другие операции.
  
- **Series** — это одномерная структура данных, аналогичная массиву или списку, которая часто используется для представления одного столбца или строки данных.

- **Чтение и запись данных** — Pandas поддерживает импорт данных из разных форматов (CSV, Excel, SQL и др.) и экспорт данных в эти форматы.
  
- **Группировка, фильтрация и агрегация** — библиотека позволяет группировать данные по категориям, фильтровать их по заданным условиям, а также выполнять агрегатные операции, такие как суммирование, подсчет или вычисление среднего.

- **Работа с отсутствующими данными** — Pandas предлагает удобные методы для работы с отсутствующими значениями, такие как заполнение или удаление пропущенных данных.

Pandas делает обработку данных более простой и эффективной, предоставляя высокоуровневые структуры и функции, которые упрощают задачу работы с большими наборами данных и их анализа.

**Pandas** — это универсальная библиотека для работы с данными, и ее возможности гораздо шире, чем базовые функции обработки данных. Вот еще несколько ключевых аспектов, которые делают Pandas незаменимым инструментом для анализа данных:

### 1. **Гибкость работы с разными форматами данных**
Pandas поддерживает чтение и запись данных из множества форматов, таких как:
- CSV-файлы
- Excel (XLS и XLSX)
- SQL базы данных (с использованием SQLAlchemy)
- JSON
- HTML-таблицы
- Паркет (Parquet)
  
Это делает Pandas отличным инструментом для интеграции данных из различных источников и их преобразования.

### 2. **Работа с временными рядами**
Pandas предоставляет встроенные функции для работы с временными рядами. Можно легко выполнять такие операции, как:
- Конвертация строк в даты с помощью `pd.to_datetime()`
- Упрощение работы с временными метками
- Частотный ресемплинг данных (например, агрегация по дням, месяцам или годам)
- Сдвиг временных данных вперёд или назад для анализа тенденций

### 3. **Манипуляции с данными**
Pandas предлагает широкий спектр возможностей для модификации данных:
- **Слияние и соединение данных**: функции `merge()`, `join()` и `concat()` позволяют объединять несколько DataFrame на основе общих ключей или индексов.
- **Работа с индексами**: вы можете назначить один или несколько столбцов в качестве индексов, что делает выборку и работу с данными более эффективной.
- **Применение функций к данным**: с помощью метода `apply()` можно применять произвольные функции ко всем значениям в DataFrame или Series.
- **Трансформация данных**: Pandas позволяет легко масштабировать, нормализовать и трансформировать данные для их дальнейшего анализа.

### 4. **Обработка отсутствующих данных**
Pandas предлагает мощные инструменты для работы с пропущенными значениями (NaN):
- **Заполнение пропусков**: метод `fillna()` позволяет заменить пропущенные значения определённым значением или методами (например, средним, медианой).
- **Удаление пропусков**: метод `dropna()` позволяет удалить строки или столбцы с пропущенными значениями.
- **Заполнение вперёд/назад**: методы `ffill()` и `bfill()` позволяют заполнить пропущенные значения на основе предыдущих или последующих значений.

### 5. **Группировка и агрегация данных**
Функции группировки в Pandas позволяют выполнять сложные вычисления для разных категорий данных:
- **Группировка** с помощью метода `groupby()` позволяет разбить данные на группы по определенным критериям (например, по категориям, дате или другим атрибутам) и выполнять агрегатные операции, такие как сумма, среднее, минимум или максимум.
- **Сводные таблицы**: Pandas поддерживает создание сводных таблиц (`pivot_table()`), которые помогают легко агрегировать данные по нескольким уровням.

### 6. **Векторизация операций**
Pandas оптимизирован для работы с большими объемами данных за счёт векторизации, что означает, что большинство операций выполняются быстро, так как они реализованы на уровне библиотеки NumPy. Это позволяет выполнять такие операции, как арифметические вычисления, на целых столбцах и рядах данных без использования циклов.

### 7. **Визуализация данных**
Хотя Pandas не предназначен для визуализации сам по себе, он отлично интегрируется с библиотеками визуализации, такими как Matplotlib и Seaborn. Pandas позволяет легко строить графики на основе данных с помощью метода `.plot()`:
- Линейные графики
- Столбчатые диаграммы
- Гистограммы
- Графики разброса

Это упрощает визуальный анализ данных и нахождение закономерностей.

### 8. **Оптимизация памяти и производительности**
Pandas поддерживает возможность настройки типов данных для оптимизации использования памяти. Это важно при работе с большими наборами данных:
- Можно конвертировать столбцы в категории для экономии памяти.
- Pandas поддерживает работу с большими данными с помощью `chunking` (разбиение данных на части), что позволяет загружать и обрабатывать большие наборы данных по частям.

### 9. **Применение в реальных проектах**
Pandas активно используется в различных областях:
- **Финансы**: анализ временных рядов, предсказание цен на акции, анализ отчетности.
- **Наука о данных**: предобработка данных перед обучением моделей машинного обучения, создание feature engineering.
- **Бизнес-аналитика**: анализ продаж, маркетинговых кампаний, клиентских данных.

### 10. **Сообщество и экосистема**
Pandas имеет огромное сообщество разработчиков, которое постоянно расширяет функционал библиотеки. В интернете доступны тысячи примеров, учебных пособий и ответов на вопросы по Pandas. Она также хорошо интегрируется с другими библиотеками Python, такими как NumPy, SciPy, Matplotlib и scikit-learn.

В целом, **Pandas** — это мощный и гибкий инструмент, который делает работу с данными быстрой, простой и эффективной, что делает его незаменимым в арсенале любого аналитика данных или разработчика.

In [5]:
import pandas as pd

In [2]:
my_list_int = [1, 2, 3, 4, 5]
my_list_str = ['Marselle', 'Amanzhol', 'Aisha', 'Adil', 'Bektur']

In [3]:
pd.Series(my_list_int)

0    1
1    2
2    3
3    4
4    5
dtype: int64

1. **`pd.Series(my_list_int)`**:
   - Ты создаешь объект `Series` из списка чисел `my_list_int`. Индексы устанавливаются автоматически, начиная с 0.


In [4]:
pd.Series(my_list_str)

0    Marselle
1    Amanzhol
2       Aisha
3        Adil
4      Bektur
dtype: object

2. **`pd.Series(my_list_str)`**:
   - Создаешь объект `Series` из списка строк `my_list_str`. Индексы также автоматически устанавливаются начиная с 0.


In [24]:
pd.Series(my_list_str, index=my_list_int)

1    Marselle
2    Amanzhol
3       Aisha
4        Adil
5      Bektur
dtype: object

3. **`pd.Series(my_list_str, index=my_list_int)`**:
   - Создаешь объект `Series`, где данные — это строки из списка `my_list_str`, а индексы берутся из списка чисел `my_list_int`.


In [25]:
pd.Series(my_list_int, index=my_list_str)


Marselle    1
Amanzhol    2
Aisha       3
Adil        4
Bektur      5
dtype: int64

4. **`pd.Series(my_list_int, index=my_list_str)`**:
   - Ты создаешь объект `Series`, где данные — это числа из списка `my_list_int`, а индексы задаются именами из списка `my_list_str`.


In [6]:
import pandas as pd
import numpy as np

In [28]:
my_list_np = np.arange(18, 23)
my_list_np

array([18, 19, 20, 21, 22])

1. **`my_list_np = np.arange(1, 6)`**:
   - Используя библиотеку `numpy`, ты создаешь массив чисел от 1 до 5 включительно с помощью функции `np.arange()`. Массив `my_list_np` теперь содержит числа `[1, 2, 3, 4, 5]`.

2. **`my_list_np`**:
   - Здесь ты просто выводишь созданный массив, что позволяет увидеть его содержимое.


In [29]:
pd.Series(my_list_np)

0    18
1    19
2    20
3    21
4    22
dtype: int64

3. **`pd.Series(my_list_np)`**:
   - Ты создаешь объект `Series` из массива `my_list_np`. Индексы по умолчанию будут автоматически установлены, начиная с 0.

In [38]:
names = ['Marselle', 'Amanzhol', 'Aisha', 'Adil', 'Bektur']

series_wich_name = pd.Series(my_list_np, index=names)

print(series_wich_name['Marselle'])
print(series_wich_name[input('Age by name: ')])

18
18


1. **`names = ['Marselle', 'Amanzhol', 'Aisha', 'Adil', 'Bektur']`**:
   - Создается список имен, который будет использоваться в качестве индексов для объекта `Series`.

2. **`series_wich_name = pd.Series(my_list_np, index=names)`**:
   - Ты создаешь объект `Series` из массива `my_list_np` (числа от 1 до 5), используя список `names` в качестве индексов. Теперь значения в `Series` можно будет получать по именам.

3. **`print(series_wich_name['Marselle'])`**:
   - Здесь ты выводишь значение `Series`, соответствующее индексу `'Marselle'`. Поскольку в массиве `my_list_np` находится число 1 (первое значение), будет выведено `1`.

4. **`print(series_wich_name[input('Age by name: ')])`**:
   - В этой строке программа запрашивает у пользователя ввод имени, используя функцию `input()`. Введенное имя затем используется для получения значения из `series_wich_name`. Если введенное имя присутствует в индексе `Series`, соответствующее значение будет выведено. Если имя не существует, будет вызвано исключение `KeyError`.

In [40]:
series_wich_name['Marselle'] = 21
series_wich_name['Aisha'] = 19
print(series_wich_name)

Marselle    21
Amanzhol    19
Aisha       19
Adil        21
Bektur      22
dtype: int64


1. **`series_wich_name['Marselle'] = 21`**:
   - Ты изменяешь значение, соответствующее индексу `'Marselle'`, на `21`. Теперь `Marselle` будет ассоциироваться с возрастом `21`.

2. **`series_wich_name['Aisha'] = 19`**:
   - Ты обновляешь значение для индекса `'Aisha'`, установив его на `19`. Теперь `Aisha` будет ассоциироваться с возрастом `19`.

3. **`print(series_wich_name)`**:
   - Здесь выводится весь объект `Series`, показывая обновленные значения для индексов `'Marselle'` и `'Aisha'`. Остальные значения останутся без изменений.

В результате ты увидишь, что `series_wich_name` теперь содержит:
- `Marselle` — `21`
- `Amanzhol` — прежнее значение
- `Aisha` — `19`
- `Adil` — прежнее значение
- `Bektur` — прежнее значение 

In [54]:
numbers = np.arange(1, 5)

series = pd.Series(
    numbers,
    index=['a', 'b', 'c', 'd'],
    name='numbers'
)

series.name

'numbers'

В этом коде ты создаешь объект `Series` и устанавливаешь ему имя.

1. **`numbers = np.arange(1, 5)`**:
   - Создается массив чисел от 1 до 4 с помощью функции `np.arange()`. В `numbers` теперь находятся значения `[1, 2, 3, 4]`.

2. **`series = pd.Series(...)`**:
   - Ты создаешь объект `Series`, используя массив `numbers` в качестве данных. В качестве индексов задаются символы `['a', 'b', 'c', 'd']`. Также ты устанавливаешь имя для `Series` как `'numbers'`.

3. **`series.name`**:
   - Эта строка возвращает имя объекта `Series`. В данном случае это будет строка `'numbers'`, которую ты установил при создании `Series`.

Таким образом, после выполнения `series.name` ты получишь строку `'numbers'`, которая идентифицирует данный объект `Series`.

In [46]:
data = {
    'Marselle': ['Python', 'BackEnd'], 
    'Bektur': ['Python', 'DataScience'],
    'Adil': ['BackEnd', 'FrontEnd']
}

pd.DataFrame(data, index=['Rank1', 'Rank2'])

Unnamed: 0,Marselle,Bektur,Adil
Rank1,Python,Python,BackEnd
Rank2,BackEnd,DataScience,FrontEnd


В этом коде ты создаешь объект `DataFrame` из словаря с данными.

1. **`data`**:
   - Ты создаешь словарь, в котором ключи — это имена (например, `'Marselle'`, `'Bektur'`, `'Adil'`), а значения — списки, представляющие навыки или специальности этих людей (например, `['Python', 'BackEnd']` для `Marselle`).

2. **`pd.DataFrame(data, index=['Rank1', 'Rank2'])`**:
   - Здесь ты создаешь объект `DataFrame` с использованием словаря `data`. Параметр `index` устанавливает пользовательские индексы для строк, в данном случае `['Rank1', 'Rank2']`. Однако, поскольку в словаре три ключа, а в индексе только два значения, `pandas` автоматически дополнит его недостающими индексами, чтобы все строки были представлены.

Таким образом, в `DataFrame` будет три столбца (по именам) и несколько строк, в зависимости от того, как `pandas` обработает предоставленные данные. Каждый столбец будет содержать списки навыков для каждого имени. 

In [57]:
array_5x5 = np.arange(25).reshape(5, 5)
array_5x5

array([[ 0,  1,  2,  3,  4],
       [ 5,  6,  7,  8,  9],
       [10, 11, 12, 13, 14],
       [15, 16, 17, 18, 19],
       [20, 21, 22, 23, 24]])

In [65]:
from string import ascii_uppercase

letters = list(ascii_uppercase[:10])

ser = pd.Series(np.arange(len(letters)), index=letters)
ser

A    0
B    1
C    2
D    3
E    4
F    5
G    6
H    7
I    8
J    9
dtype: int64

1. **`from string import ascii_uppercase`**:
   - Импортируется строка `ascii_uppercase`, содержащая все заглавные буквы английского алфавита (от 'A' до 'Z').

2. **`letters = list(ascii_uppercase[:10])`**:
   - Создается список `letters`, который содержит первые 10 заглавных букв английского алфавита: `['A', 'B', 'C', 'D', 'E', 'F', 'G', 'H', 'I', 'J']`.

3. **`ser = pd.Series(np.arange(len(letters)), index=letters)`**:
   - Создается объект `Series`, в котором данные — это массив целых чисел от 0 до 9, создаваемый с помощью `np.arange(len(letters))`. Индексы для `Series` берутся из списка `letters`.
   - В результате получится `Series`, где каждой букве будет соответствовать целое число от 0 до 9.

Таким образом, каждая буква от 'A' до 'J' будет сопоставлена с соответствующим числом от 0 до 9.

In [77]:
print(ser.loc['C'])
print()
print(ser.loc[['A', 'B']])
print()
print(ser.loc['A':'C'])
print()
print(ser[ser > 5])

2

A    0
B    1
dtype: int64

A    0
B    1
C    2
dtype: int64

G    6
H    7
I    8
J    9
dtype: int64


In [81]:
ser ** 2
ser.sum()

np.int64(45)

In [83]:
def increase_by_two(el):
    return el + 2

ser = ser.apply(increase_by_two)
ser

A     4
B     5
C     6
D     7
E     8
F     9
G    10
H    11
I    12
J    13
dtype: int64

1. **`print(ser.loc['C'])`**:
   - Эта строка выводит значение, соответствующее индексу `'C'`. В данном случае это будет `2`.

2. **`print(ser.loc[['A', 'B']])`**:
   - Здесь ты выводишь значения, соответствующие индексам `'A'` и `'B'`. 

3. **`print(ser.loc['A':'C'])`**:
   - Эта строка выводит значения от индекса `'A'` до индекса `'C'` (включительно):

4. **`print(ser[ser > 5])`**:
   - Здесь ты выводишь значения, которые больше `5`.

5. **`ser ** 2`**:
   - Эта строка возводит каждый элемент `Series` в квадрат. Однако результат не сохраняется, и вывод не будет напечатан.

6. **`ser.sum()`**:
   - Суммирует все элементы в `ser`. Результат будет равен `0 + 1 + 2 + 3 + 4 + 5 + 6 + 7 + 8 + 9 = 45`.

7. **`def increase_by_two(el): return el + 2`**:
   - Определяется функция `increase_by_two`, которая увеличивает переданный элемент на 2.

8. **`ser = ser.apply(increase_by_two)`**:
    - Эта строка применяет функцию `increase_by_two` ко всем элементам `Series`, увеличивая каждое значение на 2. После этого `ser` будет содержать значения от `2` до `11`.

Таким образом, код демонстрирует различные способы доступа и манипуляции с данными в объекте `Series`.

In [106]:
import pandas as pd

source = pd.read_csv('sources/csv/telegram_accounts.csv')

1. **`source = pd.read_csv('sources/csv/telegram_accounts.csv')`**:
   - Ты используешь функцию `pd.read_csv()` из библиотеки `pandas`, чтобы загрузить данные из CSV файла.
   - `'sources/csv/telegram_accounts.csv'` указывает путь к файлу `telegram_accounts.csv`, который находится в папке `sources/csv`.
   - Функция читает содержимое этого файла и преобразует его в объект `DataFrame`, который сохраняется в переменной `source`. 

Таким образом, после выполнения этой строки кода переменная `source` будет содержать данные из файла `telegram_accounts.csv` в формате таблицы, что позволяет далее производить с ними различные операции и анализ.

In [117]:
source.head(5)

Unnamed: 0,username,phone_number,bio,last_seen,status,chat_history,group_name,notifications_enabled,language
0,cemerson0,549-510-1766,Cum sociis natoque penatibus et magnis dis par...,10/15/2020,offline,Proin at turpis a pede posuere nonummy. Intege...,Dr,True,Bosnian
1,sthurlborn1,190-677-8904,"Proin eu mi. Nulla ac enim. In tempor, turpis ...",9/16/2021,away,Ut at dolor quis odio consequat varius. Intege...,Mr,False,Telugu
2,mgirardoni2,377-906-4035,Fusce posuere felis sed lacus. Morbi sem mauri...,1/31/2022,online,Cras non velit nec nisi vulputate nonummy. Mae...,Dr,False,Japanese
3,jchard3,157-692-4457,Cras non velit nec nisi vulputate nonummy. Mae...,4/6/2022,online,Cum sociis natoque penatibus et magnis dis par...,Mrs,False,Japanese
4,efriedlos4,112-709-2790,"Proin leo odio, porttitor id, consequat in, co...",2/26/2021,away,"Maecenas leo odio, condimentum id, luctus nec,...",Dr,True,Swedish


1. **`source.head(5)`**:
   - Ты вызываешь метод `head()` на объекте `DataFrame`, который был создан ранее из файла `telegram_accounts.csv`.
   - Аргумент `5` указывает, что ты хочешь получить первые 5 строк (или записей) из этого DataFrame.

In [116]:
source.tail(5)

Unnamed: 0,username,phone_number,bio,last_seen,status,chat_history,group_name,notifications_enabled,language
995,dubachrn,341-661-8684,"Mauris enim leo, rhoncus sed, vestibulum sit a...",6/18/2020,away,Proin risus.,Dr,True,Dari
996,gwinsiowieckiro,799-727-0719,Nullam sit amet turpis elementum ligula vehicu...,7/25/2022,online,Curabitur in libero ut massa volutpat convalli...,Dr,False,Aymara
997,dspryrp,530-684-5497,Quisque porta volutpat erat. Quisque erat eros...,9/19/2022,online,Pellentesque ultrices mattis odio. Donec vitae...,Rev,True,Telugu
998,ccathenodrq,751-885-0987,Praesent id massa id nisl venenatis lacinia. A...,1/9/2020,away,Donec semper sapien a libero. Nam dui. Proin l...,Honorable,True,Thai
999,rmalsterrr,893-363-7657,In hac habitasse platea dictumst. Morbi vestib...,7/12/2022,online,Sed ante. Vivamus tortor. Duis mattis egestas ...,Rev,False,Finnish


1. **`source.tail(5)`**:
   - Ты вызываешь метод `tail()` на объекте `DataFrame`, который был создан из файла `telegram_accounts.csv`.
   - Аргумент `5` указывает, что ты хочешь получить последние 5 строк (или записей) из этого DataFrame.

In [118]:
source.shape

(1000, 9)

1. **`source.shape`**:
   - Ты обращаешься к атрибуту `shape` объекта `DataFrame`, который был создан из файла `telegram_accounts.csv`.
   - Атрибут `shape` возвращает кортеж, содержащий количество строк и количество столбцов в DataFrame.

In [121]:
pd.set_option('display.min_rows', 100)

source

Unnamed: 0,username,phone_number,bio,last_seen,status,chat_history,group_name,notifications_enabled,language
0,cemerson0,549-510-1766,Cum sociis natoque penatibus et magnis dis par...,10/15/2020,offline,Proin at turpis a pede posuere nonummy. Intege...,Dr,True,Bosnian
1,sthurlborn1,190-677-8904,"Proin eu mi. Nulla ac enim. In tempor, turpis ...",9/16/2021,away,Ut at dolor quis odio consequat varius. Intege...,Mr,False,Telugu
2,mgirardoni2,377-906-4035,Fusce posuere felis sed lacus. Morbi sem mauri...,1/31/2022,online,Cras non velit nec nisi vulputate nonummy. Mae...,Dr,False,Japanese
3,jchard3,157-692-4457,Cras non velit nec nisi vulputate nonummy. Mae...,4/6/2022,online,Cum sociis natoque penatibus et magnis dis par...,Mrs,False,Japanese
4,efriedlos4,112-709-2790,"Proin leo odio, porttitor id, consequat in, co...",2/26/2021,away,"Maecenas leo odio, condimentum id, luctus nec,...",Dr,True,Swedish
5,revery5,325-989-8188,Cum sociis natoque penatibus et magnis dis par...,8/12/2021,offline,In quis justo. Maecenas rhoncus aliquam lacus....,Dr,True,Hindi
6,tsneesby6,473-608-2932,Fusce consequat. Nulla nisl. Nunc nisl.\n\nDui...,5/1/2022,online,In eleifend quam a odio. In hac habitasse plat...,Honorable,False,Tsonga
7,lminto7,411-564-8352,Nullam sit amet turpis elementum ligula vehicu...,7/5/2021,away,"Cras mi pede, malesuada in, imperdiet et, comm...",Mrs,True,Swedish
8,yshrubshall8,543-571-0123,In congue. Etiam justo. Etiam pretium iaculis ...,3/11/2022,online,Integer ac leo. Pellentesque ultrices mattis o...,Mrs,False,Czech
9,lstainsby9,692-966-7810,Integer tincidunt ante vel ipsum. Praesent bla...,9/23/2022,away,Duis at velit eu est congue elementum. In hac ...,Honorable,False,Irish Gaelic


1. **`pd.set_option('display.min_rows', 100)`**:
   - Ты используешь функцию `set_option()` из библиотеки `pandas`, чтобы установить опцию отображения.
   - Аргумент `'display.min_rows'` указывает, что ты изменяешь минимальное количество строк, которое будет отображаться, когда выводится объект `DataFrame`. В данном случае ты устанавливаешь его значение на `100`. Это означает, что при отображении `DataFrame`, если в нем есть больше 100 строк, будет показано не менее 100 строк.

2. **`source`**:
   - Эта строка просто возвращает объект `DataFrame`, который был создан из файла `telegram_accounts.csv`, и теперь при его выводе будет применена установленная опция.

In [125]:
data = {
    'Name': ['Alice', 'Bob', 'Charlie', 'David', 'Eva'],
    'Age': [25, 30, 35, 40, 45],
    'City': ['New York', 'San Francisco', 'Los Angeles', 'Chicago', 'Seattle']
}

df = pd.DataFrame(data)
df

Unnamed: 0,Name,Age,City
0,Alice,25,New York
1,Bob,30,San Francisco
2,Charlie,35,Los Angeles
3,David,40,Chicago
4,Eva,45,Seattle


1. **Создание словаря `data`**:
   - Ты создаешь словарь с тремя ключами: `'Name'`, `'Age'` и `'City'`.
   - Каждому ключу соответствует список значений:
     - `'Name'`: имена людей (например, `['Alice', 'Bob', 'Charlie', 'David', 'Eva']`).
     - `'Age'`: возраст этих людей (например, `[25, 30, 35, 40, 45]`).
     - `'City'`: города, в которых они живут (например, `['New York', 'San Francisco', 'Los Angeles', 'Chicago', 'Seattle']`).

2. **Создание объекта `DataFrame`**:
   - Ты используешь `pd.DataFrame(data)`, чтобы создать объект `DataFrame` из словаря `data`. 
   - Этот `DataFrame` будет иметь три столбца: `'Name'`, `'Age'` и `'City'`, с соответствующими значениями из списка.

3. **Вывод `df`**:
   - Когда ты просто указываешь `df`, Jupyter Notebook или другой интерактивный интерпретатор автоматически отображает содержимое `DataFrame`.


In [134]:
print(df.loc[0])        
print(df.iloc[4, 2]) 

Seattle



1. **`print(df.loc[0])`**:
   - Ты используешь метод `loc[]`, чтобы получить данные из `DataFrame` `df` по метке индекса.
   - `0` — это индекс первой строки (первый элемент).
   - Эта команда вернет всю строку с индексом `0`, содержащую значения для всех столбцов (в данном случае, имя, возраст и город для 'Alice').
   - Вывод будет представлять собой серию, где индексы будут названия столбцов.

2. **`print(df.iloc[4, 2])`**:
   - Здесь ты используешь метод `iloc[]`, чтобы получить данные из `DataFrame` `df` по позиционным индексам.
   - `4` указывает на пятую строку (так как индексация начинается с нуля), а `2` указывает на третий столбец (также начиная с нуля).
   - Эта команда вернет значение в ячейке, находящейся в пятой строке и третьем столбце, что соответствует значению 'Seattle' (город для 'Eva').
   - Вывод будет именно это значение.


In [137]:
pd.reset_option('display.min_rows', 100)
source

Unnamed: 0,username,phone_number,bio,last_seen,status,chat_history,group_name,notifications_enabled,language
0,cemerson0,549-510-1766,Cum sociis natoque penatibus et magnis dis par...,10/15/2020,offline,Proin at turpis a pede posuere nonummy. Intege...,Dr,True,Bosnian
1,sthurlborn1,190-677-8904,"Proin eu mi. Nulla ac enim. In tempor, turpis ...",9/16/2021,away,Ut at dolor quis odio consequat varius. Intege...,Mr,False,Telugu
2,mgirardoni2,377-906-4035,Fusce posuere felis sed lacus. Morbi sem mauri...,1/31/2022,online,Cras non velit nec nisi vulputate nonummy. Mae...,Dr,False,Japanese
3,jchard3,157-692-4457,Cras non velit nec nisi vulputate nonummy. Mae...,4/6/2022,online,Cum sociis natoque penatibus et magnis dis par...,Mrs,False,Japanese
4,efriedlos4,112-709-2790,"Proin leo odio, porttitor id, consequat in, co...",2/26/2021,away,"Maecenas leo odio, condimentum id, luctus nec,...",Dr,True,Swedish
...,...,...,...,...,...,...,...,...,...
995,dubachrn,341-661-8684,"Mauris enim leo, rhoncus sed, vestibulum sit a...",6/18/2020,away,Proin risus.,Dr,True,Dari
996,gwinsiowieckiro,799-727-0719,Nullam sit amet turpis elementum ligula vehicu...,7/25/2022,online,Curabitur in libero ut massa volutpat convalli...,Dr,False,Aymara
997,dspryrp,530-684-5497,Quisque porta volutpat erat. Quisque erat eros...,9/19/2022,online,Pellentesque ultrices mattis odio. Donec vitae...,Rev,True,Telugu
998,ccathenodrq,751-885-0987,Praesent id massa id nisl venenatis lacinia. A...,1/9/2020,away,Donec semper sapien a libero. Nam dui. Proin l...,Honorable,True,Thai


1. **`pd.reset_option('display.min_rows', 100)`**:
   - Эта команда сбрасывает опцию отображения, установив минимальное количество строк для отображения обратно к значению по умолчанию.

In [160]:
source.iloc[-5:]
source.iloc[4: 5]
source.loc[:, 'bio']
source.loc[5, 'bio']
source.loc[5:7, 'bio']
source.loc[5:7, 'phone_number']

5    325-989-8188
6    473-608-2932
7    411-564-8352
Name: phone_number, dtype: object

1. **`source.iloc[-5:]`**:
   - Используется метод `iloc[]` для получения последних 5 строк из `DataFrame`. Этот метод обращается к данным по позиционным индексам.

2. **`source.iloc[4:5]`**:
   - Получает 5-ю строку (индекс 4) из `DataFrame`. Обратите внимание, что `iloc[4:5]` включает строку с индексом 4 и не включает строку с индексом 5.

3. **`source.loc[:, 'bio']`**:
   - Использует метод `loc[]`, чтобы получить все значения из столбца `'bio'`. Двоеточие `:` означает выбор всех строк.

4. **`source.loc[5, 'bio']`**:
   - Получает значение в ячейке, находящейся на 6-й строке (индекс 5) и в столбце `'bio'`.

5. **`source.loc[5:7, 'bio']`**:
   - Получает значения в столбце `'bio'` для строк с индексами от 5 до 7 (включительно).

6. **`source.loc[5:7, 'phone_number']`**:
   - Получает значения в столбце `'phone_number'` для строк с индексами от 5 до 7 (включительно).


In [161]:
source.loc[source['username'] == 'rmalsterrr']
source.loc[source['username'] == 'rmalsterrr', 'status']
source.loc[source['username'] == 'rmalsterrr', 'status'] = 'deactivated'
source.loc[source['username'] == 'rmalsterrr', 'status']

999    deactivated
Name: status, dtype: object

1. **`source.loc[source['username'] == 'rmalsterrr']`**:
   - Возвращает все строки из `DataFrame`, где значение в столбце `'username'` равно `'rmalsterrr'`.

2. **`source.loc[source['username'] == 'rmalsterrr', 'status']`**:
    - Возвращает значение в столбце `'status'` для строк, где значение в столбце `'username'` равно `'rmalsterrr'`.

3. **`source.loc[source['username'] == 'rmalsterrr', 'status'] = 'deactivated'`**:
    - Обновляет значение в столбце `'status'` для строк, где значение в столбце `'username'` равно `'rmalsterrr'`, устанавливая его на `'deactivated'`.

4. **`source.loc[source['username'] == 'rmalsterrr', 'status']`**:
    - Снова получает значение в столбце `'status'` для строк, где значение в столбце `'username'` равно `'rmalsterrr'`. Теперь это значение будет `'deactivated'`.

In [162]:
source.loc[source.status == 'online']

Unnamed: 0,username,phone_number,bio,last_seen,status,chat_history,group_name,notifications_enabled,language
2,mgirardoni2,377-906-4035,Fusce posuere felis sed lacus. Morbi sem mauri...,1/31/2022,online,Cras non velit nec nisi vulputate nonummy. Mae...,Dr,False,Japanese
3,jchard3,157-692-4457,Cras non velit nec nisi vulputate nonummy. Mae...,4/6/2022,online,Cum sociis natoque penatibus et magnis dis par...,Mrs,False,Japanese
6,tsneesby6,473-608-2932,Fusce consequat. Nulla nisl. Nunc nisl.\n\nDui...,5/1/2022,online,In eleifend quam a odio. In hac habitasse plat...,Honorable,False,Tsonga
8,yshrubshall8,543-571-0123,In congue. Etiam justo. Etiam pretium iaculis ...,3/11/2022,online,Integer ac leo. Pellentesque ultrices mattis o...,Mrs,False,Czech
13,ltompsettd,562-461-2070,Praesent blandit. Nam nulla. Integer pede just...,11/12/2021,online,"Nulla neque libero, convallis eget, eleifend l...",Rev,False,Sotho
...,...,...,...,...,...,...,...,...,...
982,lbegleyra,750-230-5288,Fusce posuere felis sed lacus. Morbi sem mauri...,4/20/2021,online,Aliquam sit amet diam in magna bibendum imperd...,Mr,True,Dzongkha
983,arobeirorb,577-968-2255,Phasellus sit amet erat. Nulla tempus. Vivamus...,8/16/2021,online,"Nulla neque libero, convallis eget, eleifend l...",Honorable,True,Swati
993,fbladonrl,535-198-2094,Morbi porttitor lorem id ligula. Suspendisse o...,4/20/2022,online,Cras pellentesque volutpat dui. Maecenas trist...,Mr,False,Gagauz
996,gwinsiowieckiro,799-727-0719,Nullam sit amet turpis elementum ligula vehicu...,7/25/2022,online,Curabitur in libero ut massa volutpat convalli...,Dr,False,Aymara



1. **`source.loc[source.status == 'online']`**:
    - Возвращает все строки из `DataFrame`, где значение в столбце `'status'` равно `'online'`.