# Үй жұмысы. Pandas Тапсырмалар жинағы:
# Өз қалауыңызша кемінде 5 есепті орындаңыз

Бұл ноутбук Pandas кітапханасының негізгі функциялары бойынша практикалық дағдыларды дамытуға арналған 20 тапсырманы қамтиды:

* **Series** және **DataFrame** құру.
* Индексациялау және деректерді таңдау (**loc, iloc**).
* Шарт бойынша сүзу.
* Топтастыру (**groupby**) және агрегаттау.
* Кестелерді біріктіру (**merge, join, concat**).

---

## 1-БӨЛІМ: Сериялар (Series) және Деректер Фреймдерін (DataFrame) Құру

### Тапсырма 1: Pandas импорты және Series құру

Pandas кітапханасын импорттаңыз және 5 элементтен тұратын (мысалы, қала атаулары) индексі жоқ қарапайым Pandas Series құрыңыз. Серияны басып шығарыңыз.

In [2]:
import pandas as pd

cities = pd.Series(['Astana', 'Almaty', 'Shymkent', 'Aktau', 'Taraz'])
cities

Unnamed: 0,0
0,Astana
1,Almaty
2,Shymkent
3,Aktau
4,Taraz


### Тапсырма 2: DataFrame құру

Келесі деректерді пайдаланып DataFrame құрыңыз:
* **Атауы (Name)**: ['Әли', 'Мәдина', 'Қайрат', 'Айгүл']
* **Жасы (Age)**: [25, 30, 22, 35]
* **Қаласы (City)**: ['A', 'B', 'A', 'C']

DataFrame-ді `df` айнымалысына сақтап, оны басып шығарыңыз.

In [3]:
data = {
    'Name': ['Әли', 'Мәдина', 'Қайрат', 'Айгүл'],
    'Age': [25, 30, 22, 35],
    'City': ['A', 'B', 'A', 'C']
}
df = pd.DataFrame(data)
df

Unnamed: 0,Name,Age,City
0,Әли,25,A
1,Мәдина,30,B
2,Қайрат,22,A
3,Айгүл,35,C


## 2-БӨЛІМ: Индексациялау, Таңдау және Шарт бойынша Сүзу

### Тапсырма 3: Бір бағанды таңдау

`df` DataFrame-нен тек **'Name'** бағанын таңдап, оны басып шығарыңыз. Нәтиже Series болуы керек.

In [6]:
df['Name']

Unnamed: 0,Name
0,Әли
1,Мәдина
2,Қайрат
3,Айгүл


### Тапсырма 4: loc арқылы жолдар мен бағандарды таңдау
`df` DataFrame-нен **тек 'Age' және 'City' бағандарын** таңдап, **тек бірінші және үшінші жолдарды** (0 және 2 индекс) шығарыңыз. `loc` әдісін қолданыңыз.

In [7]:
df.loc[0:3:2, ['Age', 'City']]

Unnamed: 0,Age,City
0,25,A
2,22,A


### Тапсырма 5: iloc арқылы таңдау

`df` DataFrame-нен **барлық жолдарды** және **екінші және үшінші бағандарды** (1 және 2 индекс) шығарыңыз. `iloc` әдісін қолданыңыз.

In [8]:
df.iloc[::, 1:3]

Unnamed: 0,Age,City
0,25,A
1,30,B
2,22,A
3,35,C


### Тапсырма 6: Шарт бойынша сүзу

`df` DataFrame-нен жасы **25-тен үлкен** (`Age > 25`) барлық адамдарды сүзіңіз. Нәтижені басып шығарыңыз.

In [9]:
df[df['Age'] > 25]

Unnamed: 0,Name,Age,City
1,Мәдина,30,B
3,Айгүл,35,C


### Тапсырма 7: Күрделі шарт бойынша сүзу

`df` DataFrame-нен **'City' бағаны 'A' немесе 'City' бағаны 'B' және 'Age' бағаны 30-ға тең** (`City == 'A'` немесе (`City == 'B'` және `Age == 30`)) болатын барлық жолдарды сүзіңіз.

In [12]:
mask = ((df['City'] == 'A') | (df['City'] == 'B')) & (df['Age'] == 30)
df[mask]

Unnamed: 0,Name,Age,City
1,Мәдина,30,B


## 3-БӨЛІМ: Топтастыру (groupby) және Агрегаттау

### Тапсырма 8: Жаңа DataFrame дайындау

Келесі деректерден жаңа `sales_df` DataFrame-ін жасаңыз:
* **Өнім (Product)**: ['A', 'B', 'A', 'C', 'B', 'C']
* **Аймақ (Region)**: ['Солтүстік', 'Оңтүстік', 'Оңтүстік', 'Солтүстік', 'Солтүстік', 'Оңтүстік']
* **Сатылымдар (Sales)**: [100, 150, 120, 80, 200, 90]

In [13]:
sales_df = pd.DataFrame({
    'Product': ['A', 'B', 'A', 'C', 'B', 'C'],
    'Region': ['Солтүстік', 'Оңтүстік', 'Оңтүстік', 'Солтүстік', 'Солтүстік', 'Оңтүстік'],
    'Sales': [100, 150, 120, 80, 200, 90]
})
sales_df

Unnamed: 0,Product,Region,Sales
0,A,Солтүстік,100
1,B,Оңтүстік,150
2,A,Оңтүстік,120
3,C,Солтүстік,80
4,B,Солтүстік,200
5,C,Оңтүстік,90


### Тапсырма 9: Бір баған бойынша топтастыру және қосынды

`sales_df` DataFrame-дегі **'Product'** бойынша топтастырыңыз және әр өнімнің **жалпы сатылымын** (қосындысын) есептеңіз. Нәтижені басып шығарыңыз.

In [14]:
sales_df.groupby(by='Product')['Sales'].sum()

Unnamed: 0_level_0,Sales
Product,Unnamed: 1_level_1
A,220
B,350
C,170


### Тапсырма 10: Көп баған бойынша топтастыру және орташа мән

`sales_df` DataFrame-дегі **'Product' және 'Region'** бойынша топтастырыңыз және әр комбинация үшін **орташа сатылымды** есептеңіз. Нәтижені басып шығарыңыз.

In [15]:
sales_df.groupby(by=['Product', 'Region'])['Sales'].mean()

Unnamed: 0_level_0,Unnamed: 1_level_0,Sales
Product,Region,Unnamed: 2_level_1
A,Оңтүстік,120.0
A,Солтүстік,100.0
B,Оңтүстік,150.0
B,Солтүстік,200.0
C,Оңтүстік,90.0
C,Солтүстік,80.0


### Тапсырма 11: Бірнеше агрегаттық функция

`sales_df` DataFrame-дегі **'Region'** бойынша топтастырыңыз және әр аймақ үшін **жалпы сатылымдарды (sum), сатылымдардың орташа мәнін (mean)** және **сатылымдардың ең көп санын (max)** есептеңіз. `agg` әдісін қолданыңыз.

In [20]:
sales_df.groupby(by='Region').agg({'Sales': ['sum', 'mean', 'max']})

Unnamed: 0_level_0,Sales,Sales,Sales
Unnamed: 0_level_1,sum,mean,max
Region,Unnamed: 1_level_2,Unnamed: 2_level_2,Unnamed: 3_level_2
Оңтүстік,360,120.0,150
Солтүстік,380,126.666667,200


## 4-БӨЛІМ: Кестелерді Біріктіру (Merge, Join, Concat)

### Тапсырма 13: Жаңа DataFrame-лер дайындау

Біріктіру үшін екі жаңа DataFrame құрыңыз:

1.  `df1` (Пайдаланушы ақпараты):
    * **id**: [1, 2, 3, 4]
    * **Name**: ['Аян', 'Бек', 'Сара', 'Дәурен']
2.  `df2` (Тапсырыс ақпараты):
    * **user_id**: [2, 1, 4, 5, 3]
    * **Order**: ['Өнім X', 'Өнім Y', 'Өнім Z', 'Өнім V', 'Өнім W']

In [21]:
df1 = pd.DataFrame({
    'id': [1, 2, 3, 4],
    'Name': ['Аян', 'Бек', 'Сара', 'Дәурен']
})
df2 = pd.DataFrame({
    'user_id': [2, 1, 4, 5, 3],
    'Order': ['Өнім X', 'Өнім Y', 'Өнім Z', 'Өнім V', 'Өнім W']
})

### Тапсырма 14: Ішкі біріктіру (Inner Merge)

`df1` мен `df2` DataFrame-лерін **ішкі біріктіру (inner merge)** арқылы біріктіріңіз. Біріктіру кілті ретінде `df1`-дегі **'id'** және `df2`-дегі **'user_id'** бағандарын пайдаланыңыз. Тек екі кестеде де бар пайдаланушылардың деректері қалуы керек.

In [27]:
pd.merge(df1, df2, how='inner', left_on='id', right_on='user_id')

Unnamed: 0,id,Name,user_id,Order
0,1,Аян,1,Өнім Y
1,2,Бек,2,Өнім X
2,3,Сара,3,Өнім W
3,4,Дәурен,4,Өнім Z


### Тапсырма 15: Сол жақтан біріктіру (Left Merge)

`df1` мен `df2` DataFrame-лерін **сол жақтан біріктіру (left merge)** арқылы біріктіріңіз. Барлық пайдаланушылардың деректері (`df1`) сақталуы керек.

In [32]:
df1.merge(df2, how='left', left_on='id', right_on='user_id')

Unnamed: 0,id,Name,user_id,Order
0,1,Аян,1,Өнім Y
1,2,Бек,2,Өнім X
2,3,Сара,3,Өнім W
3,4,Дәурен,4,Өнім Z


### Тапсырма 16: Толық біріктіру (Outer Merge)

`df1` мен `df2` DataFrame-лерін **толық біріктіру (outer merge)** арқылы біріктіріңіз. Екі кестедегі барлық деректер сақталуы керек. Сәйкес келмейтін жерлер NaN-мен толтырылуы керек.

In [33]:
df1.merge(df2, how='outer', left_on='id', right_on='user_id')

Unnamed: 0,id,Name,user_id,Order
0,1.0,Аян,1,Өнім Y
1,2.0,Бек,2,Өнім X
2,3.0,Сара,3,Өнім W
3,4.0,Дәурен,4,Өнім Z
4,,,5,Өнім V


### Тапсырма 17: Concat арқылы біріктіру

Жаңа `df3` DataFrame-ін құрыңыз:
* **id**: [5, 6]
* **Name**: ['Марат', 'Назира']
Содан кейін `pd.concat` әдісін қолданып, `df1` мен `df3`-ті **жолдар бойынша** біріктіріңіз.

In [34]:
df3 = pd.DataFrame({
    'id': [5, 6],
    'Name': ['Марат', 'Назира']
})
pd.concat([df1, df3])

Unnamed: 0,id,Name
0,1,Аян
1,2,Бек
2,3,Сара
3,4,Дәурен
0,5,Марат
1,6,Назира


## 5-БӨЛІМ: Аралас және Қиын Тапсырмалар

### Тапсырма 18: Жаңа бағанды есептеу және сүзу

Бастапқы `df` DataFrame-іне келесі деректерді қосыңыз:
* **Salary**: [50000, 60000, 45000, 70000]
Жаңа **'Bonus'** бағанын есептеңіз, ол **'Salary' бағанының 10%** құрайды. Содан кейін тек **'Salary' 50000-нан жоғары** адамдарды таңдаңыз.

In [37]:
df['Salary'] = [50000, 60000, 45000, 70000]
df['Bonus'] = df['Salary'] * 0.1
df[df['Salary'] > 50_000]

Unnamed: 0,Name,Age,City,Salary,Bonus
1,Мәдина,30,B,60000,6000.0
3,Айгүл,35,C,70000,7000.0


### Тапсырма 19: Көп сатылы агрегаттау және сүзу
`sales_df` DataFrame-дегі **'Region'** бойынша топтастырыңыз. Тек **орташа сатылымы 100-ден жоғары** (`mean() > 100`) аймақтарды ғана таңдап, олардың жалпы сатылымын (sum) көрсетіңіз. `groupby().filter()` немесе `groupby().agg()` және сүзуді қолданыңыз.

In [49]:
filtered = sales_df.groupby(by='Region').filter(lambda x: x['Sales'].mean() > 100)
result = filtered.groupby(by='Region')['Sales'].sum()
result

Unnamed: 0_level_0,Sales
Region,Unnamed: 1_level_1
Оңтүстік,360
Солтүстік,380
