# Pandas Index Management

In [1]:
# Importing Libraries
import pandas as pd
from datasets import load_dataset
import matplotlib.pyplot as plt  

# Loading Data
dataset = load_dataset('lukebarousse/data_jobs')
df = dataset['train'].to_pandas()

# Data Cleanup
df['job_posted_date'] = pd.to_datetime(df['job_posted_date'])

  from .autonotebook import tqdm as notebook_tqdm


## Index Attributes

### Notes

* You can get or set properties of the index, such as its name or data type.  
* It's helpful for maintaining metadata or ensuring index compatibility in operations.
* `(index.name, index.dtype)`
    * `index.name` - name of the index
    * `index.dtype` - data type of the index

## Index Attributes – Nedir ve Ne İşe Yarar?

* Bir DataFrame’in satırlarını tanımlayan “index”in bazı özellikleri vardır. Bunlara index attributes denir. Bu özellikleri kontrol etmek, analiz sürecinde bazı şeyleri daha doğru ve güvenli yapmana yardımcı olur.

### 1. index.name – İndeksin İsmi
* index.name ifadesi, o indeksin etiketini (başlığını) verir veya değiştirmene olanak tanır.
* Eğer bir sütunu indeks yaptıysan, bu sütunun adı index’in adı olur.

🔧 Neden önemli?

* Özellikle birden fazla tabloyla çalışırken indeksin neyi temsil ettiğini görmek için kullanılır.
* merge, join, groupby gibi işlemlerde indeksin adının tanımlı olması anlamlı eşleşmeler sağlar.

### 2. index.dtype – İndeksin Veri Tipi
* index.dtype ifadesi, indeksin hangi veri tipinde olduğunu gösterir. (örneğin: int64, object, datetime64, vs.)

🔧 Neden önemli?

* İki tabloyu birleştirirken indekslerin veri tiplerinin uyuşması gerekir.
* Zaman serisi analizinde, indeksin tarih olup olmadığını anlamak için kullanılır.
* Filtreleme yaparken beklenmedik hatalardan kaçınmak için veri tipini bilmek önemlidir.


## 🎯 Ne Zaman Kullanılır?

1. Veri setlerini birleştireceğin zaman indekslerin adı ve veri tipi uyuşuyor mu kontrol etmek için
2. İndeksin neyi temsil ettiğini göstermek için (index.name)
3. Tarih bazlı analizlerde (index.dtype kullanarak tarih olup olmadığını anla)
4. Otomatik raporlarda indeks adını başlık olarak göstermek için

In [3]:
df.sample(5)

Unnamed: 0,job_title_short,job_title,job_location,job_via,job_schedule_type,job_work_from_home,search_location,job_posted_date,job_no_degree_mention,job_health_insurance,job_country,salary_rate,salary_year_avg,salary_hour_avg,company_name,job_skills,job_type_skills
397699,Data Engineer,Data Engineer Confirmé Bi - Big Data H/F,Anywhere,via HelloWork,Full-time,True,France,2023-01-26 18:16:45,False,False,France,,,,Activus Group,"['sql', 'shell', 'java', 'spark', 'hadoop', 'l...","{'libraries': ['spark', 'hadoop'], 'os': ['lin..."
289142,Data Engineer,Data Engineer,"Austin, TX",via SmartRecruiters Job Search,Full-time,False,"Texas, United States",2023-07-05 17:01:45,True,False,United States,,,,Informa Group Plc.,"['sql', 'python', 'r', 'vba', 'vb.net', 'c#', ...","{'analyst_tools': ['power bi', 'alteryx', 'tab..."
337663,Data Scientist,Data Scientist / Riesgo Operacional | KYG-889,Chile,via Sercanto,Full-time,False,Chile,2023-04-13 23:33:08,False,False,Chile,,,,Iplacex,"['sql', 'python', 'spark', 'pandas', 'matplotl...","{'libraries': ['spark', 'pandas', 'matplotlib'..."
13828,Data Engineer,Data Engineer,United Kingdom,via Jobs Trabajo.org,Full-time,False,United Kingdom,2023-01-19 13:59:15,True,False,United Kingdom,,,,Bright Purple Resourcing Ltd,"['sql', 'python', 'azure']","{'cloud': ['azure'], 'programming': ['sql', 'p..."
373073,Data Analyst,Business Data Analyst,"New York, NY",via Jobs Trabajo.org,Full-time,False,"New York, United States",2023-08-26 18:00:05,False,False,United States,,,,Pierce Technology Corporation,['sql'],{'programming': ['sql']}


### 🎯 Özetle

| Ne yaparsın?        | Ne işe yarar?                                                  |
|---------------------|----------------------------------------------------------------|
| `df.index`          | Satır indekslerini görürsün (list değil, özel bir Index objesi)|
| `df.index.name`     | İndeksin başlığına erişirsin veya başlık atarsın               |
| `df.index.dtype`    | İndeksin veri tipini öğrenirsin (örneğin `int64`, `object`)    |


In [None]:
#lets inspect our index
df.index # 📌 Veri çerçevesinin (DataFrame’in) satır etiketlerini (indexlerini) öğrenmeye veya kontrol etmeye çalışıyorsun.

RangeIndex(start=0, stop=785741, step=1)

In [5]:
df.index.dtype

dtype('int64')

In [None]:
df.index.name # it has no name 

In [7]:
df.index.name = "job_index"
df.index.name

'job_index'

In [8]:
df.sample(3)

Unnamed: 0_level_0,job_title_short,job_title,job_location,job_via,job_schedule_type,job_work_from_home,search_location,job_posted_date,job_no_degree_mention,job_health_insurance,job_country,salary_rate,salary_year_avg,salary_hour_avg,company_name,job_skills,job_type_skills
job_index,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1,Unnamed: 10_level_1,Unnamed: 11_level_1,Unnamed: 12_level_1,Unnamed: 13_level_1,Unnamed: 14_level_1,Unnamed: 15_level_1,Unnamed: 16_level_1,Unnamed: 17_level_1
727739,Data Scientist,"Data Scientist (Pittsburgh, PA)","Pittsburgh, PA",via LinkedIn,Full-time,False,Georgia,2023-12-14 21:34:28,False,True,United States,,,,Smith+Nephew,"['python', 'r', 'matlab', 'scikit-learn', 'ten...","{'libraries': ['scikit-learn', 'tensorflow', '..."
57327,Data Analyst,Data Analyst || WHO – World Health Organization,"Harare, Zimbabwe",via VacancyBox,,False,Zimbabwe,2023-09-03 06:44:10,False,False,Zimbabwe,,,,WHO - World Health Organization,['c'],{'programming': ['c']}
684277,Data Engineer,Jr. Data Engineer - For Fresh Grads,"Muntinlupa, Metro Manila, Philippines",via LinkedIn,,False,Philippines,2023-06-27 10:42:15,True,False,Philippines,,,,Collabera Digital,"['sql', 'python']","{'programming': ['sql', 'python']}"


### Example 2

 Remember the pivot table we made in the last example? Where we got median yearly salaries for the different job titles. Let's run that code. Then we'll get the index name and the data type of the index using `df.index.name` and `df.index.dtype`.

In [9]:
median_pivot = df.pivot_table(values="salary_year_avg", index="job_title_short", aggfunc="mean")
median_pivot

Unnamed: 0_level_0,salary_year_avg
job_title_short,Unnamed: 1_level_1
Business Analyst,91082.612833
Cloud Engineer,111268.453846
Data Analyst,93841.907854
Data Engineer,130125.60425
Data Scientist,135988.837171
Machine Learning Engineer,126774.315972
Senior Data Analyst,113911.363665
Senior Data Engineer,145840.611624
Senior Data Scientist,154206.292996
Software Engineer,113393.760054


In [10]:
index_name = median_pivot.index.name
index_name

'job_title_short'

In [11]:
index_dtype= median_pivot.index.dtype
index_dtype

dtype('O')

## reset_index()

### Notes 

* `reset_index()`: Resets the DataFrame’s index to the default integer index. This is particularly useful after operations that alter the index, like sorting or filtering, to simplify further data manipulation.

* Pandas'ta reset_index() fonksiyonu, bir DataFrame'in mevcut indeksini sıfırlar ve yerine varsayılan sayısal indeks (0, 1, 2, ...) koyar.

###  Neden Kullanılır?

Bazen bir işlem yaptıktan sonra (örneğin groupby(), set_index(), sort_values()), DataFrame’in indeksi özel bir hale gelir veya çok karmaşık olur.

📌 İşte bu durumda, analiz kolaylığı ve temiz görünüm için reset_index() kullanılır.

### 🧩 Ekstra Bilgi:

Eğer eski indexi tamamen kaldırmak istiyorsan:
* df.reset_index(drop=True, inplace=True)
1. drop=True → eski indexi tamamen sil
2. inplace=True → sonucu yeni değişkene atamadan doğrudan df'ye uygula

### 🎯 Ne Zaman Kullanılır?

| Durum        | reset_index() kullanılır mı?                                                |
|---------------------|----------------------------------------------------------------|
| groupby, pivot_table sonrası        | ✅ Evet|
| İndeks karmaşık hale geldiyse    | ✅ Evet |
| Sıralama sonrası sıra numarasını düzeltmek istiyorsan    | ✅ Evet |


### Example 1

When we create new DataFrames by filtering this jacks up our index!

In [15]:
df_usa = df[df["job_country"] == "United States"]
df_usa.head(5)

Unnamed: 0_level_0,job_title_short,job_title,job_location,job_via,job_schedule_type,job_work_from_home,search_location,job_posted_date,job_no_degree_mention,job_health_insurance,job_country,salary_rate,salary_year_avg,salary_hour_avg,company_name,job_skills,job_type_skills
job_index,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1,Unnamed: 10_level_1,Unnamed: 11_level_1,Unnamed: 12_level_1,Unnamed: 13_level_1,Unnamed: 14_level_1,Unnamed: 15_level_1,Unnamed: 16_level_1,Unnamed: 17_level_1
0,Senior Data Engineer,Senior Clinical Data Engineer / Principal Clin...,"Watertown, CT",via Work Nearby,Full-time,False,"Texas, United States",2023-06-16 13:44:15,False,False,United States,,,,Boehringer Ingelheim,,
3,Data Engineer,LEAD ENGINEER - PRINCIPAL ANALYST - PRINCIPAL ...,"San Antonio, TX",via Diversity.com,Full-time,False,"Texas, United States",2023-07-04 13:01:41,True,False,United States,,,,Southwest Research Institute,"['python', 'c++', 'java', 'matlab', 'aws', 'te...","{'cloud': ['aws'], 'libraries': ['tensorflow',..."
5,Data Engineer,GCP Data Engineer,Anywhere,via ZipRecruiter,Contractor and Temp work,True,Georgia,2023-11-07 14:01:59,False,False,United States,,,,smart folks inc,"['python', 'sql', 'gcp']","{'cloud': ['gcp'], 'programming': ['python', '..."
6,Senior Data Engineer,Senior Data Engineer - GCP Cloud,"Dearborn, MI",via LinkedIn,Full-time,False,"Florida, United States",2023-03-27 13:18:18,False,False,United States,,,,"Miracle Software Systems, Inc","['sql', 'python', 'java', 'sql server', 'gcp',...","{'cloud': ['gcp', 'bigquery'], 'databases': ['..."
9,Data Scientist,Data Scientist II,Anywhere,via ZipRecruiter,Full-time,True,"New York, United States",2023-04-23 13:02:57,False,False,United States,,,,"Radwell International, LLC","['sql', 'python', 'r', 'mongodb', 'mongodb', '...","{'analyst_tools': ['excel'], 'cloud': ['azure'..."


In [13]:
df_usa.index

Index([     0,      3,      5,      6,      9,     11,     13,     17,     26,
           27,
       ...
       785625, 785626, 785641, 785648, 785651, 785673, 785685, 785692, 785703,
       785705],
      dtype='int64', name='job_index', length=206292)

In [16]:
# index is no longer correctly spaced by 1 increment
df_usa.reset_index(inplace=True)
df_usa 

Unnamed: 0,job_index,job_title_short,job_title,job_location,job_via,job_schedule_type,job_work_from_home,search_location,job_posted_date,job_no_degree_mention,job_health_insurance,job_country,salary_rate,salary_year_avg,salary_hour_avg,company_name,job_skills,job_type_skills
0,0,Senior Data Engineer,Senior Clinical Data Engineer / Principal Clin...,"Watertown, CT",via Work Nearby,Full-time,False,"Texas, United States",2023-06-16 13:44:15,False,False,United States,,,,Boehringer Ingelheim,,
1,3,Data Engineer,LEAD ENGINEER - PRINCIPAL ANALYST - PRINCIPAL ...,"San Antonio, TX",via Diversity.com,Full-time,False,"Texas, United States",2023-07-04 13:01:41,True,False,United States,,,,Southwest Research Institute,"['python', 'c++', 'java', 'matlab', 'aws', 'te...","{'cloud': ['aws'], 'libraries': ['tensorflow',..."
2,5,Data Engineer,GCP Data Engineer,Anywhere,via ZipRecruiter,Contractor and Temp work,True,Georgia,2023-11-07 14:01:59,False,False,United States,,,,smart folks inc,"['python', 'sql', 'gcp']","{'cloud': ['gcp'], 'programming': ['python', '..."
3,6,Senior Data Engineer,Senior Data Engineer - GCP Cloud,"Dearborn, MI",via LinkedIn,Full-time,False,"Florida, United States",2023-03-27 13:18:18,False,False,United States,,,,"Miracle Software Systems, Inc","['sql', 'python', 'java', 'sql server', 'gcp',...","{'cloud': ['gcp', 'bigquery'], 'databases': ['..."
4,9,Data Scientist,Data Scientist II,Anywhere,via ZipRecruiter,Full-time,True,"New York, United States",2023-04-23 13:02:57,False,False,United States,,,,"Radwell International, LLC","['sql', 'python', 'r', 'mongodb', 'mongodb', '...","{'analyst_tools': ['excel'], 'cloud': ['azure'..."
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
206287,785673,Data Scientist,Asset Management Data Scientist,"New York, NY",via Trabajo.org,Full-time,False,"New York, United States",2023-10-16 06:01:53,True,False,United States,,,,JPMorgan Chase & Co.,,
206288,785685,Data Analyst,Data Analyst,"Indianapolis, IN",via Trabajo.org,Full-time,False,"Illinois, United States",2023-07-16 06:01:27,True,False,United States,,,,"Aara Technologies, Inc","['sql', 'excel']","{'analyst_tools': ['excel'], 'programming': ['..."
206289,785692,Data Scientist,Data Scientist- Hybrid Work Location,"Dayton, OH",via Ai-Jobs.net,Full-time,False,"Illinois, United States",2023-04-21 06:02:31,False,True,United States,year,157500.0,,Tenet3,"['python', 'matlab', 'r']","{'programming': ['python', 'matlab', 'r']}"
206290,785703,Data Analyst,Data Analyst - CRYPTOGRAPHY - Full-time,Anywhere,via Snagajob,Full-time,True,"Texas, United States",2023-01-28 06:02:55,True,False,United States,,,,Axelon Services Corporation,,


1. Technically we could .drop() the job_index.

* BUT, if we wanted to do some sort of merge operations in the future with our original DataFrame, this provides the unique id to do that.

2. Teknik olarak job_index'i .drop() edebiliriz.

* AMA, gelecekte orijinal DataFrame'imizle bir tür birleştirme işlemi yapmak istersek, bunu yapmak için benzersiz bir kimlik sağlar.


### Example 2

Back to our main DataFrame with our job postings in it. We're going to actually reset the indexes in the pivot table so `job_title_short` isn't the index anymore.

In [17]:
median_pivot.reset_index(inplace=True)
median_pivot

Unnamed: 0,job_title_short,salary_year_avg
0,Business Analyst,91082.612833
1,Cloud Engineer,111268.453846
2,Data Analyst,93841.907854
3,Data Engineer,130125.60425
4,Data Scientist,135988.837171
5,Machine Learning Engineer,126774.315972
6,Senior Data Analyst,113911.363665
7,Senior Data Engineer,145840.611624
8,Senior Data Scientist,154206.292996
9,Software Engineer,113393.760054


## set_index()

### Notes

* `set_index()`: Sets one or more existing columns as the index of the DataFrame. This is useful for timeseries data or when you want to index by specific attributes.

*  Bu fonksiyon, bir DataFrame’deki bir veya birden fazla sütunu indeks (satır etiketi) olarak ayarlamak için kullanılır.

### Ne işe yarar?

1. Veri üzerinde daha etkili gruplama, filtreleme ve erişim sağlar.
2. Özellikle zaman serisi (timeseries) analizlerinde ve kategori bazlı işlemlerde oldukça kullanışlıdır.
3. groupby, pivot_table, loc[] gibi fonksiyonlarla birlikte sıkça kullanılır.


df = pd.DataFrame({
    "Company": ["A", "A", "B", "B"],
    "Department": ["HR", "IT", "HR", "IT"],
    "Salary": [4000, 5000, 4200, 5300]
})

df_multi = df.set_index(["Company", "Department"])
print(df_multi)


##### ÇIKTI: 
df = pd.DataFrame({
    "Company": ["A", "A", "B", "B"],
    "Department": ["HR", "IT", "HR", "IT"],
    "Salary": [4000, 5000, 4200, 5300]
})

df_multi = df.set_index(["Company", "Department"])
print(df_multi)


### 🎯 Ne Zaman Kullanılır?

| Durum        | reset_index() kullanılır mı?                                                |
|---------------------|----------------------------------------------------------------|
| Zaman serisi verisi ile çalışıyorsan       | ✅ Evet|
| Sütunu anahtar olarak kullanmak istiyorsan| ✅ Evet |
| Gruplama veya erişimi kolaylaştırmak istiyorsan istiyorsan    | ✅ Evet |


### Example 1

What if we wanted to go back to job_index as our main index?

In [None]:
df_usa.set_index("job_index", inplace=True) #"job_index" sütunu, artık DataFrame'in yeni satır index’i oldu.
df_usa

#Neden yapılır?

#1. Veriyi satır bazında daha anlamlı bir şekilde temsil etmek için
#Eskiden satırlar 0, 1, 2, 3, ... gibi sayılarla etiketleniyordu. Ama şimdi her satır "job_index" değeri ile tanımlanıyor.
#Bu daha anlamlı, takip edilebilir ve güçlü bir yapı sağlar.

#inplace=True Bu parametre, değişikliğin doğrudan df_usa içinde yapılmasını sağlar.

Unnamed: 0_level_0,job_title_short,job_title,job_location,job_via,job_schedule_type,job_work_from_home,search_location,job_posted_date,job_no_degree_mention,job_health_insurance,job_country,salary_rate,salary_year_avg,salary_hour_avg,company_name,job_skills,job_type_skills
job_index,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1,Unnamed: 10_level_1,Unnamed: 11_level_1,Unnamed: 12_level_1,Unnamed: 13_level_1,Unnamed: 14_level_1,Unnamed: 15_level_1,Unnamed: 16_level_1,Unnamed: 17_level_1
0,Senior Data Engineer,Senior Clinical Data Engineer / Principal Clin...,"Watertown, CT",via Work Nearby,Full-time,False,"Texas, United States",2023-06-16 13:44:15,False,False,United States,,,,Boehringer Ingelheim,,
3,Data Engineer,LEAD ENGINEER - PRINCIPAL ANALYST - PRINCIPAL ...,"San Antonio, TX",via Diversity.com,Full-time,False,"Texas, United States",2023-07-04 13:01:41,True,False,United States,,,,Southwest Research Institute,"['python', 'c++', 'java', 'matlab', 'aws', 'te...","{'cloud': ['aws'], 'libraries': ['tensorflow',..."
5,Data Engineer,GCP Data Engineer,Anywhere,via ZipRecruiter,Contractor and Temp work,True,Georgia,2023-11-07 14:01:59,False,False,United States,,,,smart folks inc,"['python', 'sql', 'gcp']","{'cloud': ['gcp'], 'programming': ['python', '..."
6,Senior Data Engineer,Senior Data Engineer - GCP Cloud,"Dearborn, MI",via LinkedIn,Full-time,False,"Florida, United States",2023-03-27 13:18:18,False,False,United States,,,,"Miracle Software Systems, Inc","['sql', 'python', 'java', 'sql server', 'gcp',...","{'cloud': ['gcp', 'bigquery'], 'databases': ['..."
9,Data Scientist,Data Scientist II,Anywhere,via ZipRecruiter,Full-time,True,"New York, United States",2023-04-23 13:02:57,False,False,United States,,,,"Radwell International, LLC","['sql', 'python', 'r', 'mongodb', 'mongodb', '...","{'analyst_tools': ['excel'], 'cloud': ['azure'..."
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
785673,Data Scientist,Asset Management Data Scientist,"New York, NY",via Trabajo.org,Full-time,False,"New York, United States",2023-10-16 06:01:53,True,False,United States,,,,JPMorgan Chase & Co.,,
785685,Data Analyst,Data Analyst,"Indianapolis, IN",via Trabajo.org,Full-time,False,"Illinois, United States",2023-07-16 06:01:27,True,False,United States,,,,"Aara Technologies, Inc","['sql', 'excel']","{'analyst_tools': ['excel'], 'programming': ['..."
785692,Data Scientist,Data Scientist- Hybrid Work Location,"Dayton, OH",via Ai-Jobs.net,Full-time,False,"Illinois, United States",2023-04-21 06:02:31,False,True,United States,year,157500.0,,Tenet3,"['python', 'matlab', 'r']","{'programming': ['python', 'matlab', 'r']}"
785703,Data Analyst,Data Analyst - CRYPTOGRAPHY - Full-time,Anywhere,via Snagajob,Full-time,True,"Texas, United States",2023-01-28 06:02:55,True,False,United States,,,,Axelon Services Corporation,,


### Example 2

Now that we've reset our index we can set the new index on another column like `salary_year_avg`.

In [None]:
median_pivot.set_index("job_title_short", inplace=True)
median_pivot

Unnamed: 0_level_0,salary_year_avg
job_title_short,Unnamed: 1_level_1
Business Analyst,91082.612833
Cloud Engineer,111268.453846
Data Analyst,93841.907854
Data Engineer,130125.60425
Data Scientist,135988.837171
Machine Learning Engineer,126774.315972
Senior Data Analyst,113911.363665
Senior Data Engineer,145840.611624
Senior Data Scientist,154206.292996
Software Engineer,113393.760054


## sort_index()

### Notes 

* `sort_index()`: Sorts the DataFrame by the index (row labels), either ascending or descending. This helps in quickly organizing data by the index and is often used after `set_index()`.

* Bu fonksiyon, bir DataFrame'i ya da Series'i index’e (satır etiketlerine) göre sıralar.

### Ne işe yarar?

1. Veri setini düzenli ve okunabilir hale getirir.
2. Özellikle set_index() sonrası verinin karışık bir index yapısına sahip olmasını toparlamak için kullanılır.
3. Daha kolay arama, filtreleme ve zaman serisi analizleri yapılabilir.
4. loc[] ile erişim yaptığında verinin sıralı olması performans ve anlaşılabilirlik açısından avantaj sağlar.

### 📌 `sort_index()` Ne Zaman Kullanılır?

| Durum                                      | `sort_index()` Kullanılır mı? |
|-------------------------------------------|-------------------------------|
| `set_index()` sonrası index karıştıysa    | ✅ Evet                       |
| Zaman serisi analizinde tarih sıralaması  | ✅ Evet                       |
| Index’e göre erişimi kolaylaştırmak için  | ✅ Evet                       |
| Gruplama veya karşılaştırma öncesinde     | ✅ Evet                       |


### Example

Back to our pivoted DataFrame let's sort this new index alphabetically.

In [21]:
median_pivot.sort_index(inplace=True, ascending=True)
median_pivot

Unnamed: 0_level_0,salary_year_avg
job_title_short,Unnamed: 1_level_1
Business Analyst,91082.612833
Cloud Engineer,111268.453846
Data Analyst,93841.907854
Data Engineer,130125.60425
Data Scientist,135988.837171
Machine Learning Engineer,126774.315972
Senior Data Analyst,113911.363665
Senior Data Engineer,145840.611624
Senior Data Scientist,154206.292996
Software Engineer,113393.760054


DataFrame.reset_index(level=None, *, drop=False, inplace=False, col_level=0, col_fill='', allow_duplicates=<no_default>, names=None)    --> Reset the index, or a level of it.


DataFrame.set_index(keys, *, drop=True, append=False, inplace=False, verify_integrity=False)  -> Set the DataFrame index using existing columns.

ataFrame.sort_index(*, axis=0, level=None, ascending=True, inplace=False, kind='quicksort', na_position='last', sort_remaining=True, ignore_index=False, key=None) ->
Sort object by labels (along an axis).

| Fonksiyon       | Görevi                                            | Kullanım Zamanı                               | Örnek Kod                                       |
|:----------------|:--------------------------------------------------|:-----------------------------------------------|:------------------------------------------------|
| sort_index()    | Index’e göre sıralama yapar                       | Karışık index’leri düzeltmek için              | df.sort_index(ascending=True)                   |
| reset_index()   | Index’i sıfırlar, eski index’i kolona çevirir    | Filtre veya gruplama sonrası index düzeltme    | df.reset_index(drop=True)                       |
| set_index()     | Belirli bir kolonu index yapar                    | Kolona göre veri düzenleyip analiz yapmak için | df.set_index('MüşteriAdı')                      |
