# Бібліотека Pandas  
- 1. Зчитування файлів CSV та Excel  
- 2. Коротка інформація про датафрейм  
- 3. Перейменувння стовпців  
- 4. Видалення рядків та стовпців датафрейму  
- 5. Заповнення/видалення пропущених значень  
- 6. Звернення до елементів датафрейму, отримання зрізу  
- 7. Вибір рядків за заданими умовами  
- 8. Запис датафрейму в файл


**Pandas** – це бібліотека, яка надає дуже зручні з точки зору використання інструменти для зберігання даних та роботи з ними.
Особливість pandas полягає в тому, що ця бібліотека швидка, гнучка та проста у використанні. Pandas чудово підходить для роботи з одновимірними та двовимірними таблицями даних, добре пристосована для роботи  з файлами CSV, таблицями Excel.   

  
  

- _Датафрейм (Dataframe) – це двовимірна структура даних зі стовпцями та рядками. Це спеціальний аналог таблиці Excel або SQL._

In [1]:
# імпортуємо бібліотеку Pandas
import pandas as pd

In [2]:
# встановимо, що в числах типу float виводити 3 знаки після роздільника (додаткова опція, яку можна не застосовувати)
pd.options.display.float_format = '{:.3f}'.format

### 1. Зчитування файлів CSV та Excel
#### csv:  
name_data_frame = pd.read_csv('path_to_file.csv')  
#### excel:  
name_data_frame = pd.read_excel('path_to_file.xlsx')  
якщо необхідно зчитати конкретний аркуш в листі Excel:  
name_data_frame = pd.read_excel('path_to_file.xlsx', sheet_name = 'Лист 1')  
  
- 1.1. Якщо файл з початковими даними зберігається локально, то щоб уникнути запису повного шляху до файлу, можна тримати робочий файл і файл з даними в одній папці. Тоді достатньо буде вказати тільки назву файлу з даними та його розширення.  
<font color='red'>Додатково: Якщо ви працюєте в Google Colab, то зчитати файл, що зберігається локально можна так:</font>

```from google.colab import files```  
```uploaded = files.upload()```

In [None]:
# зчитування файлу, що зберігається локально

# якщо необхідно, вказати тип розділювача sep= (за замовчанням sep=',' )
df = pd.read_csv('DE_1.csv', sep=';')
df # щоб відобразити датафрейм, необхідно надрукувати його назву

- 1.2. Якщо файл з початковими даними розміщено на GitHub:  
А. Перейдіть на сторінку файлу на GitHub.  
B. Натисніть на кнопку "Raw", щоб відкрити файл у сирому вигляді.  
C. Скопіюйте URL із адресного рядка браузера.  
D. Завантажте файл у Jupyter Notebook

In [5]:
url = 'https://raw.githubusercontent.com/OlhaOsypova/Machine-Learning-and-Data-Analytics/refs/heads/main/Topic_2_Pandas/Lecture/DE_1.csv'
df = pd.read_csv(url, sep=';')
df

Unnamed: 0.1,Unnamed: 0,Index digital economy,Internet use: interaction with public authorities (last 12 months),Individuals who have high overall digital skills,"частка витрат уряду на розвиток адміністративних послуг, % до заг витрат","частка працівників, що проходять підвищення кваліфікації у сфері ікт",EU/NonEU,Unnamed: 7,Unnamed: 8,Unnamed: 9,Unnamed: 10,Unnamed: 11
0,Austria,75.0,62,81.0,2.7,53.0,EU,,,,,
1,Belgium,69.0,55,73.0,3.3,49.0,EU,,,,,
2,Bulgaria,24.0,21,66.0,1.8,11.0,EU,,,,,
3,Croatia,33.0,32,75.0,1.6,21.0,EU,,,,,
4,Cyprus,47.0,42,71.0,3.2,24.0,EU,,,,,
5,Czechia,57.0,46,76.0,2.4,34.0,EU,,,,,
6,Denmark,77.0,89,74.0,5.5,69.0,EU,,,,,
7,Estonia,77.0,78,73.0,3.0,46.0,EU,,,,,
8,Finland,84.0,83,82.0,3.9,58.0,EU,,,,,
9,France,77.0,68,71.0,2.3,54.0,EU,,,,,


### Опис датафрейму df  
Датафрейм містить набір показників, що характеризують рівень розвитку цифрової економіки в 37 країнах:  
- Unnamed: 0 - назва країни  
- Index digital economy - індекс розвитку цифрової економіки  
- Internet use: interaction with public authorities (last 12 months) - частка звернень до органів влади, здійснена через мережу Інтернет  
- Individuals who have high overall digital skills' - частка населення, що володіє цифровими навичками на високому рівні  
- частка витрат уряду на розвиток адміністративних послуг, % до заг витрат  
- частка працівників, що проходять підвищення кваліфікації у сфері ікт  
- EU/NonEU - країна входить/не входить до ЄС  
- Unnamed: 7, Unnamed: 8, Unnamed: 9, Unnamed: 10, Unnamed: 11 - ???

### 2. Коротка інформація про датафрейм  
**довідка:** при застосуванні атрибутів та методів дотримуємося т.з. крапкового синтаксису:  
**name_of_dataframe.name_of_atribute**  
**name_of_dataframe.name_of_method()**

In [6]:
# Розмір датафрейму
df.shape

(37, 12)

In [7]:
#Отримуємо перелік назв стовпців
df.columns

Index(['Unnamed: 0', 'Index digital economy',
       'Internet use: interaction with public authorities (last 12 months)',
       'Individuals who have high overall digital skills',
       'частка витрат уряду на розвиток адміністративних послуг, % до заг витрат',
       'частка працівників, що проходять підвищення кваліфікації у сфері ікт',
       'EU/NonEU', 'Unnamed: 7', 'Unnamed: 8', 'Unnamed: 9', 'Unnamed: 10',
       'Unnamed: 11'],
      dtype='object')

In [8]:
#Отримуємо перелік назв рядків
df.index

RangeIndex(start=0, stop=37, step=1)

In [10]:
# Коротка довідка про датафрейм
# Column - назва стовпця
# Non-Null Count - кількість заповнених значень для кожного стовпця
# Dtype - тип інформації в кожному стовпці (int64, float64 - числа; object - текст)
df.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 37 entries, 0 to 36
Data columns (total 12 columns):
 #   Column                                                                    Non-Null Count  Dtype  
---  ------                                                                    --------------  -----  
 0   Unnamed: 0                                                                37 non-null     object 
 1   Index digital economy                                                     35 non-null     float64
 2   Internet use: interaction with public authorities (last 12 months)        37 non-null     int64  
 3   Individuals who have high overall digital skills                          34 non-null     float64
 4   частка витрат уряду на розвиток адміністративних послуг, % до заг витрат  34 non-null     float64
 5   частка працівників, що проходять підвищення кваліфікації у сфері ікт      35 non-null     float64
 6   EU/NonEU                                                            

In [11]:
# Відображаємо перші (за замовчанням 5) значень
df.head()

Unnamed: 0.1,Unnamed: 0,Index digital economy,Internet use: interaction with public authorities (last 12 months),Individuals who have high overall digital skills,"частка витрат уряду на розвиток адміністративних послуг, % до заг витрат","частка працівників, що проходять підвищення кваліфікації у сфері ікт",EU/NonEU,Unnamed: 7,Unnamed: 8,Unnamed: 9,Unnamed: 10,Unnamed: 11
0,Austria,75.0,62,81.0,2.7,53.0,EU,,,,,
1,Belgium,69.0,55,73.0,3.3,49.0,EU,,,,,
2,Bulgaria,24.0,21,66.0,1.8,11.0,EU,,,,,
3,Croatia,33.0,32,75.0,1.6,21.0,EU,,,,,
4,Cyprus,47.0,42,71.0,3.2,24.0,EU,,,,,


In [12]:
# Відображаємо випадкові (за замовчанням 5) значень
df.sample(4)

Unnamed: 0.1,Unnamed: 0,Index digital economy,Internet use: interaction with public authorities (last 12 months),Individuals who have high overall digital skills,"частка витрат уряду на розвиток адміністративних послуг, % до заг витрат","частка працівників, що проходять підвищення кваліфікації у сфері ікт",EU/NonEU,Unnamed: 7,Unnamed: 8,Unnamed: 9,Unnamed: 10,Unnamed: 11
1,Belgium,69.0,55,73.0,3.3,49.0,EU,,,,,
17,Lithuania,60.0,48,78.0,2.5,29.0,EU,,,,,
10,Germany,73.0,53,78.0,2.7,66.0,EU,,,,,
4,Cyprus,47.0,42,71.0,3.2,24.0,EU,,,,,


In [13]:
# Відображаємо останні (за замовчанням 5) значень
df.tail(3)

Unnamed: 0.1,Unnamed: 0,Index digital economy,Internet use: interaction with public authorities (last 12 months),Individuals who have high overall digital skills,"частка витрат уряду на розвиток адміністративних послуг, % до заг витрат","частка працівників, що проходять підвищення кваліфікації у сфері ікт",EU/NonEU,Unnamed: 7,Unnamed: 8,Unnamed: 9,Unnamed: 10,Unnamed: 11
34,Moldova,31.0,37,49.0,2.0,52.0,NonEU,,,,,
35,Albania,35.0,42,50.0,3.0,51.0,NonEU,,,,,
36,Makedonia,32.0,44,47.0,3.0,50.0,NonEU,,,,,


#### Метод describe() у бібліотеці pandas використовується для отримання основної описової статистики  
Для числових стовпців виодить наступну інформацію:  
- count: Кількість непорожніх (non-null) значень у кожному стовпці.  
- mean: Середнє арифметичне значення для кожного числового стовпця.  
- std: Стандартне відхилення, що показує розсіювання даних навколо середнього значення.  
- min: Мінімальне значення в кожному стовпці.  
- 25%: 25-й перцентиль (перша чверть), тобто значення, нижче якого знаходиться 25% даних.  
- 50%: 50-й перцентиль, або медіана, тобто значення, нижче якого знаходиться 50% даних.  
- 75%: 75-й перцентиль (третя чверть), тобто значення, нижче якого знаходиться 75% даних.  
- max: Максимальне значення в кожному стовпці.

In [14]:
# Основна описова статистика даних в таблиці
df.describe()

Unnamed: 0,Index digital economy,Internet use: interaction with public authorities (last 12 months),Individuals who have high overall digital skills,"частка витрат уряду на розвиток адміністративних послуг, % до заг витрат","частка працівників, що проходять підвищення кваліфікації у сфері ікт",Unnamed: 7,Unnamed: 8,Unnamed: 9,Unnamed: 10,Unnamed: 11
count,35.0,37.0,34.0,34.0,35.0,0.0,0.0,0.0,0.0,0.0
mean,59.4,52.216,72.559,3.215,45.257,,,,,
std,20.378,21.76,10.399,1.217,18.173,,,,,
min,24.0,9.0,47.0,1.5,11.0,,,,,
25%,41.0,42.0,68.0,2.425,31.0,,,,,
50%,59.0,49.0,75.5,2.9,46.0,,,,,
75%,77.0,69.0,78.0,3.9,59.0,,,,,
max,89.0,89.0,88.0,5.9,78.0,,,,,


Якщо describe() викликається на DataFrame, що містить категоріальні дані (текстові або категорійні стовпці), він виведе іншу статистику:  
- count: Кількість непорожніх значень.  
- unique: Кількість унікальних значень.  
- top: категорія, яка зустрічається найчастіше (мода).  
- freq: частота, з якою зустрічається найпопулярніша категорія.

In [15]:
# Описова статистика для категоріальних змінних: в якості аргументу передати include=[object]
df.describe(include=[object])

Unnamed: 0.1,Unnamed: 0,EU/NonEU
count,37,37
unique,37,2
top,Austria,EU
freq,1,27


### 3. Перейменування стовпців  
Перейменувати стовпці можна двома способами.    

3.1 Перший метод-це метод **rename()**, який використовується для перейменування будь-якого стовпця або декількох стовпців.  
Як аргумент методу rename передаємо словник:  
**columns = {'стара назва': 'нова назва'}**  
  
  **inplace=True - початковий фрейм даних оновлено**  
   **inplace=False - початковий фрейм даних не змінюється, результат відображається в копії датафрейму (за замовчуванням inplace=False)**

In [16]:
#Отримуємо перелік назв стовпців
df.columns

Index(['Unnamed: 0', 'Index digital economy',
       'Internet use: interaction with public authorities (last 12 months)',
       'Individuals who have high overall digital skills',
       'частка витрат уряду на розвиток адміністративних послуг, % до заг витрат',
       'частка працівників, що проходять підвищення кваліфікації у сфері ікт',
       'EU/NonEU', 'Unnamed: 7', 'Unnamed: 8', 'Unnamed: 9', 'Unnamed: 10',
       'Unnamed: 11'],
      dtype='object')

In [17]:
# Перейменовуємо перших дві колонки
df.rename(columns={'Unnamed: 0': 'Country',
                   'Index digital economy': 'DE_index'
                   }, inplace=True)
df.head()

Unnamed: 0,Country,DE_index,Internet use: interaction with public authorities (last 12 months),Individuals who have high overall digital skills,"частка витрат уряду на розвиток адміністративних послуг, % до заг витрат","частка працівників, що проходять підвищення кваліфікації у сфері ікт",EU/NonEU,Unnamed: 7,Unnamed: 8,Unnamed: 9,Unnamed: 10,Unnamed: 11
0,Austria,75.0,62,81.0,2.7,53.0,EU,,,,,
1,Belgium,69.0,55,73.0,3.3,49.0,EU,,,,,
2,Bulgaria,24.0,21,66.0,1.8,11.0,EU,,,,,
3,Croatia,33.0,32,75.0,1.6,21.0,EU,,,,,
4,Cyprus,47.0,42,71.0,3.2,24.0,EU,,,,,


3.2 Другий метод. Використання **df.columns=[list_of_names]**  

Обмеження цього методу полягає в тому, що якщо один стовпець повинен бути змінений, то повинен бути переданий повний список стовпців.  
**Для стабільності і прогнозованої роботи з DataFrame всі назви стовпців рекомендується задавати як рядки (strings)**

In [18]:
df.columns = ['Country', 'DE_index', 'Users', 'Skills', 'Gov_exp', 'Workers', 'EU/NonEU', '8', '9', '10', '11', '12']
df.head()

Unnamed: 0,Country,DE_index,Users,Skills,Gov_exp,Workers,EU/NonEU,8,9,10,11,12
0,Austria,75.0,62,81.0,2.7,53.0,EU,,,,,
1,Belgium,69.0,55,73.0,3.3,49.0,EU,,,,,
2,Bulgaria,24.0,21,66.0,1.8,11.0,EU,,,,,
3,Croatia,33.0,32,75.0,1.6,21.0,EU,,,,,
4,Cyprus,47.0,42,71.0,3.2,24.0,EU,,,,,


### 4. Видалення рядків та стовпців  
#### 4.1 Видалення рядків  
**df.drop([list of row names], axis = 0, inplace=True)**    
axis = 0 - параметр означає, що ми видаляємо рядки   
  
  **Приклад**  
  видалити рядки з назвами 2,4,6 - df.drop([2, 4, 6], axis=0, inplace=True)

In [19]:
# Видалимо рядок з назвою 25
df.drop([2, 4, 6], axis=0, inplace=True)
df

Unnamed: 0,Country,DE_index,Users,Skills,Gov_exp,Workers,EU/NonEU,8,9,10,11,12
0,Austria,75.0,62,81.0,2.7,53.0,EU,,,,,
1,Belgium,69.0,55,73.0,3.3,49.0,EU,,,,,
3,Croatia,33.0,32,75.0,1.6,21.0,EU,,,,,
5,Czechia,57.0,46,76.0,2.4,34.0,EU,,,,,
7,Estonia,77.0,78,73.0,3.0,46.0,EU,,,,,
8,Finland,84.0,83,82.0,3.9,58.0,EU,,,,,
9,France,77.0,68,71.0,2.3,54.0,EU,,,,,
10,Germany,73.0,53,78.0,2.7,66.0,EU,,,,,
11,Greece,52.0,47,77.0,2.0,26.0,EU,,,,,
12,Hungary,48.0,47,73.0,2.5,26.0,EU,,,,,


#### 4.2 Видалення стовпців  
**df.drop([list of column names], axis = 1, inplace=True)**    
axis = 1 - параметр означає, що ми видаляємо стовпчики

In [20]:
# Видалимо останніх 5 стовпчиків
df.drop(['8', '9', '10', '11', '12'], axis=1, inplace=True)
df.head()

Unnamed: 0,Country,DE_index,Users,Skills,Gov_exp,Workers,EU/NonEU
0,Austria,75.0,62,81.0,2.7,53.0,EU
1,Belgium,69.0,55,73.0,3.3,49.0,EU
3,Croatia,33.0,32,75.0,1.6,21.0,EU
5,Czechia,57.0,46,76.0,2.4,34.0,EU
7,Estonia,77.0,78,73.0,3.0,46.0,EU


### 5. Заповнення/видалення пропущенних значень

In [21]:
df.info()

<class 'pandas.core.frame.DataFrame'>
Index: 34 entries, 0 to 36
Data columns (total 7 columns):
 #   Column    Non-Null Count  Dtype  
---  ------    --------------  -----  
 0   Country   34 non-null     object 
 1   DE_index  32 non-null     float64
 2   Users     34 non-null     int64  
 3   Skills    31 non-null     float64
 4   Gov_exp   31 non-null     float64
 5   Workers   32 non-null     float64
 6   EU/NonEU  34 non-null     object 
dtypes: float64(4), int64(1), object(2)
memory usage: 2.1+ KB


In [22]:
# Можна використати такий підхід для визначення кількості NaN елементів:
df.isnull().sum()

Unnamed: 0,0
Country,0
DE_index,2
Users,0
Skills,3
Gov_exp,3
Workers,2
EU/NonEU,0


### 5.1 Видалення рядків із пропусками  
**df.dropna()**  
df.dropna(how='any', inplace=True) - видалити всі рядки, в яких є пропуски  
df.dropna(thresh=N, inplace=True) - залишити рядки, в яких принаймні N значень є заповненими, решту рядків - видалити

In [23]:
# thresh=4 - залишити рядки, в яких мінімум 4 заповнених значення, решту рядків - видалити
df.dropna(thresh=4, inplace=True)
df

Unnamed: 0,Country,DE_index,Users,Skills,Gov_exp,Workers,EU/NonEU
0,Austria,75.0,62,81.0,2.7,53.0,EU
1,Belgium,69.0,55,73.0,3.3,49.0,EU
3,Croatia,33.0,32,75.0,1.6,21.0,EU
5,Czechia,57.0,46,76.0,2.4,34.0,EU
7,Estonia,77.0,78,73.0,3.0,46.0,EU
8,Finland,84.0,83,82.0,3.9,58.0,EU
9,France,77.0,68,71.0,2.3,54.0,EU
10,Germany,73.0,53,78.0,2.7,66.0,EU
11,Greece,52.0,47,77.0,2.0,26.0,EU
12,Hungary,48.0,47,73.0,2.5,26.0,EU


### 5.2 Заповнення пропущених значень  
#### df.fillna()  
Метод fillna() замінює пропущене значення на вказане значення.  Наприклад:  
- df.mean() - середнє значення  
- df.median() - медіана  
- 0 - значення 0

In [24]:
#Заповнення пропущених значень середніми по совпчиках значеннями
df.fillna(df.mean(numeric_only=True), inplace=True)

In [25]:
df.info()

<class 'pandas.core.frame.DataFrame'>
Index: 32 entries, 0 to 36
Data columns (total 7 columns):
 #   Column    Non-Null Count  Dtype  
---  ------    --------------  -----  
 0   Country   32 non-null     object 
 1   DE_index  32 non-null     float64
 2   Users     32 non-null     int64  
 3   Skills    32 non-null     float64
 4   Gov_exp   32 non-null     float64
 5   Workers   32 non-null     float64
 6   EU/NonEU  32 non-null     object 
dtypes: float64(4), int64(1), object(2)
memory usage: 2.0+ KB


## 6. Звернення до елементів датафрейму, отримання зрізів  
#### 6.1 Звернення до стовпців датафрейму  
name_of_dataframe[[list_of_columns]]

In [26]:
# Звернення до конкретного стовпця
#Елементи стовпчика 'Users':
df[['Users']]
#df.Users #альтернативний варіант

Unnamed: 0,Users
0,62
1,55
3,32
5,46
7,78
8,83
9,68
10,53
11,47
12,47


In [27]:
# Звернення до кількох стовпців
df[['DE_index','Users']]

Unnamed: 0,DE_index,Users
0,75.0,62
1,69.0,55
3,33.0,32
5,57.0,46
7,77.0,78
8,84.0,83
9,77.0,68
10,73.0,53
11,52.0,47
12,48.0,47


### 6.2 Отримання зрізів. Метод loc  
**loc** отримує у якості аргументів <font color='red'>імена (мітки) </font> рядків та стовпців.  
loc включає крайні значення діапазону:  
**name_of_dataframe.loc[мітки рядків, мітки стовпців]**  



In [None]:
df
#Назви (мітки) стовпчиків: 'Country' 'DE_index' 'Users' 'Skills' 'Gov_exp' 'Workers' 'EU/NonEU'
#Назви (мітки) рядків: 0 1 3 5 7 8 9 10 і т.д.
#Індекси стовпчиків: 0 1 2 3 4 5 6
#Індекси рядків: 0 1 2 3 4 5 6 7 8 9 і т.д.

In [28]:
# lOC
# вивести інф., що міститься в 2-му та 3-му рядках стовпців Users та EU/NonEU
df.loc[[1, 3], ['Users', 'EU/NonEU']]

Unnamed: 0,Users,EU/NonEU
1,55,EU
3,32,EU


## 7. Вибір рядків за заданими умовами

### 7.1. Вибір за категоріальною ознакою (наприклад, вибрати всі країни, що не входять до ЄС)
Конструкція **df['EU/NonEU'] == 'NonEU'** - це наша умова;   
обернувши цю умову в датафрейм, ми доручаємо бібліотеці pandas "вибрати всі рядки у нашому фреймі, де значення 'EU/NonEU' дорівнює 'NonEU'.

In [None]:
df[df['EU/NonEU'] == 'NonEU']

### 7.2.Вибір за кількісною ознакою (наприклад, вибрати всі країни, в яких значення "DE_index" вище 70)  
умова: df['DE_index'] > 70

In [None]:
df[df['DE_index'] > 70]

In [None]:
# Вибрати країни зі значенням DE_index > 70 та показати тільки стовпчики Country та DE_index
# використаємо ф-ю .loc
#.loc[діапазон рядків,   діапазон стовпчиків]
# діапазон рядків: df['DE_index'] > 70
# діапазон стовпчиків: ['Country', 'DE_index']
df.loc[df['DE_index'] > 70, ['Country', 'DE_index']]

### В комірці вище застосовано метод loc для того, щоб можна було не тільки відфільтрувати датафрейм за заданими умовами, а й вибрати лише окремі стовпчики з початкового датафрейму.  


### 7.3 Вибір за 2-ма та більше умовами  
Наприклад: Вибрати країни-учасниці ЄС, що мають індекс розвитку цифрової економіки вище 70  
#### При роботі з pandas необхідно використовувати:  
- символ & для логічного оператора AND   
- символ | для логічного оператора OR  
#### Кожну умову необхідно заключати в ():  
**df[(умова 1) & (умова 2)]**

In [None]:
#Вибрати країни-учасниці ЄС, що мають індекс розвитку цифрової економіки вище 70:
#Умова 1: (df['EU/NonEU'] == 'EU')
#Умова 2: (df['DE_index'] > 70)

#Вивести тільки назви країн та величину даного індексу

#Скористаємося методом .loc[діапазон рядків,   діапазон стовпчиків]
# діапазон рядків: (df['EU/NonEU'] == 'EU') & (df['DE_index'] > 70)
# діапазон стовпчиків: ['Country', 'DE_index']
df.loc[(df['EU/NonEU'] == 'EU') & (df['DE_index'] > 70), ['Country', 'DE_index']]

In [None]:
# Можна зберегти отриманий зріз в новий датафрейм, присвоївши йому нове ім'я df_new
df_new = df.loc[(df['EU/NonEU'] == 'EU') & (df['DE_index'] > 70), ['Country', 'DE_index']]
df_new

## 8. Запис датафрейму в файл  
Коли ви внесли всі необхідні зміни у датафрейм, ви можете зберегти остаточну версію датафрейму у файл:  
- df.to_csv('path_to_file.csv', index=0) **для формату csv**  
- df.to_excel('path_to_file.xlsx', index=0) **для формату excel**  
  
  Якщо ви встановлюєте index=0 (index=False), індекс рядків DataFrame не буде включений у збережений CSV файл.


In [None]:
#Цей файл буде збережено в папку, яка містить робочий ноутбук "Pandas_Library"!!!
df.to_csv('DE-index.csv', index = 0)