# Capitolul 0: Deschiderea și închiderea unui fișier. Metode de accesare

## Funcția `open( )`
Funcția `open( )` este utilizată pentru a deschide un fișier în Python. Aceasta returnează un obiect de tipul `File`, care poate fi utilizat pentru a citi sau scrie date.

##### Sintaxă:
```python
f = open('propozitii.txt', 'r')  # Deschidere pentru citire
```

### Importanța închiderii fișierului
Este esențial să închidem fișierele pentru a elibera resursele sistemului. Se folosește metoda `close( )`:
```python
f.close()
```

### Metode de deschidere a unui fișier:
- `'r'`: Citire (implicit)
- `'w'`: Scriere (crează fișierul dacă nu există)
- `'a'`: Adăugare la fișier
- `'rb'`: Citire în mod binar
- `'wb'`: Scriere în mod binar


In [2]:
# Exemplu:

f = open('propozitii.txt', 'r')
print(f)
content = f.read()
print(type(content))
print(content)
f.close()

<_io.TextIOWrapper name='propozitii.txt' mode='r' encoding='utf-8'>
<class 'str'>
Soarele răsare în fiecare dimineață.
Pisica sare pe masă.
Matematica este o materie școlară importantă.
Primăvara vin păsările călătoare.
Citesc o carte interesantă.
Copiii se joacă în parc.
Sportul ajută la menținerea sănătății.
Telefonul mobil este un dispozitiv util.
Istoria se studiază la școală.
Călătoria cu trenul este confortabilă.
Muzica poate fi relaxantă.
Reciclarea este importantă pentru mediu.
Educația este necesară pentru dezvoltare.
Prietenii se ajută între ei.
Desenul este o activitate creativă.


In [None]:
# __EXERCIȚIU__ Încarcă fișierul `propozitii.txt` în Google Colab.
# Rulează exemplul de mai sus. Verifică ce tip de date are variabila f.


## Conectarea Google Drive la Google Colab

### Conectarea Google Drive
Pentru a accesa fișiere din Google Drive în Colab, urmează pașii de mai jos:

1. Importă biblioteca necesară:
   ```python
   from google.colab import drive
   ```
2. Montează drive-ul:
   ```python
   drive.mount('/content/drive')
   ```

3. Navighează către fișier:
   ```python
   filepath = '/content/drive/My Drive/propozitii.txt'
   ```


In [4]:
from google.colab import drive

#drive.mount('/content/drive/')

with open('/content/drive/MyDrive/Projects/Cursuri_SDA/AIRemoteRO6/MODULE 2/MODULE_2_C4_Deschidere_de_Fișiere_Fundamentele_Pandas/propozitii.txt', 'r') as file: # !!! DE MODIFICAT
    content = file.read()
    print(type(content))
    print(content)

<class 'str'>
Soarele răsare în fiecare dimineață.
Pisica sare pe masă.
Matematica este o materie școlară importantă.
Primăvara vin păsările călătoare.
Citesc o carte interesantă.
Copiii se joacă în parc.
Sportul ajută la menținerea sănătății.
Telefonul mobil este un dispozitiv util.
Istoria se studiază la școală.
Călătoria cu trenul este confortabilă.
Muzica poate fi relaxantă.
Reciclarea este importantă pentru mediu.
Educația este necesară pentru dezvoltare.
Prietenii se ajută între ei.
Desenul este o activitate creativă.


In [None]:
# __EXERCIȚIU__ Conectează-te la Google Drive cu adresa de e-mail. Creează un
# director pentru cursuri. Adaugă acest fișier .ipynb în directorul creeat,
# împreună cu fișierul „propozitii.txt". Testează apoi exemplul de mai sus.


## Context manager-ul `with`. Utilizarea sa cu fișiere

### Ce este `with`?
`with` este un context manager care gestionează automat deschiderea și închiderea fișierelor. Asigură închiderea fișierului chiar și în caz de eroare.

#### **Avantajele utilizării context manager-ului**
- Reduce riscul de erori.
- Simplifică codul.

In [None]:
# Exemplu: Citirea unui fișier cu `with`
with open('propozitii.txt', 'r') as file:
    pass
# Fișierul este închis automat


## Citirea dintr-un fișier. Metode populare

### Metoda `read()`
Citește întreg conținutul fișierului ca un singur șir de caractere.

In [5]:
# Exemplu 1:
with open('propozitii.txt', 'r') as fisier:
    content = fisier.read()
    print(content)

Soarele răsare în fiecare dimineață.
Pisica sare pe masă.
Matematica este o materie școlară importantă.
Primăvara vin păsările călătoare.
Citesc o carte interesantă.
Copiii se joacă în parc.
Sportul ajută la menținerea sănătății.
Telefonul mobil este un dispozitiv util.
Istoria se studiază la școală.
Călătoria cu trenul este confortabilă.
Muzica poate fi relaxantă.
Reciclarea este importantă pentru mediu.
Educația este necesară pentru dezvoltare.
Prietenii se ajută între ei.
Desenul este o activitate creativă.



### Metoda `readline()`
Citește o singură linie din fișier.


In [7]:
# Exemplu 2:

with open('propozitii.txt', 'r') as fisier:
    line = fisier.readline()
    while line:
        print(line.strip())
        line = fisier.readline()

Soarele răsare în fiecare dimineață.
Pisica sare pe masă.
Matematica este o materie școlară importantă.
Primăvara vin păsările călătoare.
Citesc o carte interesantă.
Copiii se joacă în parc.
Sportul ajută la menținerea sănătății.
Telefonul mobil este un dispozitiv util.
Istoria se studiază la școală.
Călătoria cu trenul este confortabilă.
Muzica poate fi relaxantă.
Reciclarea este importantă pentru mediu.
Educația este necesară pentru dezvoltare.
Prietenii se ajută între ei.
Desenul este o activitate creativă.




### Metoda `readlines()`
Returnează toate liniile ca o listă.

In [8]:
# Exemplu 3:

with open('propozitii.txt', 'r') as file:
    lines = file.readlines()
    print(lines)
    for line in lines:
        print(line.strip())

['Soarele răsare în fiecare dimineață.\n', 'Pisica sare pe masă.\n', 'Matematica este o materie școlară importantă.\n', 'Primăvara vin păsările călătoare.\n', 'Citesc o carte interesantă.\n', 'Copiii se joacă în parc.\n', 'Sportul ajută la menținerea sănătății.\n', 'Telefonul mobil este un dispozitiv util.\n', 'Istoria se studiază la școală.\n', 'Călătoria cu trenul este confortabilă.\n', 'Muzica poate fi relaxantă.\n', 'Reciclarea este importantă pentru mediu.\n', 'Educația este necesară pentru dezvoltare.\n', 'Prietenii se ajută între ei.\n', 'Desenul este o activitate creativă.']
Soarele răsare în fiecare dimineață.
Pisica sare pe masă.
Matematica este o materie școlară importantă.
Primăvara vin păsările călătoare.
Citesc o carte interesantă.
Copiii se joacă în parc.
Sportul ajută la menținerea sănătății.
Telefonul mobil este un dispozitiv util.
Istoria se studiază la școală.
Călătoria cu trenul este confortabilă.
Muzica poate fi relaxantă.
Reciclarea este importantă pentru mediu.
E

In [11]:
# __EXERCIȚIU__ Folosește `readlines()` pentru a încărca conținutul fișierului
# într-o listă, fiecare propoziție reprezentând un element al listei.
# Afișează propozițiile din două în două linii, împreună cu numărul liniei.

with open('propozitii.txt', 'r') as f:
  date = f.readlines()
  for i in range(0,len(date),2): # 0 -> len(date) din 2 in 2 [0, 2, 4, 6, 8, 10, 12, 14]
    print(f"{i + 1}. {date[i]}")

1. Soarele răsare în fiecare dimineață.

3. Matematica este o materie școlară importantă.

5. Citesc o carte interesantă.

7. Sportul ajută la menținerea sănătății.

9. Istoria se studiază la școală.

11. Muzica poate fi relaxantă.

13. Educația este necesară pentru dezvoltare.

15. Desenul este o activitate creativă.


In [13]:
with open('propozitii.txt', 'r') as f:
  date = f.readlines()
  i = 0
  for prop in date:
    if i % 2 == 0:
      print(f"{i + 1}. {prop}")
    i += 1

1. Soarele răsare în fiecare dimineață.

3. Matematica este o materie școlară importantă.

5. Citesc o carte interesantă.

7. Sportul ajută la menținerea sănătății.

9. Istoria se studiază la școală.

11. Muzica poate fi relaxantă.

13. Educația este necesară pentru dezvoltare.

15. Desenul este o activitate creativă.


In [None]:
with open('propozitii.txt', 'r') as f:
  lines = f.readlines()
  for i, line in enumerate(lines): # -> 0, "Soarele ...", 1, "...", 2, "..." ...
        if i % 2 == 0:
            print(f"{i+1}. {line.strip()}")



## Scrierea datelor într-un fișier. Diferite formate și tipuri de fișiere

### Scrierea într-un fișier text
Folosim modurile `'w'` sau `'a'`.

In [21]:
# Exemplu 1:

with open('output.txt', 'w') as f:
    f.write('Aceasta este o propozitie scrisa intr-un fisier.\n')

In [20]:
# Exemplu 1.1:

with open('output.txt', 'a') as f:
  f.write("Test\n")


### Scrierea într-un fișier CSV
Pentru fișiere CSV, utilizăm biblioteca `csv`.

In [22]:
# Exemplu 2:

import csv

data = [
    ['Nume', 'Varsta'],
    ['Ana', 25],
    ['Mihai', 30]
    ]

with open('date.csv', 'w', newline='') as f:
    w1 = csv.writer(f)
    w1.writerows(data)


### Scrierea fișierelor JSON
Pentru JSON, utilizăm biblioteca `json`.

In [23]:
# Exemplu 3:

import json

data = {'nume': 'Ana', 'varsta': 25}

with open('date.json', 'a') as f:
    json.dump(data, f)

In [None]:
# __EXERCIȚIU__ Se dau două fișiere TXT. Un fișier conține un număr oarecare
# de prenume de studenți (studenti.txt). Al doilea fișier conține media
# fiecărui student menționat (medii.txt). Fiecărui student din fișierul cu
# prenume îi corespunde o medie din fișierul cu medii.

# !! ATENȚIE: Toate prenumele se află pe linii diferite, însă toate mediile
# sunt pe aceeași linie. Gândiți-vă cum tratați fiecare situație.

# Parcurgeți fiecare fișier în parte și salvați prenumele și mediile în două
# liste diferite. Pentru fiecare student, creeați câte un dicționar de forma:
#         {
#            "prenume":"Ana",
#            "medie":8.5
#         }

# Creeați o listă care să conțină câte un astfel de dicționar pentru fiecare
# student.

# Creeați un fișier JSON și adăugați toată lista în acel fișer.
# Ați creeat o mini-bază de date!

# Capitolul 1: Ce este Pandas? Utilizări populare

## 1.1 Introducere

Pandas este o bibliotecă open-source pentru Python, destinată analizei și manipulării datelor. Pandas oferă structuri de date puternice și flexibile, cum ar fi Series și DataFrame, care permit lucrul eficient cu date structurate și semi-structurate.

## 1.2 Utilizări Populare
1.	**Curățarea și preprocesarea datelor**: Eliminarea valorilor lipsă, modificarea formatelor și manipularea coloanelor.
2.	**Explorarea și analiza datelor**: Calcularea statisticilor descriptive, crearea de pivot tables și vizualizări.
3.	**Transformarea datelor**: Filtrarea, sortarea și agregarea datelor.
4.	**Integrarea cu alte biblioteci**: Se combină frecvent cu NumPy, Matplotlib și Scikit-learn pentru fluxuri de lucru complexe.



# Capitolul 2: Structurile de date în Pandas - Series și DataFrame

## 2.1 Series

Un Series este o structură unidimensională similară unei liste sau unui vector, dar cu un index asociat fiecărui element.

In [None]:
# Exemplu 1

import pandas as pd

# Crearea unui Series
exemplu = pd.Series([10, 20, 30, 40], index=["a", "b", "c", "d"])
print(exemplu)

In [None]:
# Exemplu 2

exemplu = pd.Series(["Ana", "Andrei", "Mara", "Mihaela"])
print(exemplu)
print(type(exemplu))
# OBS.: Adăugarea explicită a unui index este opțională.

In [None]:
# Exemplu 3

exemplu = pd.Series([0,1,2,3])
print(exemplu)
print(type(exemplu))

# OBS.: Series este un nou tip de date, separat de cele standard.

In [None]:
# __EXERCIȚIU__ Creeați un Series care reprezintă temperaturile zilnice pentru o
# săptămână și utilizați indecși personalizați pentru zilele săptămânii.

exemplu = pd.Series([11,12,6,3,12], index = ["Lu", "Ma", "Mi", "Joi", "Vi"])
print(exemplu)

## 2.2 DataFrame

Un DataFrame este o structură bidimensională, similară unui tabel, cu rânduri și coloane etichetate.

In [None]:
# Exemplu 1

# Crearea unui DataFrame prin folosirea unui dicționar
datele_mele = {
    "Nume": ["Ana", "Ion", "Maria"],
    "Vârstă": [23, 30, 25],
    "Oraș": ["București", "Cluj", "Iași"]
}
df = pd.DataFrame(datele_mele)
print(df)

# OBS.: Pandas deduce faptul că fiecare cheie reprezintă numele unei coloane
# și fiecare element al listelor este o valoare din acea coloană.

In [None]:
# Exemplu 2

datele_mele = {
    "Nume": ["Ana", "Ion"],
    "Vârstă": [23, 30, 25],
    "Oraș": ["București", "Cluj", "Iași"]
}
df = pd.DataFrame(datele_mele)
print(df)

# OBS.: Dacă folosim această metodă, toate listele trebuie să conțină același
# număr de elemente. Alftel, vom întâmpina un ValueError specific.

In [None]:
# Exemplu 3

# Crearea unui dataframe prin folosirea unei liste de dicționare
# Fiecare element al listei este un dicționar ce poate conține
# chei comune (coloane) sau chiar chei diferite.
lista_comenzi = [
    {'comanda_id': 101, 'client': 'Ion Popescu', 'suma': 250},
    {'comanda_id': 102, 'client': 'Maria Ionescu', 'suma': 350, 'discount': True},
    {'comanda_id': 103, 'client': 'George Vasilescu', 'suma': 150}
]

df_comenzi = pd.DataFrame(lista_comenzi)

print("DataFrame - Listă de dicționare:")
print(df_comenzi)

# OBS.: Această strategie nu generează eroare dacă o intrare în data frame are
# valori pentru mai multe coloane, întrucât Pandas va insera automat tipul de
# date NaN (Not a Number) ca și valoare nulă pentru liniile fără valori date.

In [None]:
# __EXERCIȚIU__ Construiți un DataFrame care să conțină informații despre
# produsele unui magazin (nume produs, preț, stoc disponibil). Folosiți ambele
# metode discutate pentru a defini același dataframe.

# Capitolul 3: Citirea datelor cu Pandas

## 3.1 Citirea unui fișier CSV

Una dintre cele mai comune utilizări ale Pandas este citirea fișierelor CSV. Metoda principală este pd.read_csv.

In [None]:
# Exemplu 1

# Citirea unui fișier CSV
df = pd.read_csv("date.csv")
print(df.head())

## 3.2 Parametrii principali
-	sep: Specifică separatorul (implicit ,).
-	header: Definește rândul care conține anteturile.
-	index_col: Specifică o coloană drept index.
-	usecols: Listează coloanele de încărcat.


In [None]:
# Exemplu 2

# Citirea unui CSV cu parametri
df = pd.read_csv("date.csv", sep=",", header=0, usecols=["Nume", "Salariu"])
print(df.head())


         Nume  Salariu
0     Ionescu     8008
1  Dumitrescu     5269
2   Georgescu     5219
3   Marinescu     9060
4  Dumitrescu     4409


In [None]:
# Exemplu 2

# Citirea unui CSV cu parametri
df = pd.read_csv("date.csv", index_col = 0)
print(df.head())


## 3.3 Fundamentele Kaggle

1. **Ce este Kaggle?**

Kaggle este o platformă online destinată profesioniștilor și pasionaților de Data Science și Machine Learning. Este recunoscută pentru:
-	Seturi de date gratuite: O colecție vastă de seturi de date publice pentru diverse domenii.
-	Competiții: Proiecte colaborative și competiții sponsorizate, în care participanții rezolvă probleme reale folosind modele de Machine Learning.
-	Notebook-uri: Un mediu integrat unde utilizatorii pot crea, partaja și executa cod Python și R.
-	Comunitate activă: O rețea globală de experți care împărtășesc cunoștințe, soluții și sfaturi.

2. **De ce ne ajută Kaggle la Data Science?**

-	Acces la resurse valoroase: Oferă seturi de date bine organizate, tutoriale și exemple de cod care ajută în învățare și cercetare.
-	Practică hands-on: Platforma permite testarea algoritmilor și experimentarea pe date reale.
-	Învățare de la experți: Competițiile și comunitatea oferă acces la soluții și strategii avansate de la lideri din domeniu.
-	Construcția unui portofoliu: Contribuțiile pe Kaggle pot fi folosite pentru a demonstra abilitățile practice în fața potențialilor angajatori.

3. **Cum putem obține seturi de date folosind Kaggle?**
	1.	Crearea unui cont: Accesarea platformei necesită un cont gratuit.
	2.	Navigarea la secțiunea “Datasets”:
	  -	Vizitează Datasets pentru a explora seturile disponibile.
	3.	Descărcarea unui set de date:
	  -	După ce găsești un set interesant, descarcă-l fie direct, fie folosind API-ul Kaggle:
```bash
kaggle datasets download -d <dataset-name>
```
	4.	Integrarea în proiecte: Seturile de date descărcate pot fi utilizate direct în Python, Pandas sau alte biblioteci.



In [None]:
# __EXERCIȚIU__ Descărcați un set de date CSV de pe Kaggle. Creați un dataframe
# care să conțină 3 dintre coloanele acelui set de date. Afișați primele linii
# ale acestui dataframe. CĂUTAȚI DATE NUMERICE.

# Capitolul 4: Afișarea datelor cu Pandas. Metode specifice

##4.1	**Afișare simplă**: Poți printa direct un DataFrame pentru a vizualiza datele care încap pe ecran.

In [None]:
# Exemplu 1
print("DataFrame complet:")
print(df)


##4.2 **Previzualizarea datelor**:
-	df.head(n): Afișează primele n rânduri ale DataFrame-ului (implicit: 5).
-	df.tail(n): Afișează ultimele n rânduri (implicit: 5).
-	df.sample(n): Afișează aleator n rânduri (implicit: 1).

In [None]:
# 2. Previzualizarea datelor
print("\nPrimele 5 rânduri (implicit):")
print(df.head())

print("\nUltimele 3 rânduri:")
print(df.tail(3))

print("\n3 rânduri aleatorii:")
print(df.sample(3))

##4.3	**Accesarea coloanelor**:
-	df["column"] sau df.column: Accesează o coloană (ca Pandas Series).
	-	Notă: Notarea cu punct (df.column) funcționează doar pentru numele coloanelor fără spații sau caractere speciale.
-	df[["column"]]: Accesează o coloană (ca Pandas DataFrame).
-	df[["column1", "column2"]]: Accesează mai multe coloane (ca DataFrame).
	-	Notă: Nu poți specifica mai multe coloane folosind o singură pereche de paranteze pătrate ([]).

In [None]:
# 3. Accesarea coloanelor
print("\nAccesarea unei singure coloane (Series):")
print(df["Nume"])

print("\nAccesarea unei singure coloane (DataFrame):")
print(df[["Nume"]])

print("\nAccesarea mai multor coloane:")
print(df[["Nume", "Salariu"]])

##4.4	**Informații generale**:
-	df.index: Returnează indexul DataFrame-ului.
-	df.columns: Returnează numele coloanelor.
-	df.info(): Oferă informații generale despre dataset (număr de rânduri, valori lipsă, tipuri de date).


In [None]:
# 4. Informații generale
print("\nIndexuri:")
print(df.index)

print("\nNumele coloanelor:")
print(df.columns)

print("\nInformații generale:")
df.info()

In [None]:
# __EXERCIȚIU__ Folosiți setul de date selectat de voi pentru a face următoarele
# exerciții (daca nu aveți, exersați pe data.csv):

# 1.  Afișați primele 10 rânduri ale setului de date.
# 2.	Afișați 3 rânduri alese aleatoriu.
# 3.	Afișați toate numele coloanelor și indexul DataFrame-ului.
# 4.	Alegeți o coloană și afișați-o folosind cele două metode (Series sau
# DataFrame)
# 5.	Verificați informațiile generale despre dataset utilizând df.info().

# Capitolul 5: Subsetare rânduri/coloane cu .loc[] și .iloc[]

## 5.1 .loc[ ]:
  -	Selectează rânduri și/sau coloane după etichete (ex.: numele coloanei sau al indexului).
  -	Sintaxă: `df.loc[etichete_rânduri, etichete_coloane]`.



In [None]:
# Exemplu 1

# Creare de subesturi folosind .loc[]
print("\nRândurile cu etichetele între 0 și 4:")
print(df.loc[0:4, ["Nume", "Salariu"]])  # Primele 5 rânduri + coloanele specificate

print(df.loc[[0,4],"Nume": "Salariu"])  # Primele 5 rânduri + coloanele specificate

In [None]:
# Exemplu 2

datele_mele = {
    "Nume": ["Ana", "Ion", "Maria","Laur","Andrei"],
    "Vârstă": [23, 30, 25, 40, 35],
    "Oraș": ["București", "Cluj", "Iași", "București", "Cluj"]
}
df2 = pd.DataFrame(datele_mele, index = ["a","b","c","d","e"])
print(df2)
print(df2.loc["a":"c",["Oraș"]])

# OBS.: Deoarece metoda .loc() se foloseste pentru identificarea rândurilor
# după etichete (după numele indexului), putem prelua toate rândurile între
# indexul "a" și indexul "c"

In [None]:
# Exemplu 3
df = pd.read_csv("date.csv")

# Creare de subesturi folosind .loc[]
print("\nRândurile cu etichetele din lista [2,3,4] și coloanele între ID_Client și Prenume:")
print(df.loc[[2, 3, 4], "ID_Client":"Prenume"])

In [None]:
# __EXERCIȚIU__ Selectați două coloane din setul de date selectat de voi.
# Afișați rândurile de la indexul 5 la indexul 10 pentru acele coloane, folosind
# metoda .loc[].

## 5.2 .iloc[]:
  -	Selectează rânduri și/sau coloane după poziții numerice.
  -	Sintaxă: `df.iloc[poziții_rânduri, poziții_coloane]`.

In [None]:
# Exemplu 1

#Creare de subseturi folosind .iloc[]
print("Rândurile DE LA poziția 0, PÂNĂ LA poziția 5 (EXCLUSIV) +")
print("Coloanele DE LA poizția 1, PÂNĂ LA poziția 3 (EXCLUSIV):")
print(df.iloc[0:5, 1:3])

In [None]:
# Exemplu 2

print("Rândurile DE LA poziția 0, PÂNĂ LA poziția 10 (EXCLUSIV) +")
print("Coloanele DE LA poizția 1, PÂNĂ LA FINAL:")
print(df.iloc[0:10, 1::])

In [None]:
# Exemplu 3

print("Rândurile DE LA poziția 0, PÂNĂ LA poziția 10 (EXCLUSIV) +")
print("Coloanele ÎN ORDINE INVERSĂ începând cu ULTIMA:")
print(df.iloc[0:10, ::-1])

In [None]:
# __EXERCIȚIU__ Pentru setul de date ales de voi, selectați coloanele de la
# coloana a doua până la final și afișați rândurile 5..15 pentru acele coloane
# folosind metoda .iloc[].

# Capitolul 6: Filtrarea datelor cu condiții logice

Pandas permite filtrarea rândurilor utilizând condiții logice:
-	Sintaxă: `df[condiție]`
-	Combinarea condițiilor:
  -	&: Condiția AND (și)
  -	|: Condiția OR (sau)

In [None]:
# Exemplu 1

# Filtrare rânduri unde Salariu > 5000
print("\nRânduri cu Salariu > 5000:")
print(df[df["Salariu"] > 5000])

In [None]:
# Exemplu 2

# Condiții multiple: Salariu > 5000 și Ani_Vechime > 20
print("\nRânduri cu Salariu > 5000 și Ani_Vechime > 20:")
print(df[(df["Salariu"] > 5000) & (df["Ani_Vechime"] > 20)])

In [None]:
# Exemplu 3

# Interval de aparținere: Salariu între 5000 și 7000
print("\nIntrări cu Salariu între 5000 și 7000:")
print(df[(df["Salariu"] > 5000) & (df["Salariu"] < 7000)])

In [None]:
# __EXERCIȚIU__ Filtrați setul de date date.csv după următoarele condiții:
#   Toate rândurile au Ani_Vechime < 10.
# 	ID-ul clientului face parte din intervalul [25, 35]
#   Numele clientului începe cu litera P -- Aici vom folosi df["Nume"].str.startswith("P")

# Capitolul 7: Suprascrierea datelor

Datele dintr-un DataFrame Pandas pot fi suprascrise utilizând:
-	Atribuire:
	-	`df["coloană"] = valori_noi`: Suprascrie o coloană existentă sau adaugă una nouă.
- Folosire de metode:
	-	.replace(): Înlocuiește valori specifice.
	- .apply(): Aplică o funcție pentru a modifica valorile.


In [None]:
# Exemplu 1: Suprascrierea unei coloane existente
print(df.head())

df["salariu"] = df["Salariu"] + 500  # Creștem salariile cu 500

df.head()

In [None]:
# Exemplu 2: Adăugarea unei coloane noi
df["Bonus"] = df["Salariu"] * 0.1  # Bonus = 10% din salariu

df.head()

In [None]:
# Exemplu 3: Înlocuirea unor valori
df["Nume"] = df["Nume"].replace("Popescu", "Popa")  # Înlocuim "Popescu" cu "Popa"

df[(df["Nume"].str.startswith("P"))]

In [None]:
# Exemplu 4 # Înlocuirea mai multor valori

df["Prenume"] = df["Prenume"].replace({
    "Maria": "Ana",
    "Cristina": "Elena"
})

df.head()

In [None]:
# Exemplu 5: Înlocuirea valorilor numerice
df["Salariu"] = df["Salariu"].replace({
    4000: 4500,
    6000: 6500
})

print("\nDataFrame după modificarea salariilor:")
print(df)

In [None]:
# Exemplu 6: Creăm o funcție pentru ajustarea salariului
def adjust_salary(salary):
    if salary < 5000:
        return 0  # Adaugă 500 pentru salarii mici
    elif salary > 6000:
        return salary * 0  # Creștem cu 10% pentru salarii mari
    return salary

# Aplicăm funcția pe coloana "Salariu"
df["Salariu"] = df["Salariu"].apply(adjust_salary)

print("\nDataFrame după ajustarea salariilor cu apply:")
print(df)

In [None]:
# __EXERCIȚIU__ Adăugați o coloană Salariu_Net care calculează salariul după
# o deducere de 10% taxe.

In [None]:
# __EXERCIȚIU__ Înlocuiți toate aparițiile unui anumit nume de familie
# ("Ionescu") cu "Ion".

In [None]:
# __EXERCIȚIU__ Adăugați o coloană "Pozitie":
# -	Atribuiți "Junior" pentru angajații cu Ani_Vechime < 5.
# -	Atribuiți "Senior" pentru cei cu Ani_Vechime >= 5.