In [2]:
import pandas as pd
from sklearn.preprocessing import MinMaxScaler
import matplotlib.pyplot as plt
# Creiamo un DataFrame di esempio
data = {'Feature1': [100, 200, 300, 400],
        'Feature2': [0.1, 0.5, 0.2, 0.8],
        'Feature3': [1000, 800, 1200, 1500]}

df = pd.DataFrame(data)

# Visualizziamo il DataFrame prima dello scaling
print("DataFrame prima dello scaling:")
print(df)

# Iniziamo con il Min-Max scaling
scaler = MinMaxScaler()
scaled_data = scaler.fit_transform(df)

# Creiamo un nuovo DataFrame con le features scalate
scaled_df = pd.DataFrame(scaled_data, columns=df.columns)

# Visualizziamo il DataFrame dopo lo scaling
print("\nDataFrame dopo lo scaling:")
print(scaled_df)

DataFrame prima dello scaling:
   Feature1  Feature2  Feature3
0       100       0.1      1000
1       200       0.5       800
2       300       0.2      1200
3       400       0.8      1500

DataFrame dopo lo scaling:
   Feature1  Feature2  Feature3
0  0.000000  0.000000  0.285714
1  0.333333  0.571429  0.000000
2  0.666667  0.142857  0.571429
3  1.000000  1.000000  1.000000


In [3]:
import pandas as pd
from sklearn.preprocessing import MinMaxScaler, StandardScaler

# Creiamo un DataFrame di esempio
data = {'Feature1': [100, 200, 300, 400],
        'Feature2': [0.1, 0.5, 0.2, 0.8],
        'Feature3': [1000, 800, 1200, 1500]}

df = pd.DataFrame(data)

# Visualizziamo il DataFrame prima dello scaling
print("DataFrame prima dello scaling:")
print(df)

# Min-Max scaling
min_max_scaler = MinMaxScaler()
min_max_scaled_data = min_max_scaler.fit_transform(df)
min_max_scaled_df = pd.DataFrame(min_max_scaled_data, columns=df.columns)

# Z-score scaling
standard_scaler = StandardScaler()
standard_scaled_data = standard_scaler.fit_transform(df)
standard_scaled_df = pd.DataFrame(standard_scaled_data, columns=df.columns)

# Visualizziamo i DataFrame dopo lo scaling
print("\nDataFrame dopo Min-Max scaling:")
print(min_max_scaled_df)

print("\nDataFrame dopo Z-score scaling:")
print(standard_scaled_df)

DataFrame prima dello scaling:
   Feature1  Feature2  Feature3
0       100       0.1      1000
1       200       0.5       800
2       300       0.2      1200
3       400       0.8      1500

DataFrame dopo Min-Max scaling:
   Feature1  Feature2  Feature3
0  0.000000  0.000000  0.285714
1  0.333333  0.571429  0.000000
2  0.666667  0.142857  0.571429
3  1.000000  1.000000  1.000000

DataFrame dopo Z-score scaling:
   Feature1  Feature2  Feature3
0 -1.341641 -1.095445 -0.483368
1 -0.447214  0.365148 -1.256757
2  0.447214 -0.730297  0.290021
3  1.341641  1.460593  1.450105


In [4]:
import pandas as pd
from sklearn.preprocessing import MinMaxScaler, StandardScaler, RobustScaler

# Creiamo un DataFrame di esempio
data = {'Feature1': [100, 200, 300, 400],
        'Feature2': [0.1, 0.5, 0.2, 0.8],
        'Feature3': [1000, 800, 1200, 1500]}

df = pd.DataFrame(data)

# Visualizziamo il DataFrame prima dello scaling
print("DataFrame prima dello scaling:")
print(df)

# Min-Max scaling
min_max_scaler = MinMaxScaler()
min_max_scaled_data = min_max_scaler.fit_transform(df)
min_max_scaled_df = pd.DataFrame(min_max_scaled_data, columns=df.columns)

# Z-score scaling
standard_scaler = StandardScaler()
standard_scaled_data = standard_scaler.fit_transform(df)
standard_scaled_df = pd.DataFrame(standard_scaled_data, columns=df.columns)

# Robust scaling
robust_scaler = RobustScaler()
robust_scaled_data = robust_scaler.fit_transform(df)
robust_scaled_df = pd.DataFrame(robust_scaled_data, columns=df.columns)

# Visualizziamo i DataFrame dopo lo scaling
print("\nDataFrame dopo Min-Max scaling:")
print(min_max_scaled_df)

print("\nDataFrame dopo Z-score scaling:")
print(standard_scaled_df)

print("\nDataFrame dopo Robust scaling:")
print(robust_scaled_df)

DataFrame prima dello scaling:
   Feature1  Feature2  Feature3
0       100       0.1      1000
1       200       0.5       800
2       300       0.2      1200
3       400       0.8      1500

DataFrame dopo Min-Max scaling:
   Feature1  Feature2  Feature3
0  0.000000  0.000000  0.285714
1  0.333333  0.571429  0.000000
2  0.666667  0.142857  0.571429
3  1.000000  1.000000  1.000000

DataFrame dopo Z-score scaling:
   Feature1  Feature2  Feature3
0 -1.341641 -1.095445 -0.483368
1 -0.447214  0.365148 -1.256757
2  0.447214 -0.730297  0.290021
3  1.341641  1.460593  1.450105

DataFrame dopo Robust scaling:
   Feature1  Feature2  Feature3
0 -1.000000    -0.625 -0.307692
1 -0.333333     0.375 -0.923077
2  0.333333    -0.375  0.307692
3  1.000000     1.125  1.230769


In [1]:
import pandas as pd

# Creiamo un DataFrame di esempio con una variabile categorica
data = {'Colore': ['Rosso', 'Blu', 'Verde', 'Rosso']}
df = pd.DataFrame(data)

# Applichiamo l'encoding One-Hot
df_encoded = pd.get_dummies(df, columns=['Colore'])

# Visualizziamo il DataFrame dopo l'encoding
print(df_encoded)

   Colore_Blu  Colore_Rosso  Colore_Verde
0           0             1             0
1           1             0             0
2           0             0             1
3           0             1             0


In [2]:
import pandas as pd

# Creiamo un DataFrame di esempio con una variabile categorica ordinale
data = {'Livello_Istruzione': ['Scuola elementare', 'Scuola media', 'Diploma', 'Scuola elementare']}
df = pd.DataFrame(data)

# Definiamo l'ordine delle categorie
livelli_istruzione_ordine = {'Scuola elementare': 1, 'Scuola media': 2, 'Diploma': 3}

# Applichiamo l'encoding ordinale
df['Livello_Istruzione_Ordinale'] = df['Livello_Istruzione'].map(livelli_istruzione_ordine)

# Visualizziamo il DataFrame dopo l'encoding
print(df)

  Livello_Istruzione  Livello_Istruzione_Ordinale
0  Scuola elementare                            1
1       Scuola media                            2
2            Diploma                            3
3  Scuola elementare                            1
