Skip to content

A-Chiar/Programmi-Corso-Python-e-Machine-Learning

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

11 Commits
 
 
 
 
 
 

Repository files navigation

Pandas_Amalia

Script Python 1 FASE: creazione dei dati 2 FASE: inizio a definire le classi che voglio creare (potrei fare una classe per ogni punto) #TEMPO STIMATO TOTALE: 30 minuti #Pandas """Obiettivo: Utilizzare pandas e numpy per esplorare, pulire, trasformare e analizzare un dataset di clienti della compagnia di telecomunicazioni. L'esercizio mira a costruire un modello predittivo di base per la churn rate e scoprire correlazioni tra vari attributi del cliente e la loro fedeltà.""" #Dataset: """ID_Cliente: Identificativo unico per ogni cliente Età: Età del cliente Durata_Abonnamento: Quanti mesi il cliente è stato abbonato Tariffa_Mensile: Quanto il cliente paga al mese Dati_Consumati: GB di dati consumati al mese Servizio_Clienti_Contatti: Quante volte il cliente ha contattato il servizio clienti Churn: Se il cliente ha lasciato la compagnia (Sì/No) """

  1. Caricamento e Esplorazione Iniziale: 1A. Caricare i dati da un file CSV. #TEMPO STIMATO: 10 min 2A. Utilizzare info(), describe(), e value_counts() per esaminare la distribuzione dei dati e identificare colonne con valori mancanti. #TEMPO STIMATO: 15 minuti
  2. Pulizia dei Dati: #TEMPO STIMATO: 30 minuti 2A. Gestire i valori mancanti in modo appropriato, considerando l'imputazione o la rimozione delle righe. 2B. Verificare e correggere eventuali anomalie nei dati (es. età negative, tariffe mensili irrealistiche).
  3. Analisi Esplorativa dei Dati (EDA): #TEMPO STIMATO: 50 minuti 3A. Creare nuove colonne che potrebbero essere utili, come Costo_per_GB (tariffa mensile divisa per i dati consumati). 3B. Utilizzare groupby() per esplorare la relazione tra Età, Durata_Abonnamento, Tariffa_Mensile e la Churn. 3C. Utilizzare metodi come corr() per identificare possibili correlazioni tra le variabili.
  4. Preparazione dei Dati per la Modellazione: #TEMPO STIMATO: 30 minuti 4A. Convertire la colonna Churn in formato numerico (0 per "No", 1 per "Sì"). 4B. Normalizzare le colonne numeriche usando numpy per prepararle per la modellazione.
  5. Analisi Statistica e Predittiva: #TEMPO STIMATO: 40 minuti 5A. Implementare un semplice modello di regressione logistica usando scikit-learn per predire la probabilità di churn basata su altri fattori. 5B. Valutare la performance del modello attraverso metriche come l'accuratezza e l'AUC (Area Under Curve)."""

About

Script Python

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages