Pandas_Amalia

Script Python 1 FASE: creazione dei dati 2 FASE: inizio a definire le classi che voglio creare (potrei fare una classe per ogni punto) #TEMPO STIMATO TOTALE: 30 minuti #Pandas """Obiettivo: Utilizzare pandas e numpy per esplorare, pulire, trasformare e analizzare un dataset di clienti della compagnia di telecomunicazioni. L'esercizio mira a costruire un modello predittivo di base per la churn rate e scoprire correlazioni tra vari attributi del cliente e la loro fedeltà.""" #Dataset: """ID_Cliente: Identificativo unico per ogni cliente Età: Età del cliente Durata_Abonnamento: Quanti mesi il cliente è stato abbonato Tariffa_Mensile: Quanto il cliente paga al mese Dati_Consumati: GB di dati consumati al mese Servizio_Clienti_Contatti: Quante volte il cliente ha contattato il servizio clienti Churn: Se il cliente ha lasciato la compagnia (Sì/No) """

Caricamento e Esplorazione Iniziale: 1A. Caricare i dati da un file CSV. #TEMPO STIMATO: 10 min 2A. Utilizzare info(), describe(), e value_counts() per esaminare la distribuzione dei dati e identificare colonne con valori mancanti. #TEMPO STIMATO: 15 minuti
Pulizia dei Dati: #TEMPO STIMATO: 30 minuti 2A. Gestire i valori mancanti in modo appropriato, considerando l'imputazione o la rimozione delle righe. 2B. Verificare e correggere eventuali anomalie nei dati (es. età negative, tariffe mensili irrealistiche).
Analisi Esplorativa dei Dati (EDA): #TEMPO STIMATO: 50 minuti 3A. Creare nuove colonne che potrebbero essere utili, come Costo_per_GB (tariffa mensile divisa per i dati consumati). 3B. Utilizzare groupby() per esplorare la relazione tra Età, Durata_Abonnamento, Tariffa_Mensile e la Churn. 3C. Utilizzare metodi come corr() per identificare possibili correlazioni tra le variabili.
Preparazione dei Dati per la Modellazione: #TEMPO STIMATO: 30 minuti 4A. Convertire la colonna Churn in formato numerico (0 per "No", 1 per "Sì"). 4B. Normalizzare le colonne numeriche usando numpy per prepararle per la modellazione.
Analisi Statistica e Predittiva: #TEMPO STIMATO: 40 minuti 5A. Implementare un semplice modello di regressione logistica usando scikit-learn per predire la probabilità di churn basata su altri fattori. 5B. Valutare la performance del modello attraverso metriche come l'accuratezza e l'AUC (Area Under Curve)."""

Name		Name	Last commit message	Last commit date
Latest commit History 11 Commits
Esercizio Finale Pandas		Esercizio Finale Pandas
analisi_temporale		analisi_temporale
README.md		README.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

Pandas_Amalia

About

Uh oh!

Releases

Packages

Languages

A-Chiar/Programmi-Corso-Python-e-Machine-Learning

Folders and files

Latest commit

History

Repository files navigation

Pandas_Amalia

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages