# SoftPython


**Guida introduttiva e gratuita alla pulizia e analisi dati con Python 3.** 

**Ricca di esercizi svolti e adatta sia a principianti che studenti con conoscenze tecnico/scientifiche.**



Al giorno d’oggi sempre più decisioni vengono prese in base a dati fattuali e oggettivi. Tutte le discipline, dall’ingegneria alle scienze sociali, necessitano oramai capacità di elaborare dati ed estrarre informazioni utili dall’analisi di fonti eterogenee. Questo sito di esercizi pratici fornisce quindi un’introduzione al processamento dati usando [Python](http://www.python.it/), un linguaggio di programmazione popolare sia nell’industria che nell'ambito della ricerca. 

## News

**19 agosto 2021**: aggiunto esercizi a liste 1 e 2

**6 agosto 2021**: aggiunto [challenge pandas](#pandas)

**5 agosto 2021**: migliorato e aggiunto soluzioni efficienti a [matrici numpy](#matrices-numpy)

**24 maggio 2021**: migliorato [pandas](pandas/pandas-sol.ipynb)

**8 maggio 2021**: migliorato [matrici numpy](#matrices-numpy) e aggiunto challenge  

**2 maggio 2021**: aggiunto challenge a [visualizzazione](#visualization)

Vecchie news: [link](changelog.ipynb)

## A chi è rivolto 

Il materiale in questo sito è rivolto sia a principianti assoluti che a studenti con background più tecnico che desiderino acquisire conoscenze pratiche riguardo l’estrazione, la pulizia, l’analisi e visualizzazione di dati (tra i framework Python usati vi saranno Pandas, Numpy e l’editor Jupyter). Per superare eventuali difficoltà e garantire risultati didattici concreti, le guide presentate sono passo-passo.

## Requisiti

Qualche conoscenza base di programmazione, in un qualsiasi linguaggio è utile ma non strettamente necessaria. Tutti i materiali proposti sono in lingua italiana.

## Contenuti

* [Come orientarsi](overview.ipynb): Approccio e obbiettivi

* [Riferimenti](references.ipynb)
    
### A - Fondamenti

1.  [Installazione](installation.ipynb)
1.  [Introduzione veloce a Python](quick-intro/quick-intro-sol.ipynb) (per chi ha già conoscenze di programmazione)
1.  [Strumenti e script](tools/tools-sol.ipynb)

1.  <p id="basics">Basi (per principianti assoluti)</p> 

    1. [variabili e interi](basics/basics1-ints-sol.ipynb) 
    2. [booleani](basics/basics2-bools-sol.ipynb) 
    3. [numeri reali](basics/basics3-floats-sol.ipynb) 
    4. [challenge](basics/basics4-chal.ipynb)

1.  <p id="strings">Stringhe</p>

    1. [introduzione](strings/strings1-sol.ipynb)
    2. [operatori](strings/strings2-sol.ipynb)
    3. [metodi](strings/strings3-sol.ipynb)
    4. [altri esercizi](strings/strings4-sol.ipynb)
    5. [challenge](strings/strings5-chal.ipynb)
    
1.  <p id="lists">Liste</p>

    1. [introduzione](lists/lists1-sol.ipynb)
    2. [operatori](lists/lists2-sol.ipynb)
    3. [metodi](lists/lists3-sol.ipynb)
    4. [iterazione e funzioni](lists/lists4-sol.ipynb)
    5. [challenge](lists/lists5-chal.ipynb)
    
1.  <p id="tuples">Tuple</p>

    1.  [introduzione](tuples/tuples1-sol.ipynb)
    2.  [challenge](tuples/tuples2-chal.ipynb)

1.  <p id="sets">Insiemi</p>

    1.  [introduzione](sets/sets1-sol.ipynb)
    2.  [challenge](sets/sets2-chal.ipynb)

1.  <p id="dictionaries">Dizionari</p>

    1. [introduzione](dictionaries/dictionaries1-sol.ipynb)
    2. [operatori](dictionaries/dictionaries2-sol.ipynb)
    3. [metodi](dictionaries/dictionaries3-sol.ipynb)
    4. [iterazione e funzioni](dictionaries/dictionaries4-sol.ipynb)
    5. [strutture composte](dictionaries/dictionaries5-sol.ipynb)
    6. [challenge](dictionaries/dictionaries6-chal.ipynb)

1.  <p id="control-flow">Controllo di flusso</p>

    1. [condizionali if](control-flow/flow1-if-sol.ipynb)
    2. [cicli for](control-flow/flow2-for-sol.ipynb)   
    3. [cicli while](control-flow/flow3-while-sol.ipynb)
    4. [challenge](control-flow/flow4-chal.ipynb)

1.  <p id="sequences">Sequenze ecomprehensions</p>

    1. [introduzione](sequences/sequences1-sol.ipynb)
    1. [challenge](sequences/sequences2-chal.ipynb)

1.  <p id="functions">Funzioni</p>

    1.  [introduzione](functions/functions1-sol.ipynb)
    1.  [challenge](functions/functions2-chal.ipynb)
    
1.  <p id="errors-and-testing">Gestione errori e testing</p>

    1. [Introduzione](errors-and-testing/errors-and-testing1-sol.ipynb)
    1. [challenge](errors-and-testing/errors-and-testing2-chal.ipynb)

1.  <p id="matrices-lists">Matrici - liste di liste</p>

    1.  [introduzione](matrices-lists/matrices-lists1-sol.ipynb)
    1.  [altri esercizi](matrices-lists/matrices-lists2-sol.ipynb)
    1.  [challenge](matrices-lists/matrices-lists3-chal.ipynb)

1.  <p id="matrices-numpy">Matrici - Numpy</p>

    1.  [introduzione](matrices-numpy/matrices-numpy1-sol.ipynb)
    1.  [challenge](matrices-numpy/matrices-numpy2-chal.ipynb)

### B - Analisi dati

1.  <p id="formats">Formati dei dati</p>

    1. [file a linee](formats/formats1-lines-sol.ipynb)
    1. [file CSV](formats/formats2-csv-sol.ipynb)
    1. [file JSON](formats/formats3-json-sol.ipynb)
    1. [challenge: personaggi storici del Trentino](formats/formats4-chal.ipynb)
    
1.  <p id="visualization">Visualizzazione dati</p>    
    
    1. [introduzione](visualization/visualization1-sol.ipynb): Plotting di grafici in Matplotlib, esporre dati online con DataWrapper, RawGraphs, UMap    
    1. [challenge](visualization/visualization2-chal.ipynb)
1. [Ricerca](search/regex-sol.ipynb)
    * Ricerca in dati testuali  usando espressioni regolari
    * es. fermate autobus trentino
1. [Integrazione dati](integration/integration-sol.ipynb)
    * Esempio di integrazione dati: scaricamento di un dataset opendata (agritur del Trentino)
    * pulizia e posizionamento dei punti di interesse su OpenStreetMap usando un servizio di georeferenziazione
1. [Estrazione Dati](extraction/extraction-sol.ipynb)
    * Estrazione di testo rilevante da una pagina HTML  usando BeautifulSoup
    * es. eventi del Trentino
1.  <p id="pandas">Analitiche con Pandas</p>

    1. [introduzione](pandas/pandas1-sol.ipynb): Analisi di dataset (filtraggio, statistiche) con la libreria Pandas
    1. [challenge](pandas/pandas2-chal.ipynb)    
    
1. [Information retrieval](information-retrieval/information-retrieval-sol.ipynb)
    * Ricerca per rilevanza
    * Ricerca per similarità

### C - Applicazioni 
 
1. [Interfacce utente](gui/gui-sol.ipynb)
    * Creazione di interfacce per analisi interattiva di dati con Jupyter Widgets
    * Discussione di alternative (QT, wxWidget)
2. [Integrazione con database](database/database-sol.ipynb)
    * Estrazione di dati da un database SQLite con Pandas
    * Esecuzione di semplici ricerche SQL   
3. [Web development](web/web-sol.ipynb)
    * Cenni sviluppo di un semplice server web

### D - Progetti

1. [Realizzare progetti](project-howto.ipynb)
    * ambienti virtuali
    * installazione librerie
2. [Scrittura testo in Markdown / Jupyter](project/markdown.ipynb)
3. [Idee per progetti](project-ideas.ipynb)
4. [Challenges](challenges.ipynb)

## Autori
 
**David Leoni** (autore principale): Software engineer specializzato in data integration e web semantico, ha realizzato applicazioni in ambito open data e medico in Italia e all'estero. Dal 2019 è presidente dell'associazione CoderDolomiti, con cui insieme a Marco Caresia gestisce il movimento di volontariato CoderDojo Trento dove da anni insegnano programmazione creativa ai ragazzi. <br/>
Email: [david.leoni@unitn.it](mailto:david.leoni@unitn.it) &ensp; Sito: [davidleoni.it](https://davidleoni.it)

**Marco Caresia** (assistente Edizione Autunno 2017 @DISI Università di Trento): E' stato docente di informatica presso la Scuola Professionale Einaudi di Bolzano. E' presidente della delegazione Trentino Alto Adige Südtirol dell’Associazione Italiana Formatori e vicepresidente dell'associazione CoderDolomiti.

**Alessio Zamboni** (assistente Edizione Marzo 2018 @Sociologia Università di Trento): Data scientist e software engineer con esperienza in NLP, GIS e gestione del knowledge. Ha collaborato in numerosi progetti di ricerca, collezionando esperienze in Europa e in Asia. Sostiene con convinzione che _"la programmazione è una forma d'arte"_ 

**Luca Bosotti** (assistente edizione Summerschool Data Science 2020 e seminari 2021 @Sociologia, Università di Trento): Developer, scientist e professore. Crede che il mondo stia diventando sempre più complicato e interessante. Perciò quello che dobbiamo fare è studiarlo e per farlo ci tocca sfruttare tutte le potenzialità ed il ragionamento possibile. Ha insegnato a giovani di tutte le età, dalle scuole elementari al livello universitario ed è sempre rimasto colpito da quanto siano differenti le persone che si approcciano alla programmazione.

**Massimiliano Luca** (docente Edizione Estate 2019 @Sociologia Università di Trento): Adora imparare nuove tecnologie ogni giorno. Particolarmente interessato in knowledge representation, data integration, data modeling e computational social science. Crede fermamente che sia vitale introdurre i giovani alla computer science, a tal fine è mentor al Coder Dojo DISI Master.

**Contributors:** Ringraziamo anche gli studenti Ludovico Maria Valenti e Ioana Doleanu per i miglioramenti alla pagina numpy e Stefano Moro per le numerose segnalazioni.

## Licenza

Questo sito è stato realizzato con stanziamenti dei dipartimenti di [Ingegneria e Scienze dell’Informazione (DISI)](https://www.disi.unitn.it), Sociologia e Matematica dell'Università di Trento.

![unitn-843724](_static/img/third-parties/disi-unitn-it-logo.jpeg)


![cc-by-7172829](_static/img/cc-by.png)

Tutto il materiale in questo sito è distribuito con licenza CC-BY 4.0 Internazionale [https://creativecommons.org/licenses/by/4.0/deed.it](https://creativecommons.org/licenses/by/4.0/deed.it) 

Si può quindi liberamente ridistribuire e modificare il contenuto, basta citare l'Università di Trento / DISI e [gli autori](index.ipynb#Autori) 

Note tecniche: tutte le pagine del sito sono fogli Jupyter facilmente modificabili - sono stati convertiti in pagine web tramite [NBSphinx](https://nbsphinx.readthedocs.io) usando il template [Jupman](https://github.com/DavidLeoni/jupman). I sorgenti del testo si trovano su Github all'indirizzo [https://github.com/DavidLeoni/softpython-it](https://github.com/DavidLeoni/softpython-it)

Se vi piace il contenuto del libro e volete contribuire esercizi / tutorial, vedere la pagina [CONTRIBUTING](CONTRIBUTING.md)


## Ringraziamenti

Ringraziamo in particolare il professor Alberto Montresor del Dipartimento di Informatica dell'Università di Trento per aver consentito la realizzazione dei corsi dai quali nasce questo materiale, e il progetto Trentino Open Data ([dati.trentino.it](https://dati.trentino.it)) per i numerosi dataset forniti. 

![dati-trentino-9327234823487](_static/img/third-parties/dati-trentino-small.png)

Gli altri numerosi enti ed aziende che nel tempo hanno contribuito materiale ed idee sono citati [in questa pagina](thanks.ipynb)