In [1]:
import jupman
jupman.init()

# SoftPython

Guida introduttiva alla pulizia e analisi dati con Python 3

## News

**3 settembre 2018**: **sito completamente aggiornato in occasione della ICT Days Summercamp Challenge** <br/>[VEDI CHALLENGES](challenges.ipynb)

Attenzione: i seminari AA 2017 / 2018 sono stati archiviati. Trovate le informazioni relative ai seminari passati al seguente indirizzo: [softpython.readthedocs.io/it/2017-18](https://softpython.readthedocs.io/it/2017-18) 

**Vecchie news**: [link](old-news.ipynb)


## Presentazione

Al giorno d’oggi, sempre più decisioni vengono prese in base a dati fattuali e oggettivi. Tutte le discipline, dall’ingegneria alle scienze sociali, necessitano oramai capacità di elaborare dati ed estrarre informazioni utili dall’analisi di fonti eterogenee. Questo sito di esercizi pratici fornisce quindi un’introduzione al processamento dati usando [Python](http://www.python.it/), un linguaggio di programmazione popolare sia nell’industria che nell'ambito della ricerca. 

## A chi è rivolto 

Il materiale in questo sito è rivolto a persone che abbiano già qualche nozione base di programmazione e desiderino acquisire conoscenze pratiche riguardo l’estrazione, la pulizia, l’analisi e visualizzazione di dati (tra i framework Python usati vi saranno Pandas, Numpy e l’editor Jupyter). Per superare eventuali difficoltà e garantire risultati didattici concreti, le guide presentate sono passo-passo.


## Requisiti

Qualche conoscenza base di programmazione, in un qualsiasi linguaggio. Il corso e tutti i materiali proposti sono in lingua italiana.

## Contenuti

0. [Come orientarsi](intro.ipynb)
    * Approccio e obbiettivi
    * Materiali usati
1. [Introduzione a Python](exercises/intro/intro-solution.ipynb)
    * [Installazione](installation.ipynb)
    * Nozioni base su Python (sintassi, programmazione a oggetti)
    * Immissione comandi in Jupyter Notebook 
    * Condivisione script online
2. [Formati dei dati](exercises/formats/formats-solution.ipynb)
    * Presentazione di formati dati comuni (CSV, JSON, XML, file binari)
    * Convertire dati, trattare errori e dati mal-formattati 
    * es. impianti funiviari Trentino
3. [Visualizzazione dati](exercises/visualization/visualization-solution.ipynb)
    * Plotting di grafici in Matplotlib.
    * Esporre dati online con DataWrapper, RawGraphs, UMap
4. [Ricerca](exercises/search/regex-solution.ipynb)
    * Ricerca in dati testuali  usando espressioni regolari
    * es. fermate autobus trentino
5. [Integrazione dati](exercises/integration/integration-solution.ipynb)
    * Esempio di integrazione dati: scaricamento di un dataset opendata (agritur del Trentino)
    * pulizia e posizionamento dei punti di interesse su OpenStreetMap usando un servizio di georeferenziazione
6. [Estrazione Dati](exercises/extraction/extraction-solution.ipynb)
    * Estrazione di testo rilevante da una pagina HTML  usando BeautifulSoup
    * es. eventi del Trentino
7. [Analitiche sui dati](exercises/analytics/analytics-solution.ipynb)
    * Analisi di un dataset contenente dati numerici con la libreria Pandas (es. statistiche sensori stazione spaziale)
    * Calcolo di correlazioni tra fattori (es. meteo trentino) 
8. [Applicazioni interattive](exercises/interactive/interactive-solution.ipynb)
    * Creazione di interfacce per analisi interattiva di dati con Jupyter Widgets
    * Discussione di alternative (QT, wxWidget)
9. [Integrazione con database](exercises/database/database-solution.ipynb)
    * Estrazione di dati da un database SQLite con Pandas
    * Esecuzione di semplici ricerche SQL
10. [Information retrieval](exercises/information-retrieval/information-retrieval-solution.ipynb)
    * Ricerca per rilevanza
    * Ricerca per similarità
11. [Web development](exercises/web/web-solution.ipynb)
    * Cenni sviluppo di un semplice server web
12. [Realizzare progetti](project-howto.ipynb)
    * ambienti virtuali
    * installazione librerie
    * [Scrittura testo in Markdown / Jupyter](jm-templates/project-NAME-SURNAME-ID/markdown.ipynb)
    * [Idee per progetti](project-ideas.ipynb)
13. [Challenges](challenges.ipynb)

## Ricevimento

Potete organizzare un ricevimento mandando email a [david.leoni@unitn.it](mailto:david.leoni@unitn.it), per sapere dove potete trovarmi [guardate qui](http://davidleoni.it/office-hours/).



## Questionario gradimento

Si invitano gli studenti che abbiano frequentato qualche edizione di questo corso o usato il materiale online a riempire [questo questionario](https://docs.google.com/forms/d/e/1FAIpQLScaADMBtD2evT_NMo1lhCunj3q5QhnMgfTuiQaD1SaPsY0vmQ/viewform). Il questionario è completamente anonimo e consiste di una sola domanda, i propri commenti. 

## Forum del corso

E' disponibile un [Google group](https://groups.google.com/forum/#!forum/softpython-it) del materiale.

Si può postare sul gruppo per :

- domande riguardo il materiale che possono essere di interesse generale
- condividere del materiale utile che avete trovato per affrontare certi argomenti
- commenti vari

## Autori
 
**David Leoni** (titolare): Software engineer specializzato in data integration e web semantico, ha realizzato applicazioni in ambito open data e medico in Italia e all'estero. Insieme a Marco Caresia gestisce l'associazione di volontariato CoderDojo Trento dove da anni insegnano programmazione creativa ai ragazzi.<br/>
Email: [david.leoni@unitn.it](mailto:david.leoni@unitn.it) &ensp; Sito: [davidleoni.it](http://davidleoni.it)


**Marco Caresia** (assistente Edizione Autunno 2017 @DISI Università di Trento): E' stato docente di informatica presso la Scuola Professionale Einaudi di Bolzano. Dal 2016 è presidente dell'associazione CoderDolomiti e della delegazione Trentino Alto Adige Südtirol dell’Associazione Italiana Formatori.

**Alessio Zamboni** (assistente Edizione Marzo 2018 @Sociologia Università di Trento): Data scientist e software engineer con esperienza in NLP, GIS e gestione del knowledge. Ha collaborato in numerosi progetti di ricerca, collezionando esperienze in Europa e in Asia. Sostiene con convinzione che _"la programmazione è una forma d'arte"_ 


## Licenza

![](img/cc-by.png)

Tutto il materiale in questo sito è distribuito con licenza CC-BY 4.0 Internazionale [https://creativecommons.org/licenses/by/4.0/deed.it](https://creativecommons.org/licenses/by/4.0/deed.it) 

Si può quindi liberamente ridistribuire e modificare il contenuto, basta citare [gli autori](home.ipynb#Autori)

Tutte le pagine del sito sono fogli Jupyter facilmente modificabili - sono stati convertiti in pagine web tramite [NBSphinx](https://nbsphinx.readthedocs.io) usando il template [Jupman](https://github.com/DavidLeoni/jupman). I sorgenti del testo si trovano su Github all'indirizzo [https://github.com/DavidLeoni/softpython](https://github.com/DavidLeoni/softpython)



## Ringraziamenti


Questo sito è stato realizzato con stanziamenti del [Dipartimento di Ingegneria e Scienze dell’Informazione (DISI)](https://www.disi.unitn.it) dell'Università di Trento

![](img/third-parties/logo-disi-unitn-it.jpeg)


**Ringraziamo inoltre:**

Il professor [Alberto Montresor](http://cricca.disi.unitn.it/montresor/) per aver consentito la realizzazione dei materiale nei seminari 2017/18

![](img/third-parties/ictdays-summercamp-2018-small.png)&emsp; Il [Dipartimento di Ingegneria e Scienze dell’Informazione (DISI)](https://www.disi.unitn.it) dell'Università di Trento, [Hub Innovazione Trentino HIT](https://www.trentinoinnovation.eu) e la rete STAAR per aver consentito la realizzazione della challenge [ICTDays Summercamp 2018](https://webmagazine.unitn.it/evento/disi/39864/ict-days-summer-camp) per ragazzi delle superiori, che hanno usato il materiale del sito per affrontare diverse [sfide di Data Science](challenges.ipynb)

![](img/third-parties/dati-trentino-small.png)&emsp; [dati.trentino.it](http://dati.trentino.it) per i dati da elaborare, e l'assistenza di Francesca Gleria e Marco Combetto che hanno anche promosso la [challenge Turismo 3.0](https://softpython.readthedocs.io/it/latest/challenges/turismo-3.0/turismo-3.0-challenge.html)

![](img/third-parties/spaziodati-small.png)&emsp; [SpazioDati](http://spaziodati.eu) nelle persone di Nicola Sambin e Alessio Guerrieri per aver promosso la challenge [Business Oriented](challenges/business-oriented/business-oriented-challenge.ipynb) fornendo i dati sulle imprese con il servizio [Atoka.io](http://atoka.io), e l'accesso ai servizi semantici di [Dandelion](http://dandelion.eu)

![](img/third-parties/u-hopper-thinkin-small.png)&emsp; [U-Hopper](https://u-hopper.com/) / [Thinkin](https://thinkin.io/) e Daniele Miorandi per aver promosso la [challenge sui Mondiali Russia 2018](challenges/mondiali-russia-2018/mondiali-russia-2018-challenge.ipynb)

![](img/third-parties/esa-raspberrypi.png) &emsp; La Raspberry Pi Foundation e l'European Space Agency per il concorso Astropi e i dati usati nel [tutorial Analytics](exercises/analytics/analytics-solution.ipynb)

![](img/third-parties/coderdojotrento-small.png)&emsp; Autoreferenzialmente citiamo anche [CoderDojo Trento](http://coderdojotrento.it) per i tutorial su HTML & UMap !