Descrizione
OBIETTIVI
Utilizzare Python per:
- analisi dei dati (report descrittivi, automazione task ripetitivi)
- visualizzazione (grafici automatici sui dati)
- modellistica (machine learning)
REQUISITI
Conoscenza della programmazione e conoscenza base del linguaggio Python
PROGRAMMA (16 ore)
- Introduzione
- Ecosistema Python per la data science
- Installazione di Python e dell’editor PyCharm
- Installazione notebook Jupyter
- Analisi dei dati
- La libreria pandas
- Caricamento / salvataggio file
- Statistiche descrittive
- Selezione
- Operazioni sulle colonne
- Map
- Raggruppamenti
- Tabelle pivot
- Join
- Visualizzazione dati
- La libreria seaborn
- Grafici a barre, linee, punti
- Grafici statistici (distribuzioni, box plot, violin plot)
- Grafici a griglia
- Machine learning
- Metodologia
- Preparazione dati
- Addestramento di un classificatore
- Esercitazioni
- Visualizzare e fare statistiche descrittive su un dataset a scelta
- Elaborare automaticamente un file Excel
MODALITA’
Il corso è orientato alla pratica, dopo una rapida presentazione teorica dei concetti si passa subito agli esercizi. Ogni partecipante dovrà avere a disposizione un computer. Dato che ogni persona ha i suoi ritmi di apprendimento, i partecipanti che avranno difficoltà saranno supportati nel completamento dell’esercizio, mentre quelli che riescono prima saranno invitati a realizzare delle variazioni.