Descrizione
OBIETTIVI
Comprendere i concetti di base e la metodologia
Comprendere gli algoritmi principali
Fare pratica sui concetti appresi con librerie python open source
Impostare il lavoro con i propri dati
REQUISITI
Conoscenza della programmazione e conoscenza base del linguaggio python
(la matematica strettamente necessaria sarà ripassata durante il corso)
PROGRAMMA (16 ore)
- Introduzione
- Cosa è il machine learning
- Esempi di applicazioni
- Vantaggi e svantaggi di queste tecniche
- Librerie open source a disposizione
- Metodologia
- Esempio Hello World
- Raccolta e preparazione dati
- Costruzione modello
- Validazione
- Analisi dell’errore
- Preparazione dati
- Gestire i valori mancanti
- Scalare le variabili numeriche
- Vettorizzare le categorie
- Vettorizzare i testi
- La maledizione della dimensionalità
- Gli algoritmi più utilizzati
- Supervisionati
- Dummy
- kNN
- Albero di decisione
- Regressione lineare
- Regressione logistica
- Classificatore bayesiano
- Non supervisionati
- K-means
- Analisi delle componenti principali
- Supervisionati
MODALITA’
Il corso è orientato alla pratica, dopo una rapida presentazione teorica dei concetti si passa subito agli esercizi. Ogni partecipante dovrà avere a disposizione un computer. Dato che ogni persona ha i suoi ritmi di apprendimento, i partecipanti che avranno difficoltà saranno supportati nel completamento dell’esercizio, mentre quelli che riescono prima saranno invitati a realizzare delle variazioni.