Mappa degli incidenti a RomaRome car accidents mapped with open data

Il Comune di Roma sta pubblicando sul web un insieme di dati rigurdanti il territorio. E' un'iniziativa per gli OPEN DATA (dati aperti), che permette ai cittadini di utilizzare i dati dell'amministrazione pubblica a scopi di informazione, ricerca, commercio.

Mi hanno incuriosito i dati sugli incidenti stradali, che ho trovato ben organizzati. Ho quindi immaginato una mappa interattiva per poterli visualizzare. Questo è il risultato:


(vedi a schermo intero)

La mappa presenta diversi limiti:
- riguarda solo il primo semestre del 2013.
- a ogni caricamento della mappa vengono visualizzati la metà dei punti, perchè in tutto sono più di 5000 e il browser "nun glie la fà".
- i puntini non sono nel punto esatto dell'incidente, ma nel punto che rappresenta una certa via secondo MapQuest. In più alcuni puntini segnalano vie in cui sono avvenuti decine di incidenti, altri ne segnalano pochi. Ad esempio lungo la via Tiburtina ci sono stati centinaia di incidenti, ma sono tutti riassunti da un puntino all'altezza della Stazione Tiburtina. Stesso discorso vale per tutte le direttive principali del traffico romano. Laddove i dati indicavano un'incrocio di una via minore con una via principale, ho messo un puntino sulla via minore.
- si possono colorare o ingrandire in modo diverso i puntini a seconda del numero di persone coinvolte, ferite o addirittura morte. Si poteva assegnare ad ogni puntino un pop-up con i dettagli degli incidenti (incluso il modello delle automobili coinvolte). Non me la sono sentita di pubblicare informazioni del genere su un blog. I dati originali sono qui e sono accessibili a tutti.

Per concludere: considero l'esperimento riuscito, una specie di SI PUO' FARE, ma per essere considerato un lavoro di qualità ci vuole molto più tempo (quindi soldi) e non posso sobbarcarmi di un carico del genere da volontario. Resto a disposizione di enti di ricerca (pubblici o privati) che siano interessati ad approfondire. Sono molto interessato a lavorare sugli OPEN DATA, prego il lettore interessato di contattarmi qui.

Qualche suggerimento per gli addetti ai lavori degli OPEN DATA:

- i dati dovrebbero essere il più possibile standardizzati. Ad esempio in molte tabelle compare la voce "indirizzo" ma è spesso scritto in modo differente a seconda del dataset. Dato che i record sono tantissimi, non è possibile aggiustarli a mano. Di standard per gli OPEN DATA ce ne sono e vengono da fonti più che autorevoli, quindi si possono utilizzare.

- i dati andrebbero raccolti in un unico database e forniti tramite una API. Al momento i dataset sono categorizzati e ordinati, ma isolati l'uno dall'altro in singoli file. Ad esempio gli incidenti stradali sono divisi in trimestri, metterli insieme vuol dire scaricare diversi file e unirli a mano. Se i dati stessero tutti in uno stesso database, i dataset verrebbero generati dinamicamente in base al periodo richiesto. Anche qui suggerisco soluzioni autorevoli.

- gli indirizzi dovrebbero essere il più possibile affiancati da coordinate (latitudine e longitudine). Senza le coordinate è difficile mappare i dati sul territorio in modo utile. I servizi di geocoding gratuiti sono imprecisi (riconoscono la via ma non il numero civico), mentre i servizi commerciali (es. google maps API) sono precisi ma costano. Tre soluzioni possibili sono: a) chiedere a chi raccoglie i dati di accendere il GPS del cellulare e scrivere, vicino agli indirizzi, anche le coordinate. b) stipulare una convenzione con i servizi di geocoding. 3) Aspettare che i servizi di geocoding gratuiti diventino più precisi.

Seguendo questi suggerimenti, un giorno sarà possibile chiedere al servizio (magari dal cellulare) informazioni come "quanti incidenti ci sono stati nelle ultime due settimane sotto casa mia?", oppure "quali libri di fantascienza posso trovare oggi nella biblioteca comunale più vicina?", oppure "che monumenti e ville posso visitare oggi pomeriggio nel mio quartiere?", eccetera. Tutto sta a mettere vicino alla parola OPEN anche la parola LINKED. Lo so che forse chiedo troppo per la situazione attuale politica e finanziaria, ma la mia parte l'ho fatta e spero che i suggerimenti siano presi nel modo più costruttivo (sia dal Municipio che dai privati interessati a valorizzare i dati).

Voglio sottolineare che questa degli OPEN DATA è un'iniziativa importantissima che può generare molta ricchezza, sia culturale che economica.

Oltre ad interessarmi di OPEN DATA mi occupo di intelligenza artificiale e data mining. Per conoscerci ed eventualmente collaborare scrivimi. :)

Il Comune di Roma sta pubblicando sul web un insieme di dati rigurdanti il territorio. E' un'iniziativa per gli OPEN DATA (dati aperti), che permette ai cittadini di utilizzare i dati dell'amministrazione pubblica a scopi di informazione, ricerca, commercio.

Mi hanno incuriosito i dati sugli incidenti stradali, che ho trovato molto ben organizzati. Ho quindi immaginato una mappa interattiva per poterli visualizzare. Questo è il risultato:

MAPPPAAAAAAAAAAAAAAAAAAAAAAAA

Mi piacerebbe dire che la mappa è completa, ma presenta diversi limiti:
- riguarda solo il periodo XXXXXX a XXXXXX
- a ogni caricamento della mappa vengono visualizzati UN TERZO dei punti, perchè in tutto sono più di 5000 e il browser "nun glie la fà".
- i puntini non sono nel punto esatto dell'incidente, ma nel punto che rappresenta una certa via secondo MapQuest. In più alcuni puntini segnalano vie in cui sono avvenuti decine di incidenti, altri ne segnalano pochi. Ad esempio lungo la via Tiburtina ci sono stati centinaia di incidenti, ma sono tutti riassunti da un puntino all'altezza della Stazione Tiburtina. Stesso discorso vale per tutte le direttive principali del traffico romano. Laddove i dati indicavano un'incrocio di una via minore con una via principale, ho messo un puntino sulla via minore.
- potevo colorare o ingrandire in modo diverso i puntini a seconda del numero di persone coinvolte, ferite o addirittura morte. Potevo assegnare ad ogni puntino un pop-up con i dettagli degli incidenti (incluso il modello delle automobili coinvolte). Non me la sono sentita di pubblicare informazioni del genere su un blog. I dati originali sono qui e sono accessibili a tutti.

Per concludere: considero l'esperimento riuscito, una specie di SI PUO' FARE, ma per essere considerato un lavoro di qualità ci vuole molto più tempo (quindi soldi) e non posso sobbarcarmi di un carico del genere da volontario. Resto a disposizione di enti di ricerca (pubblici o privati) che siano interessati ad approfondire. Sono anche interessato a lavorare sugli OPEN DATA per i privati. Prego il lettore interessato di contattarmi qui.

Qualche suggerimento per gli addetti ai lavori degli OPEN DATA:

- i dati dovrebbero essere il più possibile standardizzati. Ad esempio in molte tabelle compare la voce "indirizzo" ma è spesso scritto in modo differente a seconda del dataset. Dato che i record sono tantissimi, non è possibile aggiustarli a mano. Di standard per gli OPEN DATA ce ne sono e vengono da fonti più che autorevoli, quindi si possono utilizzare.

- i dati andrebbero raccolti in un unico database e forniti tramite una API. Al momento i dataset sono categorizzati e ordinati, ma isolati l'uno dall'altro in singoli file. Ad esempio gli incidenti stradali sono divisi in trimestri, metterli insieme vuol dire scaricare diversi file e unirli a mano. Se i dati stessero tutti in uno stesso database, i dataset verrebbero generati dinamicamente in base alle richieste. Anche qui suggerisco fonti autorevoli.

- gli indirizzi dovrebbero essere il più possibile affiancati da coordinate (latitudine e longitudine). Senza le coordinate è difficile mappare i dati sul territorio in modo utile. I servizi di geocoding gratuiti sono imprecisi (riconoscono la via ma non il numero civico) mentre i servizi commerciali (es. google maps API) sono precisi ma costano. Tre soluzioni possibili sono: a) chiedere a chi raccoglie i dati di accendere il GPS del cellulare e scrivere, vicino agli indirizzi, anche le coordinate. b) stipulare una convenzione con i servizi di geocoding. 3) Aspettare che i servizi di geocoding gratuiti diventino più precisi.

Seguendo questi suggerimenti, un giorno sarà possibile chiedere al servizio (magari dal cellulare) informazioni come "quanti incidenti ci sono stati nelle ultime due settimane sotto casa mia?", oppure "quali libri di fantascienza posso trovare oggi nella biblioteca comunale più vicina?", oppure "che monumenti e ville posso visitare oggi pomeriggio nel mio quartiere?", eccetera. Tutto sta a mettere vicino alla parola OPEN anche la parola LINKED. Lo so che forse chiedo troppo per la situazione attuale politica e finanziaria, ma la mia parte l'ho fatta e spero che i suggerimenti siano presi nel modo più costruttivo (se non al Municipio, perlomeno dai privati).

Voglio sottolineare che questa degli OPEN DATA è un'iniziativa importantissima che può generare molta ricchezza, sia culturale che economica.

Oltre ad interessarmi di OPEN DATA mi occupo di intelligenza artificiale e data mining. Per conoscerci ed eventualmente collaborare sono disponibile qui.

This entry was posted in Generale, Tecnologia and tagged , , , , , , , , , , , . Bookmark the permalink.
  • Candelaria 30/09/2016 at 19:06

    I'm really enjoying the theme/design of your
    web site. Do you ever run into any browser compatibility problems?
    A number of my blog audience have complained about my blog not operating
    correctly in Explorer but looks great in Chrome. Do you have any recommendations to help fix this problem?

    Thumb up 0

  • Micaela 28/09/2016 at 22:01

    Yooս are my aspiration , I oաn few web logs and
    occasionally run oout fгom to post .

    Thumb up 0

  • www.pirate.fluctis.com 27/09/2016 at 19:00

    Superb, what a web site it is! This weblog presents helpful facts to us, keep
    it up.

    Thumb up 0

  • write my paper for me 06/07/2015 at 15:52

    I believe what you published was very logical.
    But, think on this, suppose you added a little content?
    I ain't saying your information is not good.,
    however suppose you added a headline that makes people
    want more? I mean Mappa degli incidenti a RomaRome car
    accidents mapped with open data | Pieroit blog is a little boring.
    You should glance at Yahoo's front page and note how they write article titles to get viewers to click.
    You might add a related video or a related picture or
    two to grab readers excited about everything've got to say.
    Just my opinion, it would bring your posts a little bit more interesting.

    Thumb up 0

  • Car crashes in Rome | pieroit 28/05/2014 at 19:36

    […] raw addresses I had to convert them in numerical coordinates via the Mapquest API. More details in this blog post (in […]

    Thumb up 0