Abbiamo sviluppato un approccio integrato accoppiando un modello di trasporto chimico (CTM) con tecniche di machine learning (ML) per produrre campi di concentrazione giornaliera di NO2 e O3 ad alta risoluzione spaziale sull’Italia. Simulazioni di tre anni (2013-2015), con una risoluzione spaziale di 5 km, eseguite dal modello regionale di qualità dell’aria FARM  sono state utilizzate come predittori, insieme ad altri dati spazio-temporali, come popolazione, uso del suolo, superficie greenness e reti stradali, mediante algoritmo ML Random Forest (ML-RF) per produrre concentrazioni giornaliere a risoluzione maggiore (1 km) sul territorio nazionale. La valutazione dell’approccio integrato adottato si è basata sulle osservazioni di NO2 e O3 disponibili rispettivamente da 530 e 293 stazioni di monitoraggio in tutta Italia. Una buona prestazione per NO2 e ottimi risultati per O3 sono stati ottenuti dall’applicazione del CTM; per quanto riguarda l’NO2, i livelli nelle stazioni di traffico urbano non sono stati intercettati dalle simulazioni a causa della risoluzione orizzontale adottata e delle relative incertezze sulle emissioni. Sono stati ottenuti miglioramenti delle prestazioni con le previsioni ML-RF, riducendo la sottostima di NO2 (risultati di bias frazionari vicini allo zero) e catturando meglio i contrasti spaziali. I risultati ottenuti in questo lavoro sono stati utilizzati per supportare la valutazione dell’esposizione nazionale e gli studi di epidemiologia ambientale pianificati nel progetto BEEP (Big data in Environmental and occupational Epidemiology) e confermare il potenziale dei metodi di apprendimento automatico per prevedere adeguatamente i livelli di inquinanti atmosferici ad elevate risoluzioni spazio-temporali.

Spatial-temporal prediction of ambient nitrogen dioxide and ozone levels over Italy using a Random Forest model for population exposure assessment