CitAlien: Integrazione di dati di presenza da survey scientifici e da citizen science per la predizione del rischio di invasione da parte di specie di fauna invasiva

Referente: Dott. Mirko Di Febbraro

Obiettivi e attività

I dati di presenza delle specie raccolti da indagini opportunistiche come le iniziative di citizen science soffrono di alcuni bias fondamentali. Per questo motivo, si è proposto recentemente di integrare questi dati con quelli forniti da indagini strutturate e scientificamente valide, ancorché a scala spaziale più ridotta. Sorprendentemente, solo pochissimi tra gli studi più recenti che suggeriscono tale integrazione, hanno valutato il contributo che questo processo può offrire al campionamento efficace della nicchia ambientale delle specie ed al conseguente effetto sulle previsioni dei modelli di distribuzione su nuove aree/intervalli temporali. Il campionamento spesso incompleto delle preferenze ambientali delle specie, tipico delle indagini a piccola scala, introduce un problema di troncamento della nicchia ambientale che potrebbe influenzare le previsioni su scenari futuri di cambiamento globale. I metodi di integrazione dei dati rappresentano un approccio promettente per affrontare i problemi di troncamento della nicchia e migliorare la stima delle preferenze ambientali delle specie. Pertanto, è fondamentale esplorare il contributo dell’integrazione dei dati in termini di riduzione del troncamento della nicchia e di effetto sulla predizione degli impatti futuri del global change. Il progetto mira a confrontare la capacità dei dati scientifici e di citizen science, da soli ed in reciproca integrazione, di campionare la nicchia ambientale di un pool specie di invertebrati e vertebrati terrestri e dulciacquicoli altamente invasivi in Italia e, di conseguenza, di valutare le differenze nella previsione del rischio di invasione attuale e futuro in base agli scenari di global change. Il progetto sarà strutturato in tre obiettivi:

  1. calcolare la similarità di nicchia tra i dati scientifici e di citizen science e quantificare la percentuale di spazio ambientale guadagnato/perso quando tali fonti di dati vengono integrate;
  2. identificare le principali condizioni ambientali che differenziano le nicchie ambientali derivate da dati scientifici e di citizen science;
  3. modellare le distribuzioni attuali e al 2100 delle specie a partire da dati citizen science, scientifici e integrati, considerando scenari di cambiamento climatico, di uso del suolo e di densità umana.

Metodologie da utilizzare per il raggiungimento degli obiettivi e cronoprogramma delle attività

Il progetto prevedrà una prima fase di raccolta e preparazione di dati di presenza delle specie target e di un set di covariate ambientali necessarie alla calibrazione dei modelli di distribuzione. Siccome la calibrazione avverrà secondo un approccio integrato multiscala (globale e nazionale), sarà necessario raccogliere dati e covariate tanto a scala globale che a scala italiana. I record di occorrenza per la calibrazione dei modelli globali saranno raccolti dagli areali di distribuzione nativi ed invasivi, campionando in modo casuale i poligoni prodotti dalla IUCN per ciascuna specie. A questi, andranno aggiunti i dati dalle aree di invasione estratti dal database “Global Biodiversity Information Facility” (GBIF). Per quanto riguarda i modelli a scala nazionale, i dati scientifici saranno derivati da una serie di progetti di monitoraggio standardizzato estesi e pluriennali, mentre i dati di citizen science saranno forniti da organizzazioni nazionali e da piattaforme online come “iNaturalist”.

Riguardo le covariate per i modelli globali, saranno considerate le variabili bioclimatiche fornite nel database CHELSA, rasterizzate a 50 km di risoluzione spaziale. Per la calibrazione dei modelli nazionali, invece, si prenderanno in considerazione le medesime variabili CHELSA, insieme a variabili topografiche, di uso del suolo e di densità della popolazione umana, ma rasterizzate a una risoluzione spaziale di 1 km.

Metodologia Obiettivo i) – Le analisi di sovrapposizione delle nicchie ed i test randomizzati di similarità saranno impiegati per indagare le differenze nelle nicchie ambientali delle specie target stimate utilizzando i dati scientifici e di citizen science, da soli ed in integrazione. Ci si concentrerà in particolare sulle porzioni di nicchia non sovrapposte, ossia le regioni dello spazio ambientale rappresentate esclusivamente da una singola fonte di dati (“only-citizen niche”, “only-science niche” e “only-pooled niche”). La grande mole di dati geografici richiesti e l’elevato numero di repliche dirandomizzazione necessarie al calcolo della significatività statistica dei test di similarità giustifica la dotazione di una workstation ad elevate prestazioni.

Metodologia Obiettivo ii) – Le condizioni ambientali associate a queste regioni non sovrapposte saranno utilizzate per calibrare modelli di classificazione machine learning, onde valutare quali variabili ambientali contribuiscono maggiormente a differenziare le porzioni di nicchia non sovrapposte. Anche in questo caso, è richiesta la dotazione di una workstation ad elevate prestazioni per la calibrazione dei modelli di machine learning.

Metodologia Obiettivo iii) – I modelli di distribuzione a scala globale e nazionale per le specie target saranno realizzati a turno utilizzando dati scientifici, di citizen science ed integrati. Tali modelli saranno calibrati mediante un approccio di ensemble forecasting di molteplici algoritmi e proiettati sulle condizioni ambientali attuali e future (2100, considerando scenari di cambiamento climatico, di uso del suolo e di densità umana). Necessaria dotazione di una workstation ad elevate prestazioni per la calibrazione dei modelli di ensemble forecasting.

CRONOPROGRAMMA:

  • Raccolta dati: Febbraio 2023
  • Obiettivo 1: Marzo 2023
  • Obiettivo 2: Marzo-Aprile 2023
  • Obiettivo 3: Aprile 2023
  • Preparazione e sottomissione manoscritto: Aprile-Maggio 2023
  • Processo di revisione, ed eventuale finalizzazione (tempo stimato): Maggio-Dicembre 2023

Risultati attesi

Le analisi previste per il raggiungimento dell’Obiettivo 1 restituiranno i valori di sovrapposizione tra le nicchie ambientali derivate da dati scientifici e di citizen science per ciascuna specie target, così come le significatività dei relativi test statistici di similarità. Oltre a ciò, sarà possibile ricavare le percentuali di spazio ambientale multivariato che risulterà guadagnato/perso in seguito all’integrazione dei dati scientifici con quelli di citizen science. In tal modo, sarà possibile quantificare il contributo di questi ultimi alla migliore copertura e campionamento delle preferenze ambientali delle specie di interesse.

Gli output generati nell’ambito dell’Obiettivo 1 rappresenteranno gli input dell’Obiettivo 2. In particolare, dalle porzioni di nicchia non sovrapposte (“only-citizen niche”, “only-science niche” e “only-pooled niche”) si estrarranno i valori delle covariate associate, che saranno successivamente utilizzati per calibrare modelli di classificazione machine learning. Tale procedura analitica, quindi, fornirà i valori di accuratezza delle varie classificazioni, nonché il ranking delle covariate più importanti nel differenziare le porzioni di nicchia non sovrapposte. Alla fine di questo step analitico, i risultati consentiranno di valutare quali sono le caratteristiche ambientali meglio campionate dai dati citizen science rispetto a quelli scientifici, e quindi quanto può essere opportuna l’integrazione di queste due fonti di dati alternative.

Infine, le analisi previste per il raggiungimento dell’Obiettivo 3 forniranno i valori di accuratezza predittiva dei modelli di ensemble forecasting, così come le mappe di distribuzione potenziale delle specie target sia per l’attuale che per il 2100, secondo ciascuno scenario di cambiamento globale. Tali output consentiranno di valutare eventuali differenze nelle modificazioni del range di distribuzione (tra attuale e futuro) ottenute utilizzando per la modellazione i dati di citizen science, quelli scientifici e quelli integrati.