Sistema di acquisizione ed elaborazione dati

Hardware
Presso il Dipartimento CRS è installato il sistema di acquisizione principale dedicato al progetto Edison. Per realizzarlo è stato utilizzato come hardware un server Apple Mac Pro (Figura 1a), con le seguenti caratteristiche:

  • Due processori Intel Xeon Quadcore in architettura SMP operanti a 2,4Ghz per un totale di 8 core di elaborazione;
  • 16 Gb di memoria RAM DD3 ECC;
  • Spazio locale di archiviazione su dischi Sata per 1TB;
  • Sistema operativo MacOSX 10.6 Server.

Lo spazio di archiviazione locale interno al server è utilizzato come buffer locale di memorizzazione per il sistema di acquisizione. I dati acquisiti in tempo reale vengono poi archiviati giornalmente sulla struttura esterna ad alta affidabilità dell’archivio OASIS (http://oasis.crs.inogs.it).
E’ stato installato inoltre un sistema di acquisizione secondario, predisposto a scopo di ridondanza, presso la sede OGS di Trieste, ma anche per usufruire del vantaggio di un accesso a internet separato rispetto a quello di Udine. Il sistema secondario mantiene copia del software di acquisizione, di elaborazione e del buffer dati. Le caratteristiche hardware sono le seguenti:

  • Apple Mac mini Server (Figura 1b);
  • Processore Intel Core 2 Due operante a 2m66Ghz;
  • 8Gb di RAM DDR3;
  • Spazio locale di archiviazione su dischi sata per 500GB;
  • Sistema Operativo MacOSX 10.6 Server.


Figura 1 – I server di acquisizione ed elaborazione installati per la rete di Collalto.
Figura 1 – I server di acquisizione ed elaborazione installati per la rete di Collalto. a) Apple Mac Pro; b) Apple Mac mini Server.

Una volta acquisiti, i dati grezzi delle stazioni di monitoraggio vengono convertiti nel formato miniseed per essere poi elaborati e analizzati. L’ultima fase della catena di operazioni è l’archiviazione stabile a cadenza giornaliera, dove il dato convertito viene copiato all’interno dell’infrastruttura centrale di dipartimento utilizzata per l’accesso e l’archiviazione delle forme d’onda. Da questo momento il dato verrà conservato in modo permanente e sicuro, e sarà accessibile via web. Questo sistema di archiviazione si chiama OASIS (http://oasis.crs.inogs.it/) ed è una struttura permanente del Dipartimento CRS dell’OGS. Esso consiste di una componente di elaborazione e di una componente di archiviazione (Fig. 2), entrambe replicate nelle due sedi OGS di Trieste e di Udine.

La componente di elaborazione si basa su due macchine virtuali, costruite su due server fisici ridondanti e assegnate rispettivamente alla gestione dell’area di archiviazione (dal punto di vista filesystem e gestione del dato) e alla gestione delle modalità di accesso e consultazione attraverso un’applicazione web.

La componente di archiviazione si basa invece su un sistema di storage basato su tray Sun-Oracle Storagetek 6140, con array di dischi configurati in Raid6, per garantire un buon rapporto sicurezza/prestazioni, ed è in grado di immagazzinare, al netto della ridondanza e dell’overhead di filesystem, circa 10TB di dati utili. Per le finalità di archiviazione dei dati della rete di Collalto, il sistema OASIS è stato integrato con un ulteriore array di dischi fino al raggiungimento della massima capienza. Stimando la quantità dei dati prodotti dalla rete in circa 500 GB/anno, la parte del sistema OASIS dedicata alla rete di Collalto sarà sufficiente ad archiviare dati per circa 4-5 anni.

Figura 2 – Il server di gestione e storage del sistema di archiviazione OASIS dell’OGS.
Figura 2 – Il server di (a) gestione e (b) storage del sistema di archiviazione OASIS dell’OGS.

Software
Passiamo ora alla descrizione della configurazione del sistema di acquisizione. Le stazioni sono configurate per registrare i dati in forma continua con il formato proprietario Guralp Compress Format (GCF) e simultaneamente scrivere in formato MiniSEED. I formati SEED e MiniSEED sono i formati sviluppati per lo United State Geological Survey (USGS) e rappresentano uno standard internazionale per lo scambio di dati sismologici digitali. Questi formati sono stati adottati come standard dalla FDSN. Il formato SEED contiene tutte le informazioni (metadati) necessarie per identificare la stazione, gli strumenti e per correggere i dati dalle risposte strumentali. Il formato MiniSEED è una forma ridotta del formato SEED, e contiene solo i dati di forma d’onda. E’ un formato molto adatto per dati continui e per archiviare una grande mole di dati.

Gli acquisitori sono stati configurati in modo da campionare il segnale a 200 Hz, frequenza che si ritiene adatta per monitorare la microsismicità naturale e indotta. Si rammenta che le reti sismologiche usualmente campionano il segnale a circa 100 Hz.

Il server della rete di Collalto è un computer adatto a gestire tutto il carico di lavoro di acquisizione e prima elaborazione in real-time dei dati. Per il collegamento e l’archiviazione dei dati in tempo reale si utilizza il protocollo SeedLink, che permette di stabilire una comunicazione robusta tra il server di acquisizione e le stazioni. La parte principale del sistema è un server virtuale, chiamato Ring Server (Figura 3), che permette di inserire i dati in arrivo all’interno di una memoria “circolare” (ring buffer), recuperare e correggere dati eventualmente mancanti e di controllare che tutte le operazioni di dialogo tra server e clients avvengano in modo rapido e corretto. Una volta entrati nel ring buffer e validati, i dati vengono archiviati sul disco rigido del server in files MiniSEED con lunghezza voluta (es. giornalieri).

Il software di elaborazione dei dati sismologici è EarthWorm. Questo è un software Open Source ed è strutturato in una serie di moduli che gestiscono tutte le funzionalità necessarie all’elaborazione dei dati sismologici acquisiti da una rete. Il modulo slink2EW realizza il collegamento tra il RingServer e EarthWorm. Lo schema dell’intero sistema e le funzionalità di EarthWorm sono rappresentati in Figura 4.

Figura 3a - Schema del sistema di acquisizione dei dati sismologici.(a)

Figura 3b – Schema del sistema di elaborazione EarthWorm.(b)
Figura 3 – (a) Schema del sistema di acquisizione dei dati sismologici. (b) Schema del sistema di elaborazione EarthWorm.

Il sistema EarthWorm è utilizzato per effettuare numerose le operazioni di elaborazioni in real time o off-line. Attualmente sono in fase di sviluppo una serie di funzioni di elaborazione e restituzione grafica dei dati acquisiti. Questa fase di sviluppo proseguirà sicuramente durante tutto il primo anno della fase di gestione. Mostreremo alcuni esempi preliminari di funzioni realizzate di seguito.
La Figura 4 mostra la risposta strumentale del sensore broad-band della stazione ED06. La risposta è definita nel dominio delle frequenze ed è l‘elemento fondamentale per calcolare il moto vero del suolo partendo dal segnale registrato dallo strumento.

Figura 4 – Risposta strumentale in ampiezza (rosso) e fase (blu) della stazione ED06.
Figura 4 – Risposta strumentale in ampiezza (rosso) e fase (blu) della stazione ED06.

A titolo di esempio, la Figura 5 mostra la registrazione dei due terremoti avvenuti in località Farra di Soligo, a circa 20 km dalla stazione ED06, in data 13/9/2011 (rispettivamente ML 3.7 alle ore 18:35 UTC e ML 3.3 alle ore 18:46 UTC). La qualità dei dati è ottima e si può notare l’eccezionale coerenza del segnale tra i vari siti. Queste immagini sono ottenute con il software Swarm, un programma distribuito liberamente che si collega ai database di Earthworm e consente di visualizzare i segnali registrati dalla rete in tempo reale e fare su di essi una serie di operazioni.

Figura 5a – Registrazione del terremoto avvenuto in località Farra di Soligo in data 13/09/2011 alle ore 18:35 (ML 3.7)

Figura 5b – Registrazione del terremoto avvenuto in località Farra di Soligo in data 13/09/2011 alle ore 18:46 (ML 3.3)
Figura 5 – Registrazione dei due terremoti avvenuti in località Farra di Soligo in data 13/09/2011 rispettivamente alle ore 18:35 (ML 3.7, in alto) e 18:46 (ML 3.3, in basso) da parte del primo nucleo di 5 stazioni della Rete di Collalto. Eccetto che per la stazione ED06 i nomi delle stazioni erano all’epoca dell’evento ancora provvisori. La figura mostra anche le registrazioni effettuate dalle 3 stazioni della rete permanente dell’OGS, rispettivamente CGRP, MTLO e VARN.