Astronomia e big data, gli esperti ci portano fra le stelle!

Avatar di Antonio D'Isanto

a cura di Antonio D'Isanto

Questo contenuto è pubblicato in italiano nella prima pagina e in inglese nella seconda pagina, a beneficio degli organizzatori della conferenza Astroinformatics e degli scienziati intervistati, che ringraziamo per la gentile disponibilità.

Un paio d'anni fa abbiamo già avuto l'opportunità di discutere della conferenza Astroinformatics. Come dice il nome stesso, si tratta di un convegno internazionale dedicato a questa nuova scienza, l'astroinformatica per l'appunto, che negli ultimi anni sta rivoluzionando la ricerca in campo astronomico, e non solo.

Infatti, noi astronomi abbiamo oggi giorno un grosso problema: la quantità di dati disponibili sta letteralmente esplodendo, grazie ai nuovi strumenti, quali la nuova generazione di telescopi, i nuovi rivelatori e le sonde automatiche. Il trattamento e l'analisi di questi dati richiede l'utilizzo di nuove tecniche, basate su un utilizzo intensivo del machine learning, dell'intelligenza artificiale, della realtà virtuale e di altre tecnologie innovative. Da un certo punto di vista, si sta completamente ribaltando il modo in cui, tradizionalmente, veniva compiuta la ricerca in astronomia: non più raccogliere dati al fine di provare una certa ipotesi, quanto piuttosto "scavare" nei dati già disponibili per trovare leggi e correlazioni precedentemente ignote.

40808582 455748228252988 3000337206637232128 o

Grazie all'astroinformatica, si sta dipanando un nuovo mondo di possibili scoperte, che coinvolge tutti i campi alla frontiera dell'astronomia, dai pianeti extrasolari alle onde gravitazionali, passando per studi riguardanti l'Universo primordiale, la formazione ed evoluzione delle galassie e così via. In alcuni articoli recenti, ad esempio, abbiamo già avuto modo di discutere circa le scoperte effettuate utilizzando i dati delle missioni Gaia e Kepler, a proposito degli esopianeti.

Tornando alla conferenza, ogni anno viene ospitata in una città differente, e questa volta abbiamo avuto l'onore e l'onere di organizzarla proprio qui ad Heidelberg, presso l'istituto dove lavoro attualmente, l'Heidelberg Institute for Theoretical Studies (HITS).

modello astratto di rete neurale

Modello astratto di rete neurale. Foto: © 100502500 / Depositphotos

Al di là della fatica e dello stress che l'organizzazione di un simile evento comporta, si è trattato davvero di un'esperienza fantastica, e ora vorrei raccontarvi qualcosa di più a riguardo, attraverso le parole di alcuni dei protagonisti. Infatti, ho colto l'occasione per intervistare tre ricercatori, molto differenti tra loro per ruolo e carriera, così da permettervi di vedere, in un certo senso, la conferenza "dall'interno", attraverso le loro sensazioni e il racconto del loro lavoro riguardo l'astroinformatica e l'astronomia.

La prima ricercatrice si chiama Dalya Baron, da Israele. Si tratta di una scienziata molto giovane ma di grande talento, alla sua seconda partecipazione all'Astroinformatics. Il secondo ricercatore invece è George Djorgovski, dagli Stati Uniti, uno dei padri fondatori dell'astroinformatica, oltre che tra i maggiori esperti del settore. Infine, l'ultimo intervistato è Kai Polsterer, dalla Germania. Kai è il leader di uno dei pochi gruppi al mondo esplicitamente dedicati all'astroinformatica e principale organizzatore della conferenza di quest'anno. Oltretutto è il mio supervisore, cosa che mi rende piuttosto coinvolto emotivamente con la sua intervista.

Direi perciò di fermarci qui con le chiacchiere e lasciare spazio a ciò che gli scienziati hanno da dire!

Interviste

Potresti riassumerci in poche parole il ruolo dell'astroinformatica rispetto all'astronomia tradizionale? Perchè pensi che questo settore di ricerca sia importante?

dalya JPGDalya: Considero l'astroinformatica come un mezzo per trasportare l'informazione, i metodi e i modelli propri di altri campi, quali l'informatica e la statistica, in astronomia. Credo inoltre che in futuro l'astroinformatica diverrà, in un certo senso, l'astromia. La quantità e la complessità dei dati sta diventando troppo grande e tutti noi avremo bisogno di diventare esperti di astroinformatica, perché senza questi strumenti non saremo più in grado di fare scienza.

george JPGGeorge: L'astronomia, come tutti gli altri campi della ricerca scientifica, sta subendo una trasformazione dovuta alla valanga dei Big Data, e noi necessitiamo di strumenti per estrarre conoscenza da questi dati. L'astroinformatica in fondo è tutta qui. Lo scopo ultimo è semplicemente quello di aiutare gli astronomi ad estrarre conoscenza dalla mole di dati complessi in nostro possesso.

kai JPGKai: Come in tutte le scienze, la forza motrice dell'astronomia è sempre nell'osservazione e nei dati. Le teorie sono collegate a ciò che si osserva, ma il caso dell'astronomia è più complicato, poiché noi non possiamo andare in laboratorio e fare esperimenti. In ogni caso, l'astronomia si è sviluppata notevolmente grazie ai computer, e oggi siamo in gradi di controllare automaticamente i telescopi, realizzare rivelatori più efficienti dotati di sistemi di ottiche adattive, e così via. Ciò ha reso possibile ottenere dati sempre più rapidamente, a un ritmo tale, governato dalla legge di Moore, che la loro quantità e la complessità sta aumentando tremendamente. L'astroinformatica è un modo per gestire questa complessità, ben al di là della mera applicazione di tecniche di machine learning o di visualizzazione. In effetti essa si occupa di tutte quelle situazioni in cui non è possibile analizzare i dati con tecniche tradizionali e che richiedono pertanto l'utilizzo di nuove e sofisticate tecnologie. L'astroinformatica perciò è alla frontiera di questo sviluppo. Noi siamo coloro ai quali si richiede di trovare nuove relazioni, nuove idee e metodi per gestire questa valanga di dati.

very large telescope eso

Very Large Telescope. Crediti: ESO/H.H.Heyer

La serie di conferenze Astroinformatics va ormai avanti da alcuni anni, si è partiti da una piccola comunità e oggi è cresciuta mettendo insieme competenze provenienti da diversi settori, non soltanto legati all'astronomia. Come pensi evolverà ulteriormente l'Astroinformatics, in quanto conferenza, in futuro?

dalya JPGDalya: Questa è soltanto la mia seconda partecipazione all'Astroinformatics e inoltre mi occupo di astrofisica solo da pochi anni, ma posso già percepire un cambiamento. Guardando, ad esempio, le pubblicazioni in uscita su arXiv e che trattano di machine learning o di metodi statistici, posso notare immediatamente un interesse crescente, poiché è sempre più difficile fare le cose secondo la maniera tradizionale. Credo che questa comunità diventerà sempre più grande, attirando persone da settori differenti e trovando una base comune sulla quale lavorare. Inoltre, mi aspetto che nel giro di pochi anni l'astroinformatica diverrà un corso di laurea specifico, poiché diverrà estremamente importante insegnare agli studenti come lavorare con questi strumenti, allo stesso modo in cui oggi insegniamo loro come usare i telescopi.

george JPGGeorge: Sempre più persone stato acquisendo consapevolezza riguardo la necessità di acquisire questo tipo di competenze e la capacità di utilizzare tali strumenti. C'è un interesse sempre crescente nella comunità scientifica, per cui mi aspetto che la partecipazione a questa conferenza non farà che aumentare, e che eventualmente ne verranno organizzate di nuove.

kai JPGKai: La questione non è tanto ciò che io mi aspetto, ma più che altro ciò che vorrei. Devo dire che in astronomia ci sono molti aspetti positivi rispetto ad altre scienze naturali. Abbiamo buoni standard e un modo equo di condivisione dei dati. Non dobbiamo aver a che fare più di tanto con problematiche dovute a dati proprietari, e così via. Ciò che vorrei, tuttavia, è che la conferenza Astroinformatics consentisse maggiormente di avviare collaborazioni con altri campi di ricerca. Vorrei veder crescere una giovane comunità più aperta all'uso delle nuove tecnologie, desiderosa di provare cose nuove e non legate soltanto ai vecchi standard e alle metodologie tradizionali. Per questo, durante la conferenza di quest'anno, ho voluto organizzare un hackathon, in modo da invogliare le persone a provare nuove cose, tutti insieme, a pensare e sviluppare nuove idee.

Quali sono i tuoi principali ambiti di ricerca?

buco nero

Buco nero Foto: © sdecoret / Depositphotos

dalya JPGDalya: Personalmente mi vedo come nel mezzo tra due differenti campi. Sono molto interessato allo studio dei buchi neri supermassicci nel centro delle galassie. Mi interessa capire come questi influenzino le galassie stesse, come crescono e assorbono massa e come questi processi influenzino il gas e l'attività di formazione stellare. L'altra parte della mia ricerca invece è dedicata al machine learning, e in particolare all'addestramento non supervisionato. Desidero comprendere come possiamo fare scienza con questi algoritmi e se essi sono in grado di insegnarci cose che noi non riusciamo vedere, in quanto esseri umani. Ovviamente, la cosa più interessante per me è cercare di connettere questi due settori, e vedere se questi modelli possono insegnarmi qualcosa sui buchi neri supermassici e sulle galassie, senza che io debba intervenire nei processi in atto all'interno della macchina.

george JPGGeorge: Trascorro il mio tempo dividendomi tra astronomia, Big Data, astroinformatica e data science più in generale. Inoltre collaboro con biologi e geofisici, o con persone provenienti ancora da altri settori.

kai JPGKai: Sicuramente l'astroinformatica (ride). È difficile da ride, sono sempre spinto dalla curiosità. Voglio capire e scoprire nuove cose. I miei interessi di ricerca spaziano da nuove metodologie per visualizzare dati all'analisi automatizzata per mezzo del machine learning. Sono anche interessato a problemi concernenti la conservazione dei dati, ad un accesso efficiente ai cataloghi, inclusa la gestione di incertezze a livello di database. In effetti non ho domande o interessi specifici sulle grandi questioni, ma sono più che altro interessato a sviluppare modelli che possano aiutare a dare risposte a queste questioni. Ovviamente anche a me interessano i processi di formazione nell'Universo primordiale, la comprensione della materia oscura e altre grandi incognite dal punto di vista cosmologico. Per questi, ad esempio, sono sempre stato interessato al problema dei redshift fotometrici, poiché ritengo che siano uno strumento essenziale per poter lavorare su questi grandi temi.

Cosa rende il tuo lavoro differente rispetto a quello di altri?

dalya JPGDalya: Se penso a me stessa e a quello che molte altre persone qui alla conferenza fanno, mi rendo conto che dobbiamo lavorare molto per convincere esperti di entrambi i campi, astronomia e informatica, che stiamo effettivamente facendo un buon lavoro. Gli astronomi a volte ci guardano con sospetto, e in fondo è anche giusto, perché se lavori con strumenti che diventano una sorta di scatole nere, gli scienziati non ti crederanno. Per questo, dobbiamo fare in modo che si fidino di noi e dei nostri modelli. D'altra parte, la comunità informatica pretende un trattamento rigoroso di dati e modelli da parte nostra. Ciò che facciamo perciò è prendere entrambi questi aspetti e integrarli per sviluppare una nuova scienza. È per questo che sento sempre il bisogno di imparare molto di più da entrambi i settori, al fine di poter sviluppare qualcosa di sensato. Così ogni giorno per me è diverso, a volte sono più un informatico, a volte un fisico, e devo dire che questo è divertente e stimolante.

george JPGGeorge: Penso di essere uno di quelli maggiormente convinti del fatto che siamo sulla strada giusta. Credo sia necessario utilizzare tecnologie come il machine learning, l'intelligenza artificiale, la realtà virtuale e quant'altro possiamo siamo in grado di prendere dall'informatica e dall'ingegneria, allo scopo di trovare cose nuove nei dati astronomici. In effetti questo è un problema generale, e non solo limitato all'astronomia, per cui ciò che noi facciamo è sviluppare metodologie scientifiche adatte al 21esimo secolo. In questo senso, la mia motivazione principale sta nel comprendere come l'informatica sta cambiando il nostro modo di fare scienza, insieme a tutto il resto.

kai JPGKai: Cerco di non essere troppo prevenuto (N.d.A la traduzione qui non può essere letterale; usa il termine biased, che suonerebbe più come "non affetto da errori sistematici e/o effetti di selezione"). Spesso ci capita di sbagliare provando nuove idee. Io accetto questo rischio pur di provare qualcosa che nessuno ha mai provato prima, sperando di scoprire nuovi metodi e nuove vie. Questo è ciò che rende il nostro lavoro diverso. Troppo spesso le persone cercano di ottenere un piccolissimo miglioramento nella precisione con cui un certo parametro è calcolato. Certo, anche questo è importante, ma io sono interessato a qualcosa di più, come trovare nuove metodologie e nuovi standard che infrangano completamente i precedenti. Questo, come ho già detto, comporta fallimenti costanti e, a volte, provare anche idee apparentemente stupide. Poi magari accade che quelle idee alla fine si rivelino essere meno stupide di quanto non sembrassero inizialmente. È divertente ed è ciò che più mi piace della ricerca.

Negli ultimi anni ci sono state molte importanti scoperte in campo astronomico. Quale ti ha esaltato maggiormente e perchè?

dalya JPGDalya: Penso che molti nella comunità scientifica siano d'accordo nel dire che l'osservazione delle onde gravitazionali da parte di LIGO sia la più esaltante. Al di là del fatto che costituisce l'ennesima prova della teoria della relatività generale, ci dà la possibilità di esplorare uno spazio dei parametri completamente nuovo. Potremmo dire che è come sviluppare un senso completamente nuovo con cui guardare l'Universo, attraverso il quale possiamo davvero "sentire l'Universo". Questo ci consentirà di vedere cose completamente differenti e nuove, un po' come accaduto con i neutrini o l'astronomia gamma. Personalmente credo che lo stesso accadrà con LIGO e spero davvero che potremo presto cominciare a trovare classi completamente nuove di fenomeni.

george JPGGeorge: Credo che le data release di Gaia e tutti i risultati scientifici che ne conseguono siano spettacolari. Si tratta davvero di un balzo qualitativo nella nostra comprensione della fisica stellare e della Via Lattea. Dunque non si tratta di un singolo risultato, ma di molti, e nuovamente è stato possibile grazie ai Big Data. Devo anche dire che grazie alle nostre survey, come la Catalina Real-Time Transient Survey (CRTS), abbiamo costruito un catalogo senza precedenti in termini di numero di oggetti, copertura e profondità. Tra le altre cose, ci ha permesso di effettuare studi sistematici sulla variabilità dei quasar, ad esempio. In questo campo abbiamo scoperto molte cose o migliorato la nostra conoscenza in settori per i quali avevamo solo informazioni sommarie. Quello che mi piace di più è l'evidenza che alcuni quasar contengono un sistema costituito da due buchi neri supermassici, esattamente come prevede la teoria, e non c'è altro modo di provare ciò se non utilizzando la variabilità periodica e le curve di luce. Il trucco sta nell'utilizzo opportuno di machine learning e moderni strumenti statistici applicati a grandi cataloghi di dati. Questo costituisce un ottimo esempio di applicazione dell'astroinformatica: abbiamo bisogno di dati e di strumenti.

kai JPGKai: Davvero un'ottima domanda. Devo dire che mi sono esaltato particolarmente per la scoperta dell'espansione accelerata dell'Universo. Questo perché sono cresciuto in un tempo in cui il quadro cosmologico era completamente diverso. L'ipotesi che andava per la maggiore era quella che conduceva verso un Big Crunch. Perciò pensai: "Che bello, ancora una volta scopriamo qualcosa di completamente diverso". Credo sia questa una delle cose più belle dell'astronomia: ogni volta che pensiamo di aver capito tutto di qualcosa, questa si rivela completamente sbagliata, o quanto meno necessitante di grosse correzioni. Ciò ci dice quanto poco effettivamente comprendiamo dell'Universo. Già la materia oscura era un problema, ma questo...

gaia

Gaia

La sesta domanda è diversa per ogni intervistato.

dalya JPGDalya: Quali sono i tuoi piani futuri per il prosieguo della tua carriera?

Spero di rimanere nel mondo accademico, poiché lo considero un bell'ambiente e un bel posto in cui lavorare. Credo che si tratti dell'unico posto in cui le persone non vanno al lavoro per i soldi. Il mio supervisore ha 74 anni, è in pensione da dieci anni, e ancora viene in ufficio ogni giorno e guarda i miei risultati con l'eccitazione di un bambino. Io vorrei poter fare lo stesso, vorrei rimanere nel mondo della ricerca, diventare un professore e poter insegnare agli studenti quanto fantastiche siano la scienza e la fisica. Questo è ciò che voglio fare per il resto della mia vita.

george JPGGeorge: Quando hai sentito per la prima volta la parola astroinformatica? E quali sono le principali differenze tra l'astronomia agli inizi della tua carriera e ora?

Non ricordo esattamente, ma è qualcosa che è venuto fuori in modo abbastanza naturale e ha cominciato a essere utilizzato in astronomia nel decennio tra il 2000 e il 2010. Quindi, nel 2010 c'è stata la prima, inaugurale conferenza Astroinformatics. Parlando della mia carriera, quando ho iniziato a occuparmi di astronomia i primi sensori digitali CCD stavano appena cominciando ad apparire. Prima si utilizzavano soltanto le lastre fotografiche. Per cui la mia generazione è stata la prima che ha dovuto sviluppare strumenti per l'analisi delle immagini digitali in astronomia. All'epoca un file di un megabyte era enorme. Durante la metà degli anni '90 ci siamo resi conto che l'evoluzione dell'informatica stava influenzando l'astronomia così come ogni altro settore, e la legge di Moore agisce in termini di crescita del volume dei dati e della nostra abilità di processarli. Per questo motivo i miei interessi scientifici si spostarono da ciò che si può con i grandi telescopi, come lo studio di galassie molto distanti, a ciò che invece si può fare con grandi volumi di dati. Cominciarono a essere realizzate le prime grandi survey astronomiche, quindi si cominciò a parlare di osservatorio virtuale e infine di astroinformatica. Siamo stati tra i primi gruppi a utilizzare il machine learning per l'analisi di dati astronomici e a lavorare insieme agli informatici. Per me era chiaro che questo fosse il futuro. Ho lavorato su molte cose diverse, ma mi rendo conto che l'informatica sta cambiando tutte le scienze, sia qualitativamente che quantitativamente, ed è esaltante essere in grado di fare cose prima impossibili, semplicemente perché mancavano i dati.

kai JPGKai: Tu sei il leader di uno dei pochi gruppi al mondo dedicati esplicitamente all'astroinformatica. Qual è la tua esperienza riguardo il portare avanti un gruppo di questo tipo? Come vedi il futuro della ricerca in questo campo?

Direi che il problema non è tanto il guidare un gruppo, ma più che altro essere in grado di mettere insieme diversi tipo di competenze. In un settore interdisciplinare come questo, nessuno può mai ritenersi globalmente esperto su tutto. Dunque occorrono competenze diverse in modo da creare un gruppo eterogeneo, e bisogna riuscire a seguire gli istinti individuali, bilanciando le capacità e le conoscenze di ognuno. Per questo mi considero una sorta di pastore, ma più che altro seguo le pecore cercando di vedere dove si dirigano, accertandomi che rimangano sui binari giusti.

Riguardo il futuro del settore, sono realmente preoccupato del fatto che tutti sembrano volere più data scientists, politici, industrie e così via. Tuttavia ciò di cui ha davvero bisogno il mondo accademico è di un numero maggiore di professori del settore informatico che lavorino a stretto contatto con i dipartimenti di scienze naturali, e non solo. Temo infatti che le università, con una richiesta così elevata da parte dell'industria, si trovino nella situazione di non poter competere, poiché noi non possiamo mettere sul piatto gli stessi stipendi e gli stessi finanziamenti. Così, molti giovani scienziati, dopo aver completato la loro istruzione ed essere divenuti davvero buoni ricercatori, tendono ad abbandonare il mondo della ricerca per l'industria. Il rischio è che quelli che scelgono di rimanere non siano i migliori. Da questo punto di vista, mi spiace dirlo, l'astroinformatica non ha futuro. Se vogliamo svilupparci a lungo termine occorre poter offrire posti a tempo indeterminato, con alcune cattedre da professore ordinario per ogni nazione, che al momento non esistono. Se vogliamo essere competitivi nel campo della data science dobbiamo realmente cominciare a pianificare meglio le mosse future.

Questo è tutto. Ma se foste ancora curiosi e voleste saperne di più, tutti le presentazioni della conferenza sono disponibili a questo link.

Sono ovviamente molto tecniche, ma possono essere interessanti per darvi un'idea di come si svolge davvero un progetto di ricerca in questo campo.


Tom's Consiglia

Se siete alla ricerca di un buon telescopio per esplorare il cielo, prendete in considerazione il Celestron AstroMaster 130EQ motirizzato con treppiedi in acciaio, è un'ottima scelta.