Case Study: Illumina - Sustainable Cloud Storage for Genomic Data
La sfida
Illumina, azienda leader nello sviluppo di strumenti e sistemi per le scienze della vita dedicati all'analisi genetica su larga scala, si è trovata nel 2022 ad affrontare una crescita esponenziale dei requisiti di archiviazione dei dati genomici. Con l'espansione della linea di prodotti e della base clienti, la quantità di dati archiviati nel cloud è passata da 1 PB a 100 PB in otto anni, con ulteriori 24 PB aggiunti in un solo anno (2021–2022). Di fronte a questa rapida crescita, Illumina ha cercato modalità per ottimizzare l'archiviazione, massimizzare i risparmi sui costi e ridurre le emissioni di carbonio.
Obiettivi
- Ottimizzare l'archiviazione dei dati su AWS, ottenendo risparmi economici, migliorando l'efficienza e riducendo significativamente le emissioni di carbonio.
- Ridurre le emissioni di carbonio di circa il 90% rispetto alle soluzioni on-premise.
- Ottimizzare i costi di archiviazione dei dati del 60% per ogni TB.
- Migliorare l'efficienza nella gestione dei dati e l'esperienza del cliente.
Approccio
- Scegliere un hosting provider sostenibile: Illumina ha utilizzato Amazon Web Services (AWS), che è sulla buona strada per alimentare le proprie operazioni con l'energia rinnovabile al 100% entro il 2025. Ciò è in linea con la raccomandazione di utilizzare hosting provider green, riducendo in modo significativo l'impronta carbonica delle operazioni digitali.
- Ottimizzare per l'energia pulita: grazie all'AWS Customer Carbon Footprint Tool, Illumina ha monitorato e ridotto le proprie emissioni di carbonio. Lo strumento ha fornito informazioni sulle emissioni storiche, sulle tendenze previste e sulle emissioni stimate evitate utilizzando AWS rispetto ai data center on-premise.
- Promuovere comportamenti green degli utenti: adottando il servizio (link: https://aws.amazon.com/s3/storage-classes/intelligent-tiering/ text: Amazon S3 Intelligent-Tiering), Illumina ha automatizzato i risparmi sui costi di archiviazione spostando i dati in base ai pattern di accesso. Ciò ha minimizzato il consumo energetico non necessario e ha favorito pratiche di gestione dei dati più sostenibili.
- Configurare una modalità ultra eco: Illumina è riuscita a trasferire automaticamente i dati ad accesso infrequente verso livelli di archiviazione a costi inferiori, garantendo operazioni di archiviazione efficienti dal punto di vista energetico.
- Formare e coinvolgere gli utenti: Illumina ha assicurato che i propri team fossero informati sui benefici delle pratiche di gestione dei dati sostenibili. Ciò ha incluso l'ottimizzazione dell'invio dei job e la comprensione dell'impatto ambientale delle scelte di archiviazione dei dati.
Impatto
- Riduzione delle emissioni: Illumina ha ottenuto una riduzione dell'89% delle emissioni di carbonio utilizzando AWS al posto dei data center on-premise. In un periodo di 12 mesi terminato a novembre 2022, le emissioni sono passate da una stima di 2.657 tonnellate metriche di CO₂ equivalente (MTCO2e) a sole 290 MTCO2e.
- Risparmi economici: con il passaggio ad Amazon S3 Intelligent-Tiering, Illumina ha risparmiato il 60% sui costi di archiviazione per ogni TB di dati. Questa significativa riduzione dei costi ha consentito all'azienda di destinare i risparmi al miglioramento dei servizi e dell'offerta software.
- Miglioramento delle prestazioni: l'implementazione di S3 Intelligent-Tiering ha ottimizzato i flussi di lavoro interni e semplificato la gestione dei dati. I clienti di Illumina hanno beneficiato di un accesso quasi istantaneo ai dati genomici a un costo inferiore, accelerando le attività di ricerca e sviluppo.
Punti chiave
- Ottimizzazione dell'archiviazione cloud: il passaggio a soluzioni di archiviazione cloud intelligenti può ridurre drasticamente sia i costi sia l'impronta carbonica.
- Vantaggi del tiering automatico: l'implementazione di soluzioni che spostano automaticamente i dati in base ai pattern di accesso offre benefici sia in termini di efficienza sia di sostenibilità.
- Riduzione delle emissioni su larga scala: le operazioni su dati genomici su larga scala possono ottenere benefici ambientali significativi grazie a un'architettura cloud ben progettata. Anche iniziative più contenute all'interno di grandi organizzazioni possono avere un impatto rilevante.
- Allineamento tra obiettivi di business e sostenibilità: ottimizzazione dei costi e riduzione delle emissioni di carbonio possono essere obiettivi complementari, se implementati correttamente.
Prossimi passi
- Illumina prevede di continuare a ottimizzare l'archiviazione dei dati trasferendo ulteriori dati provenienti dalla ricerca e dallo sviluppo, nonché da Illumina Connected Analytics, verso S3 Intelligent-Tiering.
- L'azienda sta inoltre esplorando l'utilizzo di Amazon S3 Storage Lens per una maggiore visibilità e raccomandazioni operative volte a migliorare ulteriormente l'efficienza dei costi e il consumo energetico.
- Questa trasformazione digitale in corso supporta la missione di Illumina di migliorare la salute umana, mantenendo al contempo un impegno concreto per la sostenibilità.
Conclusione
L'approccio strategico di Illumina all'archiviazione dei dati genomici dimostra come le aziende del settore delle scienze della vita possano affrontare la crescita esponenziale dei dati di ricerca riducendo contemporaneamente i costi e l'impatto ambientale. Sfruttando le tecnologie cloud con funzionalità di gestione automatizzata dei dati, Illumina ha creato una soluzione scalabile che soddisfa sia gli obiettivi di business sia gli impegni di sostenibilità. Questo case study dimostra che anche con requisiti di dati massicci, le aziende possono implementare strategie concrete a beneficio delle proprie operazioni, dei clienti e del pianeta.