Case Study: Illumina - Sustainable Cloud Storage for Genomic Data
Reto
Illumina, empresa líder en el desarrollo de herramientas y sistemas de ciencias biológicas para el análisis genético a gran escala, se enfrentó en 2022 a un crecimiento exponencial de los requisitos de almacenamiento de datos genómicos. A medida que la empresa ampliaba su línea de productos y su base de clientes, la cantidad de datos almacenados en la nube pasó de 1 PB a 100 PB en ocho años, con 24 PB adicionales añadidos en un solo año (2021-2022). Ante este rápido crecimiento de los datos, Illumina buscó formas de optimizar el almacenamiento, maximizar el ahorro de costes y reducir las emisiones de carbono.
Objetivos
- Optimizar el almacenamiento de datos en AWS, logrando ahorros de costes, mejorando la eficiencia y reduciendo significativamente las emisiones de carbono.
- Reducir las emisiones de carbono en aproximadamente un 90 % en comparación con las soluciones locales.
- Optimizar los costes de almacenamiento de datos en un 60 % por TB.
- Mejorar la eficiencia de la gestión de datos y la experiencia del cliente.
Enfoque
- Elegir un proveedor de alojamiento sostenible: Illumina utilizó Amazon Web Services (AWS), que está en camino de alimentar sus operaciones con energía 100 % renovable para 2025. Esto se ajusta a la recomendación de utilizar proveedores de alojamiento ecológicos, lo que reduce significativamente la huella de carbono de sus operaciones digitales.
- Optimizar para la energía limpia: utilizando la herramienta AWS Customer Carbon Footprint Tool, Illumina realizó un seguimiento y optimizó sus emisiones de carbono. Esta herramienta proporcionó información sobre las emisiones históricas, las tendencias previstas y las emisiones de carbono estimadas que se evitaron al utilizar AWS en comparación con los centros de datos locales.
- Promover comportamientos ecológicos entre los usuarios: mediante el uso de la herramienta de optimización de almacenamiento de AWS ((link: https://aws.amazon.com/s3/storage-classes/intelligent-tiering/ class: mylink lang: de rel: nofollow role: button target: _blank title: Wikipedia text: Amazon S3 Intelligent-Tiering)), Illumina automatizó el ahorro de costes de almacenamiento trasladando los datos en función de los patrones de acceso. Esto minimizó el consumo innecesario de energía y fomentó prácticas de gestión de datos más sostenibles.
- Configurar el modo ultraecológico: Illumina pudo transferir automáticamente los datos a los que se accedía con menos frecuencia a niveles de almacenamiento de menor coste, lo que garantizó operaciones de almacenamiento de datos eficientes desde el punto de vista energético.
- Educar e involucrar a los usuarios: Illumina se aseguró de que sus equipos estuvieran informados sobre las ventajas de las prácticas de gestión de datos sostenibles. Esto incluía optimizar el envío de trabajos y comprender el impacto medioambiental de sus opciones de almacenamiento de datos.
Impacto
- Reducción de emisiones: Illumina logró una reducción del 89 % en las emisiones de carbono al utilizar AWS en lugar de centros de datos locales. Durante un periodo de 12 meses que finalizó en noviembre de 2022, esto supuso una reducción de unas 2657 toneladas métricas de dióxido de carbono equivalente (MTCO2e) a solo 290 MTCO2e.
- Ahorro de costes: al pasar a Amazon S3 Intelligent-Tiering, Illumina ahorró un 60 % en costes de almacenamiento por TB de datos. Esta importante reducción de costes permitió a la empresa destinar el ahorro a mejorar su oferta de servicios y software.
- Mejora del rendimiento: la implementación de S3 Intelligent-Tiering agilizó los flujos de trabajo internos y simplificó la gestión de datos. Los clientes de Illumina se beneficiaron de un acceso casi instantáneo a los datos genómicos a un coste menor, lo que aceleró sus esfuerzos de investigación y desarrollo.
Conclusiones clave
- Optimización del almacenamiento en la nube: el paso a soluciones de almacenamiento inteligente en la nube puede reducir drásticamente tanto los costes como la huella de carbono.
- Ventajas de la clasificación automática: la implementación de soluciones que mueven automáticamente los datos en función de los patrones de acceso genera ganancias tanto en eficiencia como en sostenibilidad.
- Reducción de carbono a gran escala: las operaciones de datos genómicos a gran escala pueden lograr importantes beneficios medioambientales mediante una arquitectura de nube bien pensada. Incluso las iniciativas más pequeñas en organizaciones gigantes pueden tener un gran impacto.
- Alineación de los objetivos empresariales y de sostenibilidad: la optimización de costes y la reducción de carbono pueden ser objetivos complementarios cuando se implementan correctamente.
Pasos futuros
- Illumina tiene previsto seguir optimizando su almacenamiento de datos trasladando datos adicionales de investigación y desarrollo y de Illumina Connected Analytics a S3 Intelligent-Tiering.
- También está explorando el uso de Amazon S3 Storage Lens para mejorar la visibilidad y obtener recomendaciones prácticas que permitan mejorar aún más la rentabilidad y el uso de la energía.
- Esta transformación digital en curso respalda la misión de Illumina de mejorar la salud humana, al tiempo que mantiene su compromiso con la sostenibilidad.
Conclusión
El enfoque estratégico de Illumina para el almacenamiento de datos genómicos demuestra cómo las empresas de ciencias de la vida pueden abordar el crecimiento exponencial de los datos de investigación y, al mismo tiempo, reducir los costes y el impacto medioambiental. Al aprovechar las tecnologías en la nube con capacidades de gestión de datos automatizadas, Illumina ha creado una solución escalable que respalda tanto sus objetivos empresariales como sus compromisos de sostenibilidad. Este caso práctico demuestra que, incluso con requisitos de datos masivos, las empresas pueden implementar estrategias prácticas que benefician a sus operaciones, a sus clientes y al planeta.