Data Cloud migra de Amazon EC2 a Kubernetes en 6 meses

En nuestra serie de preguntas y respuestas «Engineering Energizers», nos adentramos en los viajes de distinguidos líderes de la ingeniería. Hoy, presentamos a Archana Kumari, Directora de Ingeniería de Software en Salesforce.

Archana dirige nuestro equipo Data Cloud Compute Layer con sede en India, que desempeñó un papel fundamental en la reciente transición de Amazon EC2 a Kubernetes para cargas de trabajo de Trino. Este cambio no solo mejoró el rendimiento y la escalabilidad, sino que también redujo la sobrecarga operativa, mejoró la rentabilidad y aceleró el tiempo de comercialización de Data Cloud.

Data Cloud

Descubra las estrategias que el equipo de Archana utilizó para afrontar retos complejos, integrar a la perfección Hyperforce y desarrollar innovaciones propias que facilitaron la transición de las cargas de trabajo a Kubernetes.

Paneles de control de CTS que muestran la reducción de costes semanal tras la migración.

Distribución de los costes

Paneles de control de CTS que muestran la reducción de costes mensual tras la migración.

Distribución de costes

¿Qué estrategias utilizó su equipo para optimizar la utilización de los recursos en el nuevo entorno Kubernetes y cómo mejoraron estas estrategias el rendimiento general del sistema?

El equipo implementó varias estrategias:

Horizontal Pod Autoscaling (HPA): Esta función ajustaba automáticamente el número de réplicas de pods en función de la utilización de la CPU, lo que permitía al equipo gestionar eficazmente las cargas variables sin sobreaprovisionar recursos.

El equipo implementó varias estrategias
Ajuste del tipo de instancia: al seleccionar cuidadosamente los tipos de instancia, el equipo garantizó un equilibrio óptimo entre el uso de la CPU y de la memoria en función de los requisitos de la carga de trabajo, maximizando el rendimiento y minimizando los costes.

Ajuste del tipo de instancia
Solicitudes y límites de recursos: la configuración de solicitudes y límites de recursos para cada pod permitió a Kubernetes tomar decisiones informadas sobre la programación y la asignación de recursos, mejorando la eficiencia operativa.
Kubernetes Cluster Autoscaler: esta herramienta ajustaba dinámicamente el tamaño de los clústeres en función de la demanda, lo que permitía a la infraestructura escalar sin problemas con los cambios en la carga de trabajo.
Los clústeres de Kubernetes pueden escalar sin problemas con los cambios en la carga de trabajo

Estas estrategias mejoraron colectivamente el rendimiento y la rentabilidad del sistema al garantizar un uso óptimo de los recursos y una infraestructura adaptable para satisfacer las demandas cambiantes.

¿Cómo gestionó su equipo los recursos de forma eficaz para garantizar que el proyecto de migración siguiera su curso?

El equipo empleó varios métodos eficaces:

Priorización cuidadosa y asignación estratégica de tareas: Al evaluar y priorizar continuamente las tareas críticas en colaboración con las partes interesadas, el equipo centró los esfuerzos en áreas de gran impacto, mejorando la eficiencia general.
Enfoque de equipo colaborativo: Se fomentó una misión unificada entre los equipos de Compute, Query, Service Delivery e Hyperforce. Esta colaboración garantizó la alineación con los objetivos comunes y facilitó un trabajo en equipo sin fisuras.
Empleo en equipo
Comunicación global mejorada: Se utilizaron canales de comunicación regulares, incluidas reuniones virtuales y herramientas de colaboración, para mejorar la colaboración en diferentes ubicaciones geográficas. Este trabajo en equipo a escala mundial fue crucial para mantener el impulso y hacer frente a los retos con prontitud.
Apoyo de los equipos de Data Cloud: el apoyo sustancial de varios equipos de Data Cloud fue fundamental para el éxito del proyecto. Su experiencia y asistencia fueron inestimables a la hora de superar obstáculos y garantizar el acceso a los recursos y conocimientos necesarios.
Apoyo de los equipos de Data Cloud
Revisiones periódicas y sesiones de retroalimentación: estas sesiones fueron cruciales para supervisar el progreso y abordar los problemas con rapidez, garantizando que los posibles contratiempos se gestionaran rápidamente.

Más información

Lea este blog para saber cómo el equipo de Data Cloud está escalando volúmenes de datos masivos y reduciendo drásticamente los cuellos de botella en el rendimiento.
Siga conectado: únase a nuestra Comunidad de talento
Consulta nuestros equipos de Tecnología y Producto para saber cómo puedes participar.