#216 Evento CrowdStrike: Construyendo Resiliencia

Subscribe to get the latest

on 2024-07-23 15:37:02 +0000

with Steve Orrin, Darren W Pulsipher,

Los líderes tecnológicos y empresariales saben que con un mayor uso de sistemas y dispositivos digitales viene la posibilidad de fallos catastróficos, como la caída de IT más importante de la historia, que interrumpió significativamente los servicios en varios sectores. En un reciente episodio de podcast, los expertos de la industria Darren Pulsipher y Steve se adentraron en los factores que impulsan tales grandes fallos de sistemas y cómo las empresas pueden construir plataformas de tecnología más resilientes para resistir mejor estos desafíos.


Keywords

#devsecops #disasterrecovery #businesscontinuity #chaosmonkey #systemresilience #itoutages #active_managementtech #continualdeployment #infrastructureupdates #digitransformation


Los líderes de tecnología y negocios por igual saben que el aumento de la dependencia de los sistemas y dispositivos digitales conlleva el potencial de sufrir cortes catastróficos, como el apagón de TI más significativo de la historia, que interrumpió significativamente los servicios en varios sectores. En un episodio reciente de un podcast, los expertos de la industria Darren Pulsipher y Steve se adentraron en los factores que impulsan tales fallos de sistema principales y cómo las empresas pueden construir plataformas tecnológicas más resilientes para resistir mejor estos desafíos.

Resiliencia Mejorada a través de DevSecOps

La conversación profundizó en el papel crítico de DevSecOps, que implica la integración sin fisuras de medidas de seguridad durante todo el ciclo de vida del desarrollo de software, desde la planificación hasta la codificación, las pruebas y el despliegue. Se enfatizó que este enfoque holístico asegura que la seguridad no es una reflexión tardía, sino más bien una parte integral del proceso de desarrollo, alineándose con los principios de DevOps. Al discutir los desafíos, los expertos señalaron que el despliegue continuo de actualizaciones, particularmente archivos de configuración, a veces puede entrar en conflicto con las meticulosas pruebas y medidas de seguridad defendidas por DevSecOps. Este conflicto subraya la necesidad de equilibrar la agilidad y los robustos protocolos de seguridad dentro del marco de DevOps.

Además, la conversación enfatizó que el objetivo principal de DevSecOps no es solo detectar y solucionar problemas después de la implementación; en cambio, el enfoque está en prevenir proactivamente fallas en el sistema al identificar y corregir posibles vulnerabilidades durante la fase de desarrollo. Esto se alinea con el objetivo principal de DevSecOps, que es fomentar una cultura de conciencia y responsabilidad de seguridad en los equipos de desarrollo y operaciones. Al abordar proactivamente las preocupaciones de seguridad en cada etapa del proceso de desarrollo de software, las organizaciones pueden reducir significativamente el riesgo de fallas del sistema y garantizar la robustez y confiabilidad general de sus sistemas.

Incorporando prácticas del Chaos Monkey

Darren y Steve han introducido un concepto intrigante con su introducción de las prácticas de “Chaos Monkey”, abogando por su integración en el proceso DevOps. Este método enfatiza técnicas de prueba de estrés como la eliminación aleatoria de servicios para identificar puntos débiles dentro de las operaciones. Al implementar este enfoque, las empresas pueden mejorar proactivamente su resistencia actualizando constantemente los productos e infraestructura para manejar eficazmente cualquier caos potencial que pueda surgir en el futuro.

La metodología “Chaos Monkey” es una estrategia proactiva para fortalecer las operaciones ante posibles interrupciones. Al someter a prueba de estrés los sistemas a través de métodos como la eliminación aleatoria de servicios, las organizaciones pueden identificar vulnerabilidades y tomar medidas preventivas para reforzar su resistencia. Esta mejora continua asegura que las empresas estén mejor equipadas para manejar desafíos imprevistos, lo que resulta en operaciones más robustas y confiables.

Proceso de Recuperación de Desastres y Continuidad del Negocio

Durante la discusión sobre estrategias de recuperación, Darren y Steve destacaron la importancia de implementar un plan integral de recuperación de desastres y continuidad del negocio que abarque toda la organización en lugar de centrarse únicamente en sistemas individuales. Resaltaron la importancia de la preparación para transmitir su relevancia a la audiencia. Una de las sugerencias fue la utilización de sistemas automatizados que pueden entrar en acción inmediatamente después de un fallo del sistema, reduciendo así la dependencia de la intervención humana y las conjeturas.

Además, profundizaron en las capacidades de la Tecnología de Gestión Activa basada en Intel (AMT), que permite el acceso seguro a sistemas colapsados a través de la red para su recuperación y actualizaciones. El énfasis en aprovechar tales avances tecnológicos refleja el papel vital que los sistemas automatizados y las tecnologías avanzadas desempeñan en la mejora de los procesos de recuperación de desastres y continuidad del negocio, contribuyendo finalmente a la resiliencia y estabilidad de las organizaciones.

La conclusión principal de la conversación fue la necesidad de que las empresas prioricen la construcción de resiliencia en sus procesos tecnológicos y equipos. Esto requiere un enfoque proactivo y la integración de cambios efectivos que aprovechen a las personas, los procesos y la tecnología. Se enfatiza la necesidad de adaptabilidad, al igual que la creación de un equilibrio intrincado entre velocidad, agilidad y pruebas rigurosas. Con una preparación adecuada y resiliencia, las empresas pueden estar listas para enfrentar los trastornos futuros de frente.

¿Listo para aprender más? Consulta el episodio completo del podcast para una inmersión más profunda en el fascinante mundo de la construcción de una plataforma tecnológica resiliente. Puedes escuchar, dar me gusta, suscribirte y compartir este episodio aquí. También agradecemos tus comentarios y opiniones sobre nuestra discusión a través de la sección de comentarios a continuación. ¡Déjanos saber tus pensamientos sobre la construcción de resiliencia dentro de tus sistemas!

Podcast Transcript