#216 Evento CrowdStrike: Construindo Resiliência

Subscribe to get the latest

on 2024-07-23 15:37:02 +0000

with Steve Orrin, Darren W Pulsipher,

Líderes de tecnologia e negócios sabem que com o aumento da dependência de sistemas e dispositivos digitais surge o potencial para falhas catastróficas, como o apagão de TI mais significativo da história, interrompendo significativamente os serviços em vários setores. Em um recente episódio de podcast, os especialistas da indústria Darren Pulsipher e Steve mergulharam nos fatores que impulsionam tais grandes falhas de sistema e como as empresas podem construir plataformas de tecnologia mais resilientes para enfrentar melhor esses desafios.


Keywords

#devsecops #disasterrecovery #businesscontinuity #chaosmonkey #systemresilience #itoutages #active_managementtech #continualdeployment #infrastructureupdates #digitransformation


Líderes de tecnologia e negócios sabem que, com o aumento da dependência de sistemas e dispositivos digitais, surge o potencial para falhas catastróficas, como o apagão de TI mais significativo da história, interrompendo significativamente os serviços em vários setores. Em um recente episódio de podcast, os especialistas da indústria Darren Pulsipher e Steve mergulharam nos fatores por trás de tais falhas importantes de sistema e como as empresas podem construir plataformas tecnológicas mais resilientes para resistir melhor a esses desafios.

Resiliência Aprimorada através do DevSecOps

A conversa aprofundou-se no papel crítico do DevSecOps, que envolve a integração contínua de medidas de segurança em todo o ciclo de vida do desenvolvimento de software, desde o planejamento até a codificação, passando pelo teste até a implantação. Foi enfatizado que essa abordagem holística garante que a segurança não seja um pensamento posterior, mas sim uma parte integral do processo de desenvolvimento, alinhada com os princípios do DevOps. Ao discutir os desafios, os especialistas apontaram que a implantação contínua de atualizações, particularmente arquivos de configuração, às vezes pode entrar em conflito com os meticulosos testes e medidas de segurança defendidos pelo DevSecOps. Esse conflito sublinha a necessidade de equilibrar agilidade e robustos protocolos de segurança dentro do framework do DevOps.

Além disso, a conversa enfatizou que o objetivo principal do DevSecOps não é apenas detectar e solucionar problemas após a implantação; em vez disso, o foco está em prevenir proativamente as falhas do sistema ao identificar e corrigir possíveis vulnerabilidades durante a fase de desenvolvimento. Isso se alinha com o objetivo geral do DevSecOps, que é promover uma cultura de consciência e responsabilidade de segurança entre as equipes de desenvolvimento e operações. Ao lidar proativamente com as preocupações de segurança em todas as etapas do processo de desenvolvimento de software, as organizações podem reduzir significativamente o risco de falhas do sistema e garantir a robustez e a confiabilidade geral de seus sistemas.

Incorporando práticas do Chaos Monkey

Darren e Steve introduziram um conceito intrigante com a sua introdução das práticas “Chaos Monkey”, defendendo a sua integração no processo DevOps. Este método enfatiza técnicas de teste de estresse como a remoção aleatória de serviços para identificar pontos fracos nas operações. Ao implementar essa abordagem, as empresas podem melhorar proativamente a resiliência ao atualizar constantemente produtos e infraestrutura para lidar efetivamente com qualquer caos potencial que possa surgir no futuro.

A metodologia “Chaos Monkey” é uma estratégia proativa para fortalecer as operações contra possíveis interrupções. Ao testar o stress dos sistemas através de métodos como a remoção aleatória de serviços, as organizações podem identificar vulnerabilidades e tomar medidas preventivas para fortalecer sua resiliência. Esta melhoria contínua garante que as empresas estejam melhor equipadas para lidar com desafios imprevistos, resultando em operações mais robustas e confiáveis.

Processo de Recuperação de Desastres e Continuidade dos Negócios

Durante a discussão sobre estratégias de recuperação, Darren e Steve enfatizaram a importância de implementar um plano de recuperação de desastres e continuidade de negócios abrangente que engloba toda a organização, em vez de se concentrar apenas em sistemas individuais. Eles destacaram a importância da preparação para transmitir sua relevância à audiência. Uma das sugestões foi a utilização de sistemas automatizados que podem entrar em ação imediatamente após uma falha no sistema, reduzindo assim a dependência de intervenção humana e decisões baseadas em suposições.

Além disso, eles se aprofundaram nas capacidades da Tecnologia de Gerenciamento Ativo baseada em Intel (AMT), que permite acesso seguro a sistemas que sofreram falhas na rede para recuperação e atualizações. O enfoque em alavancar tais avanços tecnológicos reflete o papel vital que os sistemas automatizados e tecnologias avançadas desempenham no aprimoramento dos processos de recuperação de desastres e continuidade dos negócios, contribuindo em última análise para a resiliência e estabilidade das organizações.

O ponto principal da conversa foi a necessidade das empresas priorizarem a construção de resiliência em seus processos tecnológicos e equipes. Isso requer uma abordagem voltada para o futuro e a integração de mudanças efetivas que aproveitam as pessoas, os processos e a tecnologia. A necessidade de adaptabilidade é enfatizada, assim como a criação de um equilíbrio intrincado entre velocidade, agilidade e testes rigorosos. Com preparação adequada e resiliência, as empresas podem estar prontas para enfrentar futuras disrupções de frente.

Pronto para aprender mais? Confira o episódio completo do podcast para um mergulho mais profundo no fascinante mundo da construção de uma plataforma de tecnologia resiliente. Você pode ouvir, curtir, se inscrever e compartilhar este episódio aqui. Também recebemos seus comentários e feedback sobre nossa discussão na seção de comentários abaixo. Deixe-nos saber suas opiniões sobre a construção de resiliência dentro de seus sistemas!

Podcast Transcript