#216 Événement CrowdStrike: Construire la Résilience

Subscribe to get the latest

on 2024-07-23 15:37:02 +0000

with Steve Orrin, Darren W Pulsipher,

Les dirigeants techniques et commerciaux savent qu'avec une dépendance accrue aux systèmes et appareils numériques, le risque de pannes catastrophiques augmente, comme celle de la panne informatique la plus significative de l'histoire, perturbant considérablement les services dans plusieurs secteurs. Dans un épisode récent de podcast, les experts de l'industrie Darren Pulsipher et Steve ont examiné les facteurs qui motivent de tels échecs majeurs du système et comment les entreprises peuvent construire des plateformes technologiques plus résilientes pour mieux résister à ces défis.


Keywords

#devsecops #disasterrecovery #businesscontinuity #chaosmonkey #systemresilience #itoutages #active_managementtech #continualdeployment #infrastructureupdates #digitransformation


Les leaders technologiques et commerciaux savent qu’avec une dépendance accrue aux systèmes numériques et aux appareils, il y a le potentiel pour des pannes catastrophiques, comme la panne informatique la plus importante de l’histoire, perturbant de manière significative les services dans plusieurs secteurs. Dans un épisode récent de podcast, les experts de l’industrie Darren Pulsipher et Steve se sont penchés sur les facteurs à l’origine de ces échecs majeurs de système et comment les entreprises peuvent construire des plateformes technologiques plus résilientes pour mieux résister à ces défis.

Résilience améliorée grâce à DevSecOps

La conversation s’est penchée sur le rôle crucial du DevSecOps, qui implique l’intégration sans faille de mesures de sécurité tout au long du cycle de vie du développement logiciel, de la planification à la programmation en passant par les tests jusqu’au déploiement. Il a été souligné que cette approche holistique garantit que la sécurité n’est pas une réflexion après-coup, mais plutôt une partie intégrante du processus de développement, s’alignant sur les principes de DevOps. En discutant des défis, les experts ont souligné que le déploiement continu des mises à jour, en particulier des fichiers de configuration, peut parfois entrer en conflit avec les tests méticuleux et les mesures de sécurité prônées par DevSecOps. Ce conflit souligne la nécessité d’équilibrer l’agilité et les protocoles de sécurité robustes au sein du cadre DevOps.

De plus, la conversation a souligné que l’objectif principal de DevSecOps n’est pas seulement de détecter et de résoudre les problèmes après le déploiement; à la place, l’accent est mis sur la prévention proactive des échecs du système en identifiant et en rectifiant les vulnérabilités potentielles pendant la phase de développement. Cela s’aligne avec l’objectif suprême de DevSecOps, qui est de promouvoir une culture de sensibilisation à la sécurité et de responsabilité à travers les équipes de développement et d’opérations. En abordant proactivement les problèmes de sécurité à chaque étape du processus de développement de logiciels, les organisations peuvent réduire considérablement le risque de pannes du système et garantir la robustesse et la fiabilité globales de leurs systèmes.

Intégrant des pratiques de Chaos Monkey

Darren et Steve ont introduit un concept intrigant avec leur introduction des pratiques de “Chaos Monkey”, préconisant son intégration dans le processus DevOps. Cette méthode met l’accent sur des techniques de test de stress comme la suppression aléatoire de services pour identifier les points faibles au sein des opérations. En mettant en œuvre cette approche, les entreprises peuvent améliorer de manière proactive leur résilience en mettant constamment à jour les produits et l’infrastructure pour gérer efficacement tout chaos potentiel qui pourrait survenir à l’avenir.

La méthodologie du “Chaos Monkey” est une stratégie proactive pour renforcer les opérations contre d’éventuelles perturbations. En soumettant les systèmes à des tests de stress par des méthodes comme la suppression de service aléatoire, les organisations peuvent identifier les vulnérabilités et prendre des mesures préventives pour renforcer leur résilience. Cette amélioration continue assure que les entreprises sont mieux équipées pour faire face aux défis imprévus, ce qui se traduit par des opérations plus robustes et fiables.

Processus de Restauration après Sinistre et Continuité d’Activités

Au cours de la discussion sur les stratégies de récupération, Darren et Steve ont souligné l’importance de la mise en œuvre d’un plan de reprise après sinistre et de continuité des affaires complet qui englobe toute l’organisation plutôt que de se concentrer uniquement sur des systèmes individuels. Ils ont mis en évidence l’importance de la préparation pour en montrer l’importité à l’auditoire. Une des suggestions était l’utilisation de systèmes automatisés qui peuvent se mettre en action immédiatement après un crash du système, réduisant ainsi la dépendance à l’intervention humaine et aux suppositions.

De plus, ils ont exploré les capacités de la technologie Active Management Technology (AMT) basée sur Intel, qui permet un accès sécurisé aux systèmes écrasés sur le réseau pour la récupération et les mises à jour. L’accent mis sur l’exploitation de ces avancées technologiques reflète le rôle vital que les systèmes automatisés et les technologies avancées jouent dans l’amélioration des processus de récupération après sinistre et de continuité des activités, contribuant finalement à la résilience et à la stabilité des organisations.

Le principal point à retenir de la conversation était la nécessité pour les entreprises de donner la priorité à la construction de la résilience dans leurs processus technologiques et leurs équipes. Cela nécessite une approche tournée vers l’avenir et l’intégration de changements efficaces en s’appuyant sur les personnes, les processus et la technologie. Le besoin d’adaptabilité est souligné, tout comme la création d’un équilibre complexe entre vitesse, agilité et tests rigoureux. Avec une préparation adéquate et une résilience accrue, les entreprises peuvent être prêtes à faire face directement aux perturbations futures.

Prêt à en savoir plus ? Découvrez tout l’épisode du podcast pour une plongée plus profonde dans le monde fascinant de la construction d’une plateforme technologique résiliente. Vous pouvez écouter, aimer, vous abonner et partager cet épisode ici. Nous accueillons également vos avis et commentaires sur notre discussion via la section de commentaires ci-dessous. Faites-nous connaître vos réflexions sur la construction de résilience au sein de vos systèmes!

Podcast Transcript