#216 CrowdStrike Veranstaltung: Resilienz Aufbauen

Subscribe to get the latest

on 2024-07-23 15:37:02 +0000

with Steve Orrin, Darren W Pulsipher,

Technologie- und Geschäftsführer wissen gleichermaßen, dass mit der zunehmenden Abhängigkeit von digitalen Systemen und Geräten das Potenzial für katastrophale Ausfälle besteht, wie beispielsweise der bedeutendste IT-Ausfall in der Geschichte, der Dienste in mehreren Sektoren erheblich stört. In einer kürzlichen Podcast-Episode gingen die Branchenexperten Darren Pulsipher und Steve auf die treibenden Faktoren hinter solchen großen Systemausfällen ein und wie Unternehmen widerstandsfähigere Technologieplattformen aufbauen können, um diese Herausforderungen besser zu bewältigen.


Keywords

#devsecops #disasterrecovery #businesscontinuity #chaosmonkey #systemresilience #itoutages #active_managementtech #continualdeployment #infrastructureupdates #digitransformation


Technologie- und Wirtschaftsführer wissen gleichermaßen, dass mit einer gesteigerten Abhängigkeit von digitalen Systemen und Geräten das Potenzial für katastrophale Ausfälle besteht, wie den bedeutsamsten IT-Ausfall in der Geschichte, der die Dienste in mehreren Branchen erheblich gestört hat. In einer kürzlich veröffentlichten Podcast-Episode gingen Branchenexperten Darren Pulsipher und Steve auf die treibenden Faktoren hinter solchen größeren Systemausfällen ein und wie Unternehmen widerstandsfähigere Technologieplattformen aufbauen können, um diesen Herausforderungen besser standzuhalten.

Verbesserte Resilienz durch DevSecOps

Das Gespräch vertiefte sich in die kritische Rolle von DevSecOps, die eine nahtlose Integration von Sicherheitsmaßnahmen während des gesamten Softwareentwicklungs-Lebenszyklus beinhaltet, von der Planung über die Programmierung bis hin zu Tests und Einsatz. Es wurde betont, dass dieser ganzheitliche Ansatz sicherstellt, dass Sicherheit kein Nachgedanke, sondern ein integraler Bestandteil des Entwicklungsprozesses ist, im Einklang mit den Prinzipien von DevOps. Bei der Diskussion der Herausforderungen wiesen die Experten darauf hin, dass die kontinuierliche Bereitstellung von Updates, insbesondere Konfigurationsdateien, manchmal mit den sorgfältigen Tests und Sicherheitsmaßnahmen, die von DevSecOps befürwortet werden, in Konflikt geraten kann. Dieser Konflikt unterstreicht die Notwendigkeit, Agilität und robuste Sicherheitsprotokolle innerhalb des DevOps-Rahmens auszugleichen.

Darüber hinaus betonte das Gespräch, dass das Hauptziel von DevSecOps nicht nur darin besteht, Probleme nach der Bereitstellung zu erkennen und zu beheben; stattdessen liegt der Schwerpunkt darauf, Systemausfälle proaktiv zu verhindern, indem potentielle Schwachstellen bereits während der Entwicklungsphase identifiziert und behoben werden. Dies stimmt mit dem übergreifenden Ziel von DevSecOps überein, eine Kultur der Sicherheitsbewusstheit und Verantwortung in den Entwicklungs- und Betriebsteams zu fördern. Indem Sicherheitsbedenken proaktiv in jeder Phase des Softwareentwicklungsprozesses angegangen werden, können Organisationen das Risiko von Systemabstürzen erheblich reduzieren und die allgemeine Robustheit und Zuverlässigkeit ihrer Systeme gewährleisten.

Einbeziehung von Chaos Monkey-Praktiken

Darren und Steve haben ein faszinierendes Konzept mit ihrer Einführung der “Chaos Monkey” Praktiken vorgestellt und für dessen Integration in den DevOps-Prozess plädiert. Diese Methode betont Stresstest-Techniken wie das zufällige Entfernen von Diensten, um Schwachstellen innerhalb der Operationen zu identifizieren. Durch die Implementierung dieses Ansatzes können Unternehmen proaktiv ihre Widerstandsfähigkeit verbessern, indem sie Produkte und Infrastruktur konsequent aktualisieren, um effektiv mit jedem möglichen Chaos umzugehen, das in der Zukunft auftreten könnte.

Die “Chaos Monkey”-Methodik ist eine proaktive Strategie, um Operationen gegen potenzielle Störungen zu stärken. Durch Belastungstests von Systemen mit Methoden wie dem zufälligen Entfernen von Diensten können Organisationen Schwachstellen identifizieren und vorbeugende Maßnahmen ergreifen, um ihre Widerstandsfähigkeit zu stärken. Diese kontinuierliche Verbesserung stellt sicher, dass Unternehmen besser auf unvorhergesehene Herausforderungen vorbereitet sind, was zu robusteren und zuverlässigeren Abläufen führt.

Katastrophenwiederherstellung und Geschäftskontinuitätsprozess

Während der Diskussion über Wiederherstellungsstrategien betonten Darren und Steve die Bedeutung der Implementierung eines umfassenden Notfallwiederherstellungs- und Geschäftskontinuitätsplans, der die gesamte Organisation umfasst, anstatt sich ausschließlich auf einzelne Systeme zu konzentrieren. Sie hoben die Bedeutung der Vorbereitung hervor, um ihre Wichtigkeit für das Publikum zu verdeutlichen. Einer der Vorschläge war die Nutzung von automatisierten Systemen, die unmittelbar nach einem Systemabsturz eingreifen können, wodurch die Abhängigkeit von menschlichem Eingreifen und Vermutungen reduziert wird.

Darüber hinaus beschäftigten sie sich mit den Fähigkeiten der auf Intel basierenden Active Management Technology (AMT), die einen sicheren Zugang zu abgestürzten Systemen über das Netzwerk für Wiederherstellung und Updates ermöglicht. Die Betonung auf die Nutzung solcher technologischen Fortschritte spiegelt die entscheidende Rolle wider, die automatisierte Systeme und fortschrittliche Technologien bei der Verbesserung der Katastrophenwiederherstellung und der Geschäftskontinuitätsprozesse spielen, und trägt letztendlich zur Widerstandsfähigkeit und Stabilität von Organisationen bei.

Die wichtigste Erkenntnis aus dem Gespräch war die Notwendigkeit für Unternehmen, den Aufbau von Resilienz in ihren Technologieprozessen und Teams zu priorisieren. Dies erfordert einen zukunftsorientierten Ansatz und die Integration wirksamer Veränderungen, die sich auf Menschen, Prozesse und Technologie stützen. Die Notwendigkeit zur Anpassungsfähigkeit wird betont, ebenso wie die Schaffung einer ausgewogenen Balance zwischen Geschwindigkeit, Agilität und rigoroser Prüfung. Mit einer angemessenen Vorbereitung und Widerstandsfähigkeit können Unternehmen bereit sein, zukünftige Störungen direkten entgegenzutreten.

Bereit, mehr zu lernen? Schauen Sie sich die gesamte Podcast-Episode für einen tieferen Einblick in die faszinierende Welt des Aufbaus einer widerstandsfähigen Technologieplattform an. Sie können diese Episode hier anhören, liken, abonnieren und teilen. Wir freuen uns auch über Ihr Feedback und Kommentare zu unserer Diskussion im Kommentarbereich unten. Lassen Sie uns Ihre Gedanken zum Aufbau von Resilienz in Ihren Systemen wissen!

Podcast Transcript