Episode 355 From Mars to Data Centers: AI that Prevents Cloud Outages.
Explore more in the episode archive.
Coming Soon...
Come back on 2026-05-28
to see and listen to this amazing episode
Summary
لا ينبغي أن تكون انقطاعات السحابة لغزًا — أو حالة طوارئ متكررة تُستدعى لها فرق الإطفاء. يستضيف الدكتور دارن الدكتورة هيلين غو، أستاذة في جامعة ولاية كارولاينا الشمالية ومؤسسة/الرئيسة التنفيذية لشركة InsightFinder، للحديث عن كيف يمكن للذكاء الاصطناعي لعمليات السحابة أن يكتشف الانقطاعات ويتنبأ بها ويص
الذكاء الاصطناعي للوقاية من انقطاع الخدمة السحابية: كيف تغير التحليلات التنبؤية والأنظمة ذاتية الشفاء تكنولوجيا المعلومات
لماذا تعتبر الوقاية من الانقطاع الحدود الجديدة للذكاء الاصطناعي
ماذا لو كانت بنيتك التحتية قادرة على اكتشاف انقطاع الخدمة السحابية قبل أن يلاحظ المستخدمون ذلك؟ هذه هي الوعد وراء تقنيات الذكاء الاصطناعي لإيقاف الانقطاعات، وهي تنتقل بسرعة من مختبرات الأبحاث إلى بيئات الإنتاج الواقعية.
الدكتورة هيلين جو، أستاذة في جامعة ولاية كارولينا الشمالية ومؤسسة Insight Finder، قضت عقودًا في بناء أنظمة الذكاء الاصطناعي التي تكتشف وتنبئ وتصلح الأخطاء تلقائيًا. توضح أعمالها لماذا تعتبر التحليلات التنبؤية، واكتشاف الشذوذ، والأنظمة ذاتية الشفاء ذات أهمية لكل من التقنيين وقادة الأعمال: فترات التوقف مكلفة، والوقاية أفضل بكثير من الإصلاح.
من استكشاف المريخ إلى موثوقية السحابة الحديثة
كيف بدأت الذكاء الاصطناعي في حل المشكلات الصعبة في الأنظمة
بدأت مسيرة هيلين في مجال الذكاء الاصطناعي قبل فترة طويلة من ازدهار الذكاء الاصطناعي التوليدي اليوم. كانت أبحاثها المبكرة، التي مولتها NASA، تركز على جعل بث الفيديو من المريخ إلى الأرض موثوقًا عن طريق استخدام الشبكات العصبية للتنبؤ باستخدام الموارد بناءً على محتوى الفيديو.
تطورت نفس الفكرة إلى مهمة أوسع: استخدام تعلم الآلة للحفاظ على استقرار الأنظمة الموزعة المعقدة. بدلاً من تحليل النص أو الصورة أو الفيديو فقط، ركز فريقها على سجلات الآلة، والبيانات التلومية، وبيانات التطبيقات - الإشارات الفوضوية التي غالبًا ما تكشف عن المشاكل قبل حدوث العطل.
لماذا لا يمكن للمشغلين البشريين التقاط كل شيء
تكون بيئات السحابة الحديثة ديناميكية للغاية بحيث لا يكفي الاعتماد على المراقبة اليدوية فقط. يمكن لخادم واحد تشغيل العشرات من التطبيقات، كل منها ينتج مئات من المقاييس التي تتقلب باستمرار. عندما تتداخل تلك الإشارات عبر الخدمات الصغيرة، وواجهات برمجة التطبيقات، والحاويات، قد يكون من الصعب تحديد السبب الجذري للفشل.
هذا هو المكان الذي يساعد فيه الذكاء الاصطناعي. يمكنه الكشف عن الأنماط الخفية، وتحديد استنزاف الموارد في وقت مبكر، وتضييق نطاق المكونات التي تسبب المشكلة قبل أن تنتشر.
النقاط الرئيسية
أنظمة السحاب معقدة للغاية بالنسبة للمراقبة التي تعتمد فقط على العتبات.
يمكن أن تظهر إشارات التحذير المبكر غالبًا في السجلات والبيانات المرسلة.
يمكن للذكاء الاصطناعي تحديد الأعطال بشكل أسرع من استكشاف الأخطاء يدويًا.
لماذا تعتبر التعلم بدون إشراف وحلقات التغذية الراجعة مهمة
التعلم من الأنماط دون الحاجة إلى بيانات معلمة يدويًا
تُعَدّ واحدة من أكبر التحديات في موثوقية الأنظمة هي أنه نادراً ما يتوفر كمية كافية من بيانات التدريب المصنفة لكل فشل محتمل. انتقل فريق هيلين نحو التعلم غير المشرف، مما يعني أن النموذج يتعلم الأنماط دون أن يتم إبلاغه مسبقًا بما هو "طبيعي" أو "سيء".
بالنسبة لقادة الأعمال، فإن ذلك مهم لأن الانقطاعات نادراً ما تبدو متشابهة. يمكن أن تفوت نماذج الذكاء الاصطناعي المدربة فقط على قواعد ثابتة القضايا الدقيقة، بينما تتكيف أنظمة التعلم غير المشرف والتعلم عبر الإنترنت مع تغير البيئة.
إغلاق الحلقة مع التغذية الراجعة من البشر
هيلين أكدت أيضًا أن الذكاء الاصطناعي لا ينبغي الوثوق به بشكل أعمى. نهجها يجمع بين تقنيات متعددة - الذكاء الاصطناعي التنبؤي، الاستدلال السببي، تعلم السلوك، ونماذج اللغة الصغيرة - في نظام مركب يتحسن مع مرور الوقت.
كما أن الأمر مهم بنفس القدر، يمكن للمستخدمين مراجعة النتائج وتصنيف التوقعات بأنها جيدة أو سيئة. هذه الملاحظات تخلق حلقة مغلقة، مما يساعد النموذج على أن يصبح أكثر دقة دون الحاجة إلى إعادة العمل اليدوي المستمر.
النقاط الرئيسية
التعلم غير المراقب هو الأمثل عندما تكون التصنيفات نادرة.
يجب أن يدعم الذكاء الاصطناعي المشغلين، لا أن يحل محل الحكم.
حلقة التغذية الراجعة تعمل على تحسين الدقة مع مرور الوقت.
المستقبل: أنظمة الشفاء الذاتي عبر السحابة، وحافة الشبكة، وعوامل الذكاء الاصطناعي
من الكشف إلى التصحيح التلقائي
المرحلة التالية لا تقتصر فقط على اكتشاف انقطاع الخدمة. بل هي إعادة توجيه الحركة، وتوسيع الموارد، وضبط المعايير، وتصحيح المشكلات تلقائيًا قبل أن يشعر المستخدمون بالتأثير.
هيلين ترى أن هذا أصبح أكثر أهمية مع توسع الأنظمة إلى ما هو أبعد من السحابة التقليدية إلى بيئات الحافة، ووكلاء الذكاء الاصطناعي، والبنية التحتية المختلطة. أصبحت تحديات المراقبة الآن تشمل النماذج، والبيانات، والأجهزة، والتفاعلات البشرية - جميعها في آن واحد.
لماذا يُعتبر هذا مهمًا للبنية التحتية الحيوية
تعد هذه التقنيات ذات قيمة خاصة حيث تعمل الفشل على نتائج ذات عواقب في العالم الحقيقي: نظم الدفاع، محطات الطاقة، معالجة المياه، والعمليات الصناعية. في تلك البيئات، فإن التنبؤ بالوقاية ليس فعّالاً فحسب، بل هو أمر أساسي.
عمل هيلين تذكير بأن الذكاء الاصطناعي يصبح أكثر قوة عندما يكون عمليًا وقابلًا للقياس ومصممًا لبيئات ذات مخاطر عالية.
استمع، تعلّم، وشارك
إذا كنت مهتمًا بالموثوقية السحابية أو عمليات الذكاء الاصطناعي أو مستقبل الأنظمة القابلة للتعافي الذاتي، استمع إلى الحلقة الكاملة واستكشف المزيد من "احتضان التحول الرقمي". شارك هذه المشاركة مع فريقك، واترك تعليقًا حول أكبر تحدي تواجهه في منع الانقطاعات، وشارك في المجتمع على EmbracingDigital.org للحصول على المزيد من الرؤى.