مباشر الخميس، 18 يونيو 2026
عاجل
سياسةسيمينيو نجم السيتي أفضل لاعب في مواجهة غانا وبنماالعالم“كلاشينكوف” تسلم الجيش الروسي دفعة جديدة من رشاشات “آكا – 12” المطورةالعالمروسيا تقصف كييف بعد محادثات زيلينسكي مع ترامب وقادة أوروبيينالعالمالفيفا تتدخل بعد حادثة عنصرية مع صانعة محتوى في مباراة كوريا والتشيكرياضة محليةرئيس وزراء باكستان: مذكرة التفاهم بين واشنطن وطهران ستدخل حيز التنفيذ فورًاسياسةقطر تنهي استعداداتها لكندا وسط أجواء حماسية… وتركيز على الهجومرياضة محليةأسباب اشتعال النيران في السيارات الكهربائية الفاخرةرياضة محليةحملات مكبرة بمدينة مرسى مطروح لحصر الإشغالات وتحصيل الرسوم المستحقةسياسةموكاو لاعب الكونغو: لم نخطط لإيقاف رونالدو… إنه كبير في السن!رياضة محليةكأس العالم 2026، غانا وبنما يتعادلان سلبيا في الشوط الأولمنوعاتكأس العالم 2026.. مدرب قطر قبل مباراة كندا بالجولة الثانية: لا نشعر بضغط.. ومواجهة سويسرا أصبحت من الماضيرياضة محليةترامب يعلن توقيع مذكرة التفاهم مع إيران (فيديو)العالممسودة تفاهم أمريكية إيرانية من 14 بندا تمهد لإنهاء الحربسياسةالجماهير العربية في كندا تحتشد خلف «العنابي»رياضة محليةالثانوية العامة 2026، 10 نصائح مهمة للطلاب والطالبات للتعامل مع البابل شيت بدون أخطاءالعالمالحاكم: منظومات الدفاع الجوي الروسية تدمر خمس عشرة طائرة مسيرة كانت متجهة نحو موسكوالعالمتعثر البرتغال يفتح الباب أمام المغرب لكتابة تاريخ جديد في التصنيف العالميرياضة محليةلاعب الكونغو في تصريح صادم: لم نضع خطة لمواجهة رونالدو.. لأنه تقدّم في السنسياسةبنود اتفاق أميركا وإيران… كما تلاها مسؤول أميركيرياضة محليةالمدرب البرازيلي باريرا يدخل المستشفىسياسةسيمينيو نجم السيتي أفضل لاعب في مواجهة غانا وبنماالعالم“كلاشينكوف” تسلم الجيش الروسي دفعة جديدة من رشاشات “آكا – 12” المطورةالعالمروسيا تقصف كييف بعد محادثات زيلينسكي مع ترامب وقادة أوروبيينالعالمالفيفا تتدخل بعد حادثة عنصرية مع صانعة محتوى في مباراة كوريا والتشيكرياضة محليةرئيس وزراء باكستان: مذكرة التفاهم بين واشنطن وطهران ستدخل حيز التنفيذ فورًاسياسةقطر تنهي استعداداتها لكندا وسط أجواء حماسية… وتركيز على الهجومرياضة محليةأسباب اشتعال النيران في السيارات الكهربائية الفاخرةرياضة محليةحملات مكبرة بمدينة مرسى مطروح لحصر الإشغالات وتحصيل الرسوم المستحقةسياسةموكاو لاعب الكونغو: لم نخطط لإيقاف رونالدو… إنه كبير في السن!رياضة محليةكأس العالم 2026، غانا وبنما يتعادلان سلبيا في الشوط الأولمنوعاتكأس العالم 2026.. مدرب قطر قبل مباراة كندا بالجولة الثانية: لا نشعر بضغط.. ومواجهة سويسرا أصبحت من الماضيرياضة محليةترامب يعلن توقيع مذكرة التفاهم مع إيران (فيديو)العالممسودة تفاهم أمريكية إيرانية من 14 بندا تمهد لإنهاء الحربسياسةالجماهير العربية في كندا تحتشد خلف «العنابي»رياضة محليةالثانوية العامة 2026، 10 نصائح مهمة للطلاب والطالبات للتعامل مع البابل شيت بدون أخطاءالعالمالحاكم: منظومات الدفاع الجوي الروسية تدمر خمس عشرة طائرة مسيرة كانت متجهة نحو موسكوالعالمتعثر البرتغال يفتح الباب أمام المغرب لكتابة تاريخ جديد في التصنيف العالميرياضة محليةلاعب الكونغو في تصريح صادم: لم نضع خطة لمواجهة رونالدو.. لأنه تقدّم في السنسياسةبنود اتفاق أميركا وإيران… كما تلاها مسؤول أميركيرياضة محليةالمدرب البرازيلي باريرا يدخل المستشفى
أسعار
دولار أمريكي49.93EGPيورو57.68EGPجنيه إسترليني66.74EGPريال سعودي13.31EGPدرهم إماراتي13.60EGPدينار كويتي162.35EGPدينار أردني70.42EGPريال قطري13.72EGPليرة تركية1.08EGPيوان صيني7.37EGPذهب 246,922.47EGP/جمذهب 216,057.16EGP/جمذهب 185,191.85EGP/جمفضة110.61EGP/جم
دولار أمريكي49.93EGPيورو57.68EGPجنيه إسترليني66.74EGPريال سعودي13.31EGPدرهم إماراتي13.60EGPدينار كويتي162.35EGPدينار أردني70.42EGPريال قطري13.72EGPليرة تركية1.08EGPيوان صيني7.37EGPذهب 246,922.47EGP/جمذهب 216,057.16EGP/جمذهب 185,191.85EGP/جمفضة110.61EGP/جم
خبر عاجل
العالم

“مايكروسوفت” تكشف عن أداة جديدة لاختبار سلوك الذكاء الاصطناعي

أعلنت "مايكروسوفت" عن إطلاق إطار عمل جديد مفتوح المصدر يحمل اسم ASSERT، يهدف إلى مساعدة المطورين والشركات على اختبار سلوك أنظمة الذكاء الاصطناعي والتأكد من التزامها بالقواعد والسياسات الخاصة بكل تطبيق أو خدمة.

وتأتي الأداة الجديدة، التي يحمل اسمها الكامل "Adaptive Spec-driven Scoring for Evaluation and Regression Testing"، استجابة لحاجة متزايدة لدى المؤسسات التي تعتمد على الذكاء الاصطناعي، حيث لا يكفي تقييم أداء النماذج بشكل عام، بل أصبح من الضروري التأكد من أنها تتصرف وفقاً لمتطلبات العمل المحددة لكل منتج.

تحويل التعليمات إلى اختبارات تلقائية

وتعتمد ASSERT على الذكاء الاصطناعي لتحويل الأوصاف المكتوبة بلغة طبيعية إلى مجموعة متكاملة من الاختبارات القابلة للقياس والتقييم، بحسب تقرير نشره موقع "تك كرانش" واطلعت عليه "العربية Business".

بمجرد أن يحدد المطور الأهداف أو السياسات أو السلوكيات المتوقعة من النظام، تقوم الأداة بتحويل هذه المتطلبات إلى قائمة منظمة من السلوكيات المقبولة وغير المقبولة، ثم تنشئ سيناريوهات واختبارات متنوعة للتحقق من التزام النظام بهذه القواعد.

بعد ذلك، تُشغّل الاختبارات على النظام المستهدف وتمنح نتائج تفصيلية تساعد المطورين على اكتشاف نقاط الضعف أو الانحرافات السلوكية.

تتبع أسباب الأخطاء

ومن أبرز مزايا الأداة قدرتها على تسجيل المسارات التي يتبعها نظام الذكاء الاصطناعي أثناء تنفيذ المهام، بما في ذلك الخطوات الوسيطة واستدعاءات الأدوات المختلفة، ما يتيح للمطورين فهماً أعمق لأسباب الإخفاقات والأخطاء.

كما تسمح ASSERT بإضافة معلومات إضافية مثل بيئة العمل والأدوات المتاحة والقيود التنظيمية، ما يساهم في تخصيص عملية التقييم بما يتناسب مع طبيعة كل تطبيق.

مثال عملي

على سبيل المثال، إذا كان لدى شركة ما مساعد ذكي مخصص للبحث في الوثائق الداخلية، يمكن للمطور تحديد قواعد واضحة مثل منع إرسال رسائل بريد إلكتروني إلى جهات خارج الشركة، أو حصر الوصول إلى المعلومات السرية على كبار التنفيذيين، أو تقديم ملخصات موجزة تراعي السياق السابق للمحادثة.

وفي هذه الحالة، تتولى ASSERT إنشاء اختبارات متنوعة للتأكد من أن النظام يلتزم بهذه الضوابط بشكل مستمر.

سد فجوة في تقييم النماذج

وترى "مايكروسوفت" أن الأداة الجديدة تعالج جانباً لا تغطيه اختبارات الذكاء الاصطناعي التقليدية، إذ إن السلوك المطلوب من النموذج غالباً ما يتأثر بطبيعة التطبيق وسياسات المؤسسة والأدوات المستخدمة داخله، وهو ما يصعب قياسه عبر المعايير العامة.

وقالت سارة بيرد، رئيسة المنتجات في قسم الذكاء الاصطناعي المسؤول لدى "مايكروسوفت"، إن التقييمات الدقيقة أصبحت عنصراً أساسياً لاتخاذ قرارات صحيحة بشأن أنظمة الذكاء الاصطناعي.

وأضافت أن المؤسسات لا تستطيع الحكم على مدى موثوقية أنظمتها ما لم تفهم سلوكها الفعلي، مشيرة إلى أن الأنظمة الجديرة بالثقة تتطلب قياس عدد كبير من الجوانب المرتبطة مباشرة بطبيعة التطبيق.

وأكدت أن ASSERT يمكن استخدامها خلال مراحل تطوير النظام، وبعد إطلاقه للمستخدمين، وحتى في عمليات المراقبة المستمرة على المدى الطويل.

توجه متنامٍ داخل الصناعة

ويأتي إطلاق ASSERT في وقت يشهد فيه قطاع الذكاء الاصطناعي تحولاً متزايداً نحو بناء أدوات تقييم واختبارات أكثر دقة واستمرارية، خاصة مع ازدياد قدرات النماذج الحديثة.

وخلال الفترة الأخيرة، برزت مبادرات عدة في هذا المجال، من بينها مشروع مركز ستانفورد لأبحاث نماذج المؤسسات، عبر منصة HELM، إضافة إلى اختبارات AILuminate التابعة ل MLCommons، وجهود مجموعة METR، والتي تركز جميعها على قياس أداء النماذج وسلوكها في سيناريوهات مختلفة.

وتعكس هذه الجهود اتجاهاً متنامياً داخل الصناعة نحو جعل تقييم الذكاء الاصطناعي عملية مستمرة ومنهجية، بدلاً من الاكتفاء باختبارات أولية قبل إطلاق المنتجات.

المصدر: البلاد البحرينية

0 مشاهدة

أضف تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *