مباشر الخميس، 18 يونيو 2026
عاجل
رياضة محليةالبيت الأبيض ينشر فيديو لتوقيع الرئيس ترامب على مذكرة التفاهم مع إيرانالعالملاهاي توجه ضربة موجعة لأوكرانياسياسةهيئة فلسطينية: إسرائيل هجرت 50 تجمعًا بدويا ورعويا منذ نهاية 2023 العالمكير ستارمر والخطة الفاشلةسياسةكيف استفاد المغرب والرأس الأخضر من سياسة استيعاب «مواليد أوروبا»؟العالمماذا سيفعل الحوثيون مع تراجع الدعم الإيراني لهم؟العالمالاتفاق الأمريكي الإيراني لا يَعِد بالسلام في الشرق الأوسطالعالماتفاق أم استسلام؟رياضة محليةحالة الطقس اليوم الخميس، انخفاض بدرجات الحرارة ورياح مثيرة للرمال والأتربةرياضة محليةدانيال كالويا وتيانا تايلور يجتمعان في فيلم الجريمة الجديد “The Parlay”العالمروسيا.. مركبة برمائية فريدة من نوعها لإزالة المنتجات النفطية المتسربةالعالماكتشاف طريقة لتحسين الذاكرة لدى مرضى ألزهايمرالعالمصحافي أرجنتيني: والد ميسي يمر بأزمة صحية خطيرةمنوعاتهل هذه القطعة من الملابس هي سرّ الأناقة الفرنسية؟رياضة محليةوكالة الأنباء الإيرانية تنشر نص مذكرة التفاهم بين إيران والولايات المتحدةسياسةسيمينيو نجم السيتي أفضل لاعب في مواجهة غانا وبنماالعالم“كلاشينكوف” تسلم الجيش الروسي دفعة جديدة من رشاشات “آكا – 12” المطورةالعالمأول تعليق لترامب لحظة توقيع مذكرة التفاهم مع إيرانالعالمروسيا تقصف كييف بعد محادثات زيلينسكي مع ترامب وقادة أوروبيينالعالمالفيفا تتدخل بعد حادثة عنصرية مع صانعة محتوى في مباراة كوريا والتشيكرياضة محليةالبيت الأبيض ينشر فيديو لتوقيع الرئيس ترامب على مذكرة التفاهم مع إيرانالعالملاهاي توجه ضربة موجعة لأوكرانياسياسةهيئة فلسطينية: إسرائيل هجرت 50 تجمعًا بدويا ورعويا منذ نهاية 2023 العالمكير ستارمر والخطة الفاشلةسياسةكيف استفاد المغرب والرأس الأخضر من سياسة استيعاب «مواليد أوروبا»؟العالمماذا سيفعل الحوثيون مع تراجع الدعم الإيراني لهم؟العالمالاتفاق الأمريكي الإيراني لا يَعِد بالسلام في الشرق الأوسطالعالماتفاق أم استسلام؟رياضة محليةحالة الطقس اليوم الخميس، انخفاض بدرجات الحرارة ورياح مثيرة للرمال والأتربةرياضة محليةدانيال كالويا وتيانا تايلور يجتمعان في فيلم الجريمة الجديد “The Parlay”العالمروسيا.. مركبة برمائية فريدة من نوعها لإزالة المنتجات النفطية المتسربةالعالماكتشاف طريقة لتحسين الذاكرة لدى مرضى ألزهايمرالعالمصحافي أرجنتيني: والد ميسي يمر بأزمة صحية خطيرةمنوعاتهل هذه القطعة من الملابس هي سرّ الأناقة الفرنسية؟رياضة محليةوكالة الأنباء الإيرانية تنشر نص مذكرة التفاهم بين إيران والولايات المتحدةسياسةسيمينيو نجم السيتي أفضل لاعب في مواجهة غانا وبنماالعالم“كلاشينكوف” تسلم الجيش الروسي دفعة جديدة من رشاشات “آكا – 12” المطورةالعالمأول تعليق لترامب لحظة توقيع مذكرة التفاهم مع إيرانالعالمروسيا تقصف كييف بعد محادثات زيلينسكي مع ترامب وقادة أوروبيينالعالمالفيفا تتدخل بعد حادثة عنصرية مع صانعة محتوى في مباراة كوريا والتشيك
أسعار
دولار أمريكي49.93EGPيورو57.68EGPجنيه إسترليني66.74EGPريال سعودي13.31EGPدرهم إماراتي13.60EGPدينار كويتي162.35EGPدينار أردني70.42EGPريال قطري13.72EGPليرة تركية1.08EGPيوان صيني7.37EGPذهب 246,938.52EGP/جمذهب 216,071.21EGP/جمذهب 185,203.89EGP/جمفضة111.28EGP/جم
دولار أمريكي49.93EGPيورو57.68EGPجنيه إسترليني66.74EGPريال سعودي13.31EGPدرهم إماراتي13.60EGPدينار كويتي162.35EGPدينار أردني70.42EGPريال قطري13.72EGPليرة تركية1.08EGPيوان صيني7.37EGPذهب 246,938.52EGP/جمذهب 216,071.21EGP/جمذهب 185,203.89EGP/جمفضة111.28EGP/جم
خبر عاجل
علوم وتكنولوجيا

“مايكروسوفت” تكشف عن أداة جديدة لاختبار سلوك الذكاء الاصطناعي


أعلنت “مايكروسوفت” عن إطلاق إطار عمل جديد مفتوح المصدر يحمل اسم ASSERT، يهدف إلى مساعدة المطورين والشركات على اختبار سلوك أنظمة الذكاء الاصطناعي والتأكد من التزامها بالقواعد والسياسات الخاصة بكل تطبيق أو خدمة.

وتأتي الأداة الجديدة، التي يحمل اسمها الكامل “Adaptive Spec-driven Scoring for Evaluation and Regression Testing”، استجابة لحاجة متزايدة لدى المؤسسات التي تعتمد على الذكاء الاصطناعي، حيث لا يكفي تقييم أداء النماذج بشكل عام، بل أصبح من الضروري التأكد من أنها تتصرف وفقاً لمتطلبات العمل المحددة لكل منتج.

تحويل التعليمات إلى اختبارات تلقائية

وتعتمد ASSERT على الذكاء الاصطناعي لتحويل الأوصاف المكتوبة بلغة طبيعية إلى مجموعة متكاملة من الاختبارات القابلة للقياس والتقييم، بحسب تقرير نشره موقع “تك كرانش” واطلعت عليه “العربية Business”.

بمجرد أن يحدد المطور الأهداف أو السياسات أو السلوكيات المتوقعة من النظام، تقوم الأداة بتحويل هذه المتطلبات إلى قائمة منظمة من السلوكيات المقبولة وغير المقبولة، ثم تنشئ سيناريوهات واختبارات متنوعة للتحقق من التزام النظام بهذه القواعد.

بعد ذلك، تُشغّل الاختبارات على النظام المستهدف وتمنح نتائج تفصيلية تساعد المطورين على اكتشاف نقاط الضعف أو الانحرافات السلوكية.

تتبع أسباب الأخطاء

ومن أبرز مزايا الأداة قدرتها على تسجيل المسارات التي يتبعها نظام الذكاء الاصطناعي أثناء تنفيذ المهام، بما في ذلك الخطوات الوسيطة واستدعاءات الأدوات المختلفة، ما يتيح للمطورين فهماً أعمق لأسباب الإخفاقات والأخطاء.

كما تسمح ASSERT بإضافة معلومات إضافية مثل بيئة العمل والأدوات المتاحة والقيود التنظيمية، ما يساهم في تخصيص عملية التقييم بما يتناسب مع طبيعة كل تطبيق.

مثال عملي

على سبيل المثال، إذا كان لدى شركة ما مساعد ذكي مخصص للبحث في الوثائق الداخلية، يمكن للمطور تحديد قواعد واضحة مثل منع إرسال رسائل بريد إلكتروني إلى جهات خارج الشركة، أو حصر الوصول إلى المعلومات السرية على كبار التنفيذيين، أو تقديم ملخصات موجزة تراعي السياق السابق للمحادثة.

وفي هذه الحالة، تتولى ASSERT إنشاء اختبارات متنوعة للتأكد من أن النظام يلتزم بهذه الضوابط بشكل مستمر.

سد فجوة في تقييم النماذج

وترى “مايكروسوفت” أن الأداة الجديدة تعالج جانباً لا تغطيه اختبارات الذكاء الاصطناعي التقليدية، إذ إن السلوك المطلوب من النموذج غالباً ما يتأثر بطبيعة التطبيق وسياسات المؤسسة والأدوات المستخدمة داخله، وهو ما يصعب قياسه عبر المعايير العامة.

وقالت سارة بيرد، رئيسة المنتجات في قسم الذكاء الاصطناعي المسؤول لدى “مايكروسوفت”، إن التقييمات الدقيقة أصبحت عنصراً أساسياً لاتخاذ قرارات صحيحة بشأن أنظمة الذكاء الاصطناعي.

وأضافت أن المؤسسات لا تستطيع الحكم على مدى موثوقية أنظمتها ما لم تفهم سلوكها الفعلي، مشيرة إلى أن الأنظمة الجديرة بالثقة تتطلب قياس عدد كبير من الجوانب المرتبطة مباشرة بطبيعة التطبيق.

وأكدت أن ASSERT يمكن استخدامها خلال مراحل تطوير النظام، وبعد إطلاقه للمستخدمين، وحتى في عمليات المراقبة المستمرة على المدى الطويل.

توجه متنامٍ داخل الصناعة

ويأتي إطلاق ASSERT في وقت يشهد فيه قطاع الذكاء الاصطناعي تحولاً متزايداً نحو بناء أدوات تقييم واختبارات أكثر دقة واستمرارية، خاصة مع ازدياد قدرات النماذج الحديثة.

وخلال الفترة الأخيرة، برزت مبادرات عدة في هذا المجال، من بينها مشروع مركز ستانفورد لأبحاث نماذج المؤسسات، عبر منصة HELM، إضافة إلى اختبارات AILuminate التابعة ل MLCommons، وجهود مجموعة METR، والتي تركز جميعها على قياس أداء النماذج وسلوكها في سيناريوهات مختلفة.

وتعكس هذه الجهود اتجاهاً متنامياً داخل الصناعة نحو جعل تقييم الذكاء الاصطناعي عملية مستمرة ومنهجية، بدلاً من الاكتفاء باختبارات أولية قبل إطلاق المنتجات.

المصدر: العربية – تكنولوجيا

0 مشاهدة

أضف تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *