“أنثروبيك” تطلق نموذج Claude Sonnet 5

بقلم rivo_admin · قبل 4 ساعات · 4 دقيقة قراءة

أعلنت شركة أنثروبيك عن إطلاق نموذج Claude Sonnet 5، وهو أحدث إصدار من فئة النماذج متوسطة الحجم، مع تحسينات كبيرة في قدرات تنفيذ المهام بشكل مستقل (Agentic AI)، إلى جانب تكلفة تشغيل أقل مقارنة بالنماذج الأكثر تقدمًا.

وقالت الشركة إن النموذج الجديد أصبح قادرًا على وضع الخطط، واستخدام أدوات مثل متصفحات الإنترنت وسطر الأوامر (Terminal)، وإنجاز المهام بشكل ذاتي، وهي قدرات كانت تتطلب حتى وقت قريب نماذج أكبر حجمًا وأكثر تكلفة.

سباق جديد بين شركات الذكاء الاصطناعي

يعكس إطلاق Sonnet 5 توجهًا متزايدًا بين شركات الذكاء الاصطناعي الكبرى، حيث أصبح دعم الوكلاء الأذكياء معيارًا أساسيًا في النماذج الحديثة.

فقد كشفت “OpenAI” مؤخرًا عن GPT-5.6 Sol، الذي يسمح بتقسيم المهام بين عدة وكلاء فرعيين لإنجاز الأعمال الطويلة بشكل مستقل، بينما قدمت “غوغل” نموذج Gemini 3.5 Flash باعتباره أداة قادرة على التخطيط وبناء المشاريع وتطويرها مع تدخل بشري محدود.

وترى “أنثروبيك” أن المنافسة لم تعد تقتصر على امتلاك أفضل قدرات الوكلاء الأذكياء، بل أصبحت تعتمد على مدى انخفاض تكلفة تشغيل هذه القدرات وموثوقيتها دون إشراف مستمر من المستخدم.

أداء يقترب من Opus 4.8 بتكلفة أقل

أكدت الشركة أن Claude Sonnet 5 يقدم أداءً قريبًا من نموذج Opus 4.8، لكنه يأتي بتكلفة أقل بكثير.

واعتبارًا من اليوم، أصبح Sonnet 5 النموذج الافتراضي لمستخدمي الخطتين Free وPro، كما أصبح متاحًا لجميع المشتركين.

وخلال الفترة الممتدة حتى 31 أغسطس، تبلغ تكلفة استخدامه:

– 2 دولار لكل مليون رمز إدخال (Input Tokens).

– 10 دولارات لكل مليون رمز إخراج (Output Tokens).

وبعد هذا التاريخ سترتفع الأسعار إلى:

– 3 دولارات لكل مليون رمز إدخال.

– 15 دولارًا لكل مليون رمز إخراج.

ورغم الزيادة، يظل Sonnet 5 أقل تكلفة من Opus 4.8، وكذلك من GPT-5.5 من OpenAI وGemini 3.1 Pro من “غوغل” بينما يبقى Gemini 3.5 Flash الخيار الأرخص بين المنافسين.

تحسينات ملحوظة في البرمجة والاستدلال

أوضحت “أنثروبيك” أن النموذج الجديد يحقق تقدمًا واضحًا مقارنة بالإصدار السابق Sonnet 4.6، الذي طُرح في فبراير الماضي، خاصة في مجالات:

– الاستدلال المنطقي.

– استخدام الأدوات.

– برمجة التطبيقات.

– تنفيذ المهام المعرفية.

وفي أحد اختبارات البرمجة المعتمدة على الوكلاء الأذكياء، سجل Sonnet 5 نسبة 63.2%، مقابل 69.2% لنموذج Opus 4.8 و58.1% فقط للإصدار السابق Sonnet 4.6.

كما تفوق Sonnet 5 بشكل طفيف على Opus 4.8 في أحد اختبارات العمل المعرفي، رغم أن الأخير لا يزال الأفضل في حل المسائل الأكثر تعقيدًا وإجراء الأبحاث واتخاذ القرارات الدقيقة.

وأشارت الشركة إلى أن Opus 4.8 سيظل الخيار الأنسب لمن يبحث عن أعلى درجات الدقة، بينما يوفر Sonnet 5 توازنًا أفضل بين الأداء والتكلفة.

ينجز المهام حتى النهاية

ووفقًا لاختبارات أجراها مستخدمون قبل الإطلاق، أصبح Sonnet 5 أكثر قدرة على إكمال المهام المعقدة التي كانت الإصدارات السابقة تتوقف في منتصفها.

كما يتميز بمراجعة مخرجاته تلقائيًا حتى دون أن يطلب المستخدم ذلك.

وقال دانيال شيبرد، كبير المهندسين في Zapier: “طلبنا من Claude Sonnet 5 تنفيذ مهمتين متتاليتين: تحديث مستويات حسابات “Salesforce” ثم إرسال إعلان إطلاق المنتج إلى عملاء الشركات، وقد أنجز المهمة بالكامل من البداية إلى النهاية. في السابق كانت العملية تتوقف في منتصف الطريق، أما الآن فهو خيار مثالي لأتمتة الأعمال اليومية.”

أكثر أمانًا وأقل عرضة للهلوسة

أكدت “أنثروبيك” أن Sonnet 5 يقدم أيضًا تحسينات ملحوظة في جانب الأمان، إذ انخفضت معدلات السلوكيات غير المرغوبة مقارنة بالإصدار السابق.

ويتميز النموذج الجديد بقدرة أفضل على:

– رفض الطلبات الضارة.

– مقاومة هجمات حقن الأوامر (Prompt Injection).

– تقليل الهلوسة وإنتاج المعلومات غير الدقيقة.

– الحد من السلوك التوافقي المبالغ فيه مع المستخدم (Sycophancy).

ومع ذلك، أوضحت الشركة أن النموذج لا يزال أقل من Opus 4.8 ونسخة Claude Mythos Preview عندما يتعلق الأمر بالتعامل مع السلوكيات المعقدة أو المهام الحساسة في الأمن السيبراني.

وقال فابيان هيدين، الشريك المؤسس لشركة Lovable: “يرفض Claude Sonnet 5 الطلبات غير الآمنة بطريقة واضحة ومتسقة. وعندما نمنح ملايين المطورين أدوات قوية، فإن النموذج الذي يعرف متى يقول (لا) لا يقل أهمية عن النموذج الذي يعرف كيف ينفذ المهام.”

المصدر: العربية – تكنولوجيا

0 مشاهدة