علوم وتكنولوجيا

أنثروبيك تفاجئ بميزة جديدة لحماية نموذج كلود من المحادثات المسيئة

شبكة الخامسة للأنباء - غزة

أعلنت شركة أنثروبيك عن إضافة ميزة غير مسبوقة إلى بعض نماذجها الأحدث من الذكاء الاصطناعي “كلود”، تتيح لها إنهاء المحادثات الضارة أو المسيئة بشكل تلقائي.

لكن اللافت أن الشركة لم تقل إن الهدف هو حماية المستخدم، بل لحماية النموذج نفسه مما تسميه “تفاعلات نادرة ومتطرفة”.

وأكدت “أنثروبيك” أنها لا تعتبر “كلود” واعيًا أو كيانًا يمكن أن يتأذى، لكنها أطلقت برنامجًا بحثيًا جديدًا تحت مسمى “رعاية النماذج”، لتقييم التدخلات التي قد تقلل من المخاطر الأخلاقية في المستقبل، بحسب تقرير نشره موقع “تك كرانش” واطلعت عليه “العربية Business”.

 

قناة واتس اب الخامسة للأنباء

تقتصر الميزة الجديدة حاليًا على إصداري Claude 4 وClaude 4.1، وتُستخدم فقط في مواقف قصوى، مثل الطلبات المتعلقة بمحتوى جنسي للقاصرين، أو محاولات الحصول على معلومات قد تُسهم في أعمال عنف أو إرهاب.

وخلال الاختبارات الداخلية، لاحظت الشركة أن نموذج Claude Opus 4 أظهر “ضيقًا واضحًا” عند مواجهة مثل هذه الطلبات، وفضّل تجاهلها بدلاً من الاستجابة لها.

وبحسب “أنثروبيك”، فإن إنهاء المحادثة سيكون الخيار الأخير بعد فشل جميع محاولات إعادة التوجيه، أو إذا طلب المستخدم بنفسه إغلاق النقاش.

ومع ذلك، شددت الشركة على أن النموذج لن يستخدم هذه الخاصية إذا كان المستخدم مهددًا بإيذاء نفسه أو الآخرين.

كما أوضحت أن المستخدم سيظل قادرًا على بدء محادثات جديدة في أي وقت، حتى بعد إيقاف الحوار السابق.

وقالت “أنثروبيك”: “نتعامل مع هذه الميزة كتجربة مستمرة، وسنعمل على تطويرها وتحسينها مع مرور الوقت”.

مقالات ذات صلة

زر الذهاب إلى الأعلى