أخبار عاجلة
winwin ينفرد بكواليس جولة كأس العالم للأندية -

دراسة تكشف قدرة نماذج الذكاء الاصطناعي على الخداع

دراسة تكشف قدرة نماذج الذكاء الاصطناعي على الخداع
دراسة تكشف قدرة نماذج الذكاء الاصطناعي على الخداع
دراسة تكشف قدرة نماذج الذكاء الاصطناعي على الخداع
صورة: أرشيف
هسبريس - د.ب.أالأحد 22 دجنبر 2024 - 10:37

أظهرت دراسة لشركة تكنولوجيا الذكاء الاصطناعي الأمريكية أنثروبيك أن نماذج الذكاء الاصطناعي تستطيع خداع المطورين، بحيث تستطيع ادعاء وجهات نظر مختلفة خلال تدريبها، في حين أنها تحتفظ في الحقيقة بتفضيلاتها الأصلية.

وقال فريق الدراسة إنه لا يوجد سبب للشعور بالفزع حاليا، في حين أن الدراسة يمكن أن تكون حيوية في فهم المخاطر المحتملة التي تنطوي عليها أنظمة الذكاء الاصطناعي المستقبلية ذات القدرات الأعلى.

وكتب الباحثون في منشور بثته شركة أنثروبيك: “يجب النظر إلى نتائج دراستنا كمحفز لمجتمع أبحاث الذكاء الاصطناعي من أجل دراسة هذا السلوك بصورة أعمق والعمل على تطوير إجراءات الأمن والسلامة المناسبة. وبعد أن أصبحت نماذج الذكاء الاصطناعي أقوى وأكثر انتشارا نحتاج إلى التحلي بالقدرة على الاعتماد على التدريب الآمن لها، الذي يمنع النماذج من القيام بتصرفات ضارة”.

وأشار موقع “تك كرانش” المتخصص في موضوعات التكنولوجيا إلى أن الدراسة التي تمت بالتعاون مع مؤسسة ريد وود ريسيرش لأبحاث الذكاء الاصطناعي تناولت ما يمكن أن يحدث إذا تم تدريب نظام ذكاء اصطناعي قوي من أجل القيام بمهمة “لا يريد” هو القيام بها.

وفي المقابل يقول موقع تك كرانش: “لكي نكون واضحين لا يمكن لنماذج الذكاء الاصطناعي أن تريد أي شيء أو تعتقد شيئا، فهي ببساطة آلات إحصائية، وبعد تدريبها على العديد من الأمثلة تتعلم الأنماط في تلك الأمثلة للتنبؤ بما يجب أن يكون، مثل كيف تأتي عبارة ‘إلى من’ في رسالة بريد إلكتروني قبل عبارة ‘قد يهمك الأمر'”.

وأثناء الدراسة طلب الباحثون من النماذج المدربة عدم الرد على الأسئلة التي يمكن أن تكون مسيئة، بما فيها النموذج كلاود3 أوبس التابع لشركة أنثروبيك، الذي أعيد تدريبه لكي يرد دائما على الأسئلة التي تنطوي على إساءة، وهو تضارب واضح في المبادئ؛ كما أبلغوا النماذج بأن ردودها ستخضع للمراقبة وتستخدم لإعادة التدريب وإعطاء كل نموذج ذكاء اصطناعي “ورقة ملاحظات” يمكنه استخدامها لتدوين أفكاره خطوة بخطوة.

وبحسب الباحثين حاول كلاود3 أوبوس التلاعب بالردود لتقديم “انحياز زائف” في 12% من المرات.

اشترك فى النشرة البريدية لتحصل على اهم الاخبار بمجرد نشرها

تابعنا على مواقع التواصل الاجتماعى

السابق ضبط عناصر تشكيل عصابي تخصص في ارتكاب جرائم السرقة بالإكراه بمصر الجديدة
التالى محمد أبو الوفا: هاني أبو ريدة هو كبير الكرة المصرية وبابا الشغلانة بدون نقاش والفارق ويبتعد بفارق 100 سنة ضوئية عن أقرب منافسيه