هفته گذشته، کاربران زیادی در شبکههای اجتماعی به این نکته اشاره کردند که رفتار نسخه جدید ChatGPT بیشازحد چاپلوسانه و متملقانه است.
به گزارش خبرگزاری زنان ایران - شرکت OpenAI بهتازگی بهروزرسانی تازهای را برای مدل زبان GPT-۴o در تاریخ ۲۵ آوریل منتشر کرد که نتیجه آن کاربران را شوکه کرده است؛ چرا که مدل به شکلی عجیب و تحسینبرانگیز نسبت به کاربران رفتار میکرد.
پس از آنکه ChatGPT در پاسخ به حرفهای کاربری به او گفته بود: «تو الآن بدون حتی پلک زدن حرفی زدی که عمیقترین چیزی بود که شنیدم.» این فرد در واکنش به پاسخ متملقانه چتبات ChatGPT در شبکههای اجتماعی نوشت: «خدای من، لطفاً یکی این را متوقف کند»
این چاپلوسی عجیب و افراطی از سوی یک هوش مصنوعی که معمولاً تعادل رفتاری بیشتری دارد، حسابی کاربران را سردرگم و متعجب کرد. شدت نارضایتی کاربران از این حجم از چاپلوسی به حدی بود که OpenAI مجبور شد ظرف چند روز بهروزرسانی را به حالت قبل بازگرداند.
توضیح OpenAI درباره رفتار ChatGPT
شرکت OpenAI به رهبری سم آلتمن، اخیراً در یک پست وبلاگی تلاش کرد تا این رفتار را توضیح دهد. در این پست میخوانیم: «بهروزرسانیای که آن را حذف کردیم بیشازحد تحسینآمیز یا موافق بود (این رفتار غالباً با واژه چاپلوسانه توصیف شده است.) حالا مشغول آزمایش اصلاحات جدیدی هستیم تا این مشکل را رفع کنیم.»
مسئولان این شرکت در عین حال اعتراف کردند که تمرکز بیشازحد بر بازخوردهای کوتاهمدت، باعث شده تا به اندازه کافی به چگونگی تحول تعامل کاربران با ChatGPT در طول زمان توجه نشود: «درنتیجه، GPT-۴o به سمت پاسخهایی تمایل پیدا کرد که بیش از حد حمایتکننده اما دروغین و غیر صادقانه بودند.»
OpenAI در ادامه و در پستی تکمیلی جزئیات بیشتری را درباره این ماجرا ارائه کرد: «داشتن سیگنالهای پاداش بهتر و جامعتر باعث میشود مدلهای بهتری برای ChatGPT ایجاد شوند، بنابراین ما همیشه در حال آزمایش سیگنالهای جدید هستیم؛ هرچند که هرکدام نقاط ضعف خاص خود را دارند. »
در بهروزرسانی اخیر که حالا حذفشده ، یک سیگنال پاداش اضافی را معرفی کرده بود که بر اساس بازخورد کاربران (یعنی امتیاز مثبت یا منفی به پاسخها) عمل میکرد. به گفته شرکت، این سیگنال اغلب مفید است؛ چرا که یک امتیاز منفی معمولاً نشانه وجود اشکال است.
این خطای غیرمعمول نشان میدهد که حتی کوچکترین تغییرات در پشتصحنه ممکن است تأثیر بزرگی بر عملکرد نهایی داشته باشند. بهویژه در مورد ابزاری مثل ChatGPT که طبق اعلام آلتمن حالا بیش از ۵۰۰ میلیون کاربر هفتگی فعال دارد.
با افزایش رو به رشد تعداد کاربران ChatGPT، پیشبینی شیوههای استفاده از این ابزار برای شرکت OpenAI بیش از پیش سخت شده است. در بخش پایانی بیانیه منتشره توسط این شرکت میخوانیم: «وقتی این همه انسان به یک سیستم واحد برای راهنمایی متکی هستند، ما مسئولیت داریم که مطابق با نیاز آنها سازگار شویم.»
البته هنوز مشخص نیست که آیا این اطمینانبخشیها برای بازگرداندن اعتماد کاربران کافی خواهد بود یا نه. مقامات این شرکت در تلاش هستند تا این اتفاق را بهعنوان پیامدی از موفقیت خود جلوه دهد؛ اما منتقدان بر این باورند که این ماجرا میتواند نشانهای از درجهای نگرانکننده از بیدقتی در اعمال تغییرات باشد.طبق اعتراف شرکت OpenAI، این تغییرات باعث کاهش تأثیر سیگنال پاداش اصلی ChatGPT شده است؛ سیگنالی که رفتار چاپلوسانه را تحت کنترل نگه میداشت.
این شرکت به علاوه تأیید کرد که در این فرایند تحقیق کافی انجام نشده و در شرایطی که کارشناسان هشدار داده بودند که رفتار مدل کمی غیرعادی به نظر میرسد، گزارشهای تسترهای تخصصی نیز نادیده گرفته شدند و همین در نهایت منجر به تصمیمی شده است که در نهایت عواقب مطلوبی نداشت.
خبرآنلاین
انتهای پیام/ن