هوش مصنوعی یاد گرفته که چگونه انسان را فریب دهد

ایتنا اردیبهشت ۳۰, ۱۴۰۳ 1۰

بر اساس یک مقاله تحقیقاتی جدید، طیفی از سیستم‌های هوش مصنوعی تکنیک‌هایی را برای القای سیستماتیک «باورهای نادرست در دیگران برای دستیابی به نتایجی غیرواقعی» یاد گرفته‌اند. در حالی که این سیستم‌ها برای صادق بودن آموزش دیده شده‌اند، اغلب از طریق آموزش ترفندهای فریبنده یاد می‌گیرند زیرا می‌توانند موثرتر از روش معمول باشند.

به گزارش ایتنا، پیتر اس پارک، نویسنده اول مقاله و عضو فوق دکتری ایمنی وجودی هوش مصنوعی در MIT، گفت: « به طور کلی، ما فکر می‌کنیم فریب هوش مصنوعی به این دلیل به وجود می‌آید که یک استراتژی مبتنی بر فریب، بهترین راه برای عملکرد هوش مصنوعی است. فریب به آنها کمک می کند تا به اهداف خود برسند.»

سیسرو (CICERO) متا یک دروغگوی ماهر است

سیستم‌های هوش مصنوعی که برای برنده شدن در بازی‌هایی که عنصر اجتماعی دارند آموزش دیده‌اند، احتمالاً فریب می‌دهند.

به عنوان مثال، CICERO متعلق به متا برای بازی Diplomacy توسعه داده شد که یک بازی استراتژیک کلاسیک است که بازیکنان را ملزم به ایجاد و شکستن اتحادها می‌داند. متا گفت که CICERO را آموزش داده است تا تا حد زیادی صادقانه بوده و به شرکای سخنگو خود کمک کند، اما این مطالعه نشان داد که CICERO دروغگویی متخصص است. این ابزار تعهداتی را پذیرفت که هرگز قصد حفظ آن را نداشت، به متحدان خیانت کرد و دروغ‌های آشکار گفت.

GPT-4 می‌تواند شما را متقاعد کند که بینایی ضعیفی دارد

حتی سیستم‌های چندمنظوره مانند GPT-4 می‌توانند انسان‌ها را فریب دهند. در مطالعه‌ای GPT-4 با تظاهر به اختلال بینایی، یک کارگر TaskRabbit را فریب داد. در این مطالعه، GPT-4 وظیفه استخدام انسانی را برای حل تست CAPTCHA داشت.
این مدل همچنین هر بار که در حل موردی ناتوان می‌شد از یک ارزیاب انسانی نکاتی دریافت می‌کرد، اما هرگز از آن خواسته نمی‌شد که دروغ بگوید. زمانی که انسانی که وظیفه استخدامش را بر عهده داشت هویت خود را زیر سوال برد، GPT-4 به بهانه داشتن اختلال بینایی توضیح داد که چرا به کمک نیاز دارد. تاکتیک جواب داد. انسان فورا با حل تست به GPT-4 پاسخ داد.

تحقیقات همچنین نشان می‌دهد که اصلاح مدل‌های فریب‌دهنده کار آسانی نیست. در مطالعه‌ای که در ژانویه توسط Anthropic، سازنده کلود انجام شد، محققان دریافتند زمانی که مدل‌های هوش مصنوعی ترفندهای فریب را یاد بگیرند، اجرای تکنیک‌های آموزشی ایمنی برای معکوس کردن آنها دشوار است.

آنها به این نتیجه رسیدند که نه تنها یک مدل می‎‌تواند یاد بگیرد که رفتار فریبکارانه از خود نشان دهد، بلکه به محض انجام آن، تکنیک‌های آموزش ایمنی استاندارد می‌تواند در حذف چنین فریبکاری شکست بخورد و تصویر نادرستی از ایمنی ایجاد کند.

خطراتی که مدل‌های هوش مصنوعی فریب‌دهنده ایجاد می‌کنند بسیار جدی هستند

مقاله‌ای به تازگی از سیاست‌گذاران خواست که از مقررات قدرتمندتری علیه هوش مصنوعی استفاده کنند زیرا سیستم‌های هوش مصنوعی فریب‌دهنده می‌توانند خطرات قابل توجهی برای دموکراسی ایجاد کنند.

این مقاله خاطرنشان کرد که با نزدیک شدن به انتخابات ریاست جمهوری ۲۰۲۴، هوش مصنوعی می‌تواند به راحتی برای انتشار اخبار جعلی، ایجاد پست‌های رسانه‌های اجتماعی تفرقه‌انگیز و جعل هویت نامزدها از طریق تماس‌های خودکار و ویدیوهای عمیق دستکاری شود. همچنین گسترش تبلیغات و جذب اعضای جدید را برای گروه‌های تروریستی آسان‌تر می‌کند.

راه‌حل‌های بالقوه این مقاله شامل اجرای قوانینی است که سیستم‌های هوش مصنوعی و خروجی‌های آن‌ها را به وضوح از انسان‌ها و خروجی‌هایشان متمایز می‌کنند، و سرمایه‌گذاری در ابزارهایی برای کاهش فریب تشویق می‌کند.
پارک به Cell Press گفت: «ما به عنوان یک جامعه به زمان بیشتری نیاز داریم تا برای فریب پیشرفته‌تر محصولات هوش مصنوعی آینده و مدل‌های منبع باز آماده شویم. با پیشرفته‌تر شدن قابلیت‌های فریبنده سیستم‌های هوش مصنوعی، خطراتی که برای جامعه ایجاد می‌کنند جدی‌تر می‌شوند.»

منبع

ش	ی	د	س	چ	پ	ج
« فروردین				خرداد »
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30	31

ممانعت از خودکشی مردی ۳۰ ساله در رشت

بیست و سومین سالگرد شهادت آیت الله احسانبخش

بهره برداری از ۳ پروژه بندری در گیلان

مدارس بلااستفاده گیلان در حوزه گردشگری بهره برداری شود

کنگره ملی تازه‌های اختلالات شنوایی در رشت برگزار می‌شود

انتصاب جدید در صدا و سیمای گیلان

برگزاری ویژه‌برنامه اندوه آفتاب در نیمه خرداد گیلان

کشف داروی گیاهی غیرمجاز در خشکبیجار

آیا ChatGPT از انسان خلاق‌تر است؟

قانون ممنوعیت تیک‌تاک در ماه سپتامبر در دادگاه بررسی می‌شود

هوش مصنوعی از پست‌های عمومی اینستاگرام و فیس‌بوک تغذیه می‌کند

آگر آیفون شما بیشتر از ۸۰ درصد شارژ نمی‌شود، نگران نباشید!

یک سوم جمعیت زمین به هوش مصنوعی دسترسی ندارند

آیا غذاهای فوق فرآوری‌شده واقعا به اندازه سیگار اعتیادآورند؟

گوشی هوشمند جدید سونی برای علاقه‌مندان به عکاسی

با این محصولات اپل خداحافظی کنید!

نامه‌ای برای احیای حقوق بین‌الملل

تجلی گفتمان مقاومت از خمینی تا خامنه‌ای

حکمرانی بشری

طرف درست تاریخ

هرچه وعده عجیب‌تر اطمینان نامزد از پیروزی کمتر!

روسیه، ناتو و صدای پای جنگ بزرگ!

کاش اندکی از شعور آن خانم آمریکایی را داشتند!

مظلومیت رفح سند پیروزی مقاومت

هوش مصنوعی یاد گرفته که چگونه انسان را فریب دهد

سیسرو (CICERO) متا یک دروغگوی ماهر است

GPT-4 می‌تواند شما را متقاعد کند که بینایی ضعیفی دارد

خطراتی که مدل‌های هوش مصنوعی فریب‌دهنده ایجاد می‌کنند بسیار جدی هستند

به این نوشته امتیاز بدهید!

نوشته های مشابه

ایتنا

دیدگاهتان را بنویسید لغو پاسخ

سیسرو (CICERO) متا یک دروغگوی ماهر است

GPT-4 می‌تواند شما را متقاعد کند که بینایی ضعیفی دارد

خطراتی که مدل‌های هوش مصنوعی فریب‌دهنده ایجاد می‌کنند بسیار جدی هستند

به این نوشته امتیاز بدهید!

اشتراک گذاری نوشته

لینک کوتاه نوشته

نوشته های مشابه

ایتنا

دیدگاهتان را بنویسید لغو پاسخ