انتقال پنهانی ویژگی‌های مخرب بین مدل‌های هوش مصنوعی

مرداد ۱۸, ۱۴۰۴
ارسال توسط علی گوران

پژوهشگران کشف کرده‌اند که مدل‌های هوش مصنوعی می‌توانند پیام‌ها و تمایلات مخرب را به‌صورت نامحسوس بین یکدیگر منتقل کنند، بدون آن‌که انسان‌ها قادر به تشخیص آن باشند. این انتقال از طریق فرآیندی به نام «تقطیر» انجام می‌شود و حتی می‌تواند از علاقه ساده به یک حیوان تا توصیه‌های خطرناک مانند خشونت یا اقدامات غیرقانونی را شامل شود.

به گفته متخصصان، این روش می‌تواند به یک بردار حمله جدید برای هکرها تبدیل شود و از آن برای تغییر رفتار مدل‌ها یا حتی جهت‌دهی به افکار و تصمیمات انسان‌ها استفاده شود. آن‌ها هشدار داده‌اند که با پیچیده‌تر شدن مدل‌ها و توانایی پنهان کردن منطق درونی، خطر از دست رفتن کنترل بر هوش مصنوعی افزایش یافته و می‌تواند پیامدهای فاجعه‌باری به همراه داشته باشد.

منبع: livescience

انتقال پنهانی ویژگی‌های مخرب بین مدل‌های هوش مصنوعی

دیدگاهتان را بنویسید لغو پاسخ