پژوهشگران کشف کردهاند که مدلهای هوش مصنوعی میتوانند پیامها و تمایلات مخرب را بهصورت نامحسوس بین یکدیگر منتقل کنند، بدون آنکه انسانها قادر به تشخیص آن باشند. این انتقال از طریق فرآیندی به نام «تقطیر» انجام میشود و حتی میتواند از علاقه ساده به یک حیوان تا توصیههای خطرناک مانند خشونت یا اقدامات غیرقانونی را شامل شود.
به گفته متخصصان، این روش میتواند به یک بردار حمله جدید برای هکرها تبدیل شود و از آن برای تغییر رفتار مدلها یا حتی جهتدهی به افکار و تصمیمات انسانها استفاده شود. آنها هشدار دادهاند که با پیچیدهتر شدن مدلها و توانایی پنهان کردن منطق درونی، خطر از دست رفتن کنترل بر هوش مصنوعی افزایش یافته و میتواند پیامدهای فاجعهباری به همراه داشته باشد.
منبع: livescience