گوگل دیپمایند مدل پیشرفته Genie 3 را معرفی کرد؛ سیستمی که میتواند تنها با دستورات متنی، جهانهای پویا و تعاملی را در وضوح 720p و با نرخ ۲۴ فریم بر ثانیه ایجاد کند. این مدل با بهرهگیری از تولید فریم بهصورت پیدرپی و حافظه تصویری تا یک دقیقه، امکان حرکت شبیه بازیهای ویدیویی، شبیهسازی پدیدههای فیزیکی و تغییر شرایط محیطی با فرمان متنی را فراهم میکند.
هوش مصنوعیGenie 3 نسبت به نسخههای قبلی جهشی بزرگ بهشمار میرود و گامی مهم بهسوی هوش مصنوعی مولد(AGI) محسوب میشود. با وجود محدودیتهایی مانند دامنه کم اقدامات مستقیم عاملها، دشواری تعامل چندعاملی و بازسازی ناقص مکانهای واقعی، این مدل نشان میدهد که هوش مصنوعی اکنون قادر است نهتنها واکنش نشان دهد، بلکه جهانهای تعاملی را در زمان واقعی بسازد و هدایت کند.
منبع: interestingengineering