گوگل دیپمایند به تازگی نسخه جدید هوش مصنوعی Genie را منتشر کرده است. نسخه قبلی این مدل میتوانست جهانهای دو بعدی برای کاربران تولید کند و هوش مصنوعی Genie 2 قادر به تولید جهانهای سهبعدی کاملاً تعاملی است.
هرچند قابلیتهای Genie 2 ظاهراً برای توسعه بازی ساخته شدهاند، اما گوگل میگوید که این یک موتور توسعه بازی نیست. در واقع گوگل نوعی مدل انتشاری (Diffusion Model) توسعه داده که میتواند تصاویری بسازد که هنگام تعامل کاربر با آنها یک دنیای کاملاً شبیهسازی شده نمایش داده خواهد شد.
Genie 2 در هنگام تولید فریمهای موردنیاز میتواند درباره محیط اطراف آن ایدهسازی کند و توانایی مدلسازی آب، دود و اثرات فیزیکی را به خوبی دارد. هرچند برخی از این مدلها به عناصر بازیها شباهت زیادی دارند.
همچنین این مدل در رندر گرفتن صحنههای مختلف محدودیتی ندارد و میتواند مناظر را بهصورت اول شخص، سوم شخص و ایزومتریک (دیدِ بالا به پایین) نمایش دهد.
تنها چیزی که برای ساخت یک مدل سه بعدی با Genie 2 به آن نیاز دارید یک تصویر بهعنوان دستور اولیه است که میتواند توسط هوش مصنوعی Imagen 3 گوگل آن را تولید کرد یا از هر تصویر دیگری استفاده کرد.
نکته قابل ذکر دیگر اینکه Genie 2 میتواند بخشهایی از یک جهان که قبلاً شبیهسازی کرده را به محض مشاهده دوباره آنها به خاطر بیاورد و برخی عناصر آن را بازیابی کند. این ویژگی باعث میشود تا هوش مصنوعی گوگل از رقبای خود مانند Oasis تمایز پیدا کند.
درباره محدودیتهای Genie 2 نیز دیپمایند میگوید که این مدل میتواند بهمدت 60 ثانیه جهانهای کاملاً تعاملی ایجاد کند. همچنین در نمونههایی که توسط خود غول فناوری به نمایش گذاشته شده نیز مدلهایی با زمان بسیار کوتاهتر دیده میشوند.
درحالحاضر گوگل دیپمایند مدل هوش مصنوعی Genie 2 را بهعنوان ابزاری برای آموزش و ارزیابی سایر عوامل هوش مصنوعی، از جمله الگوریتم SIMA خود توسعه داده است تا هنرمندان و طراحان بتوانند از آن استفاده کنند. بنابراین نمیتوان انتظار داشت که این مدل به زودی برای عموم عرضه شود.