April 6, 2025

WHAMM: Model GenAI dari Microsoft yang Bisa ‘Remake’ Game FPS Klasik Quake II

Penulis: Iwan RS
WHAMM: Model GenAI dari Microsoft yang Bisa ‘Remake’ Game FPS Klasik Quake II 

Mobitekno – Microsoft memberi kejutan bagi dunia game dengan meluncurkan WHAMM, model AI generatif yang dirancang untuk menciptakan pengalaman bermain game secara real-time. WHAMM (World and Human Action MaskGIT Model) bisa diibaratkan sebagai otak game yang dapat membuat karakter dan game menjadi lebih hidup dan ‘mengejutkan’ saat dimainkan.

Agar lebih mudah memahami potensi model GenAI tersebut, Microsoft memilih game FPS (first-person shooter) Quake II yang populer 28 tahun lalu (1997). WHAMM bukan sekadar melakukan remaster suatu game, tetapi merangkai ulang game Quake II sebagai pengalaman yang sepenuhnya dihasilkan oleh AI, di mana setiap frame disulap dengan cepat oleh AI berdasarkan respons pemain. Menariknya, hal ini bisa langsung dapat dimainkan di browser.

Contoh bagaimana model GenAI WHAMM dari Microsoft membuat kembali game FPS klasik Quake II.

Pada demonya (diakses melalui Copilot Labs), pemain diajak untuk melangkah ke versi surealis yang dibuat oleh AI dari dunia Quake II yang. Pengguna dapat bergerak, menembak, melompat, berjongkok, dan bahkan menghadapi musuh yang melarikan diri dan berubah bentuk. Semuanya ditampilkan secara real time pada resolusi di kisaran 180p (300×180 pixel) hingga 360p (640×360 pixel).

Meskipun resolusi dan frame rate-nya masih relatif rendah, ada inovasi yang menarik di balik hal tersebut. Microsoft tidak mempromosikan WHAMM sebagai pengganti game yang ada selama ini, tapi ingin memberikan proof-of-concept yang menunjukkan bagaimana teknologi GenAI dapat merevolusi pengembangan game, pembuatan prototipe, hingga bagaimana melestarikannya.

WHAMM pangkas pelatihan data gameplay secara signifikan

WHAMM dibangun di atas Model AI Muse dari Microsoft dan pendahulunya, WHAM-1.6B, memulai debut pada Februari 2025 lalu. Apabila Model AI WHAM-1.6B membutuhkan pelatihan data gameplay selama tujuh tahun, Model AI WHAMM baru bisa memangkasnya waktunya menjadi hanya lebih dari seminggu.

Peningkatan efisiensi ini berasal dari pengumpulan data yang lebih cerdas penguji profesional dalam memainkan satu level Quake II dan peralihan ke arsitektur MaskGIT. Tidak seperti prediksi token berurutan WHAM, WHAMM menghasilkan semua token gambar secara paralel, yang secara drastis mempercepat proses untuk menghasilkan lebih dari 10 FPS.

Microsoft WHAMM 02
WHAM pertama-tama melakukan tokenisasi data gameplay berupa urutan gambar, aksi, gambar, aksi, dll menjadi urutan token yang lebih panjang. Kemudian dilatih transformator khusus dekoder untuk memprediksi token berikutnya dalam urutan tersebut. (Kiri) Proses tokenisasi setiap gambar menggunakan ViT-VQGAN [3]. (Kanan) Proses pelatih transformator pada urutan token yang dihasilkan.
Meskipun framerate-nya masih jauh 60 FPS yang ditawarkan berbagai game modern saat ini, tetapi untuk suatu game besutan AI yang menghasilkan setiap piksel secara real time, ini menjadi suatu terobosan yang signifikan di dunia game dan AI.

Gameplay masih terbatas dan respons pro-kontra

Kemampuan model untuk melacak lingkungan yang ada, terlepas dari anomali grafis yang sesekali terjadi, sekaligus beradaptasi dengan input pengguna secara terlihat cukup menjanjikan, terlepas dari jeda input yang memang belum sepenuhnya real-time.

Pada demo game, pemain memang dapat menembak, bergerak, melompat, berjongkok, melihat-lihat, bahkan menembak musuh. Namun, secara umum demo yang dihadirkan masih sekadar showcase dan belum dapat menggantikan pengalaman bermain game yang sesungguhnya.

Seperti yang diharapkan, modelnya tidak sempurna. Penggambaran interaksi dengan musuh masih kurang jelas, panjang konteksnya juga masih terbatas, dan game hasil AI ini juga masih salah dalam menyimpan data statistik penting pemain, seperti kesehatan (Health) dan kerusakan (Damage), dan masih terbatas pada satu level.

Microsoft WHAMM 03

Visi Microsoft untuk WHAMM bukan hanya terkait demo teknologi tapi berbagai potensi inovasi yang mungkin dihadirkan ke depan. Misalnya, desainer game dapat menggunakan WHAMM untuk membuat prototipe mekanik dalam hitungan jam, bukan bulan, mengulang ide tanpa bersusah payah membuat kode setiap aset. Bayangkan juga di mana game klasik, yang masih tergantung pada hardware lama bisa ‘dibangkitkan’ kembali melalui AI yang cukup dilatih melalui dokumentasi gameplay yang ada.

Fatima Kardar, VP Microsoft untuk AI game menyatan bahwa model AI WHAMM memungkinkan penciptaan gameplay yang konsisten dan beragam yang dirender oleh AI dan berpotensi untuk memberdayakan para kreator.

Hadirnya Model GenAI WHAMM dari Microsoft dan fitur mengubah foto menjadi gambar bergaya seni Studio Ghibli pada model GPT-4o dari OpenAI juga mengundang reaksi pro-kontra. Reaksi Pro karena membuka peluang inovasi yang lebih luas ke depan dan reaksi kontra karena kekhawatiran proses kreatif yang semakin mengurangi unsur manusiawi dari seorang desainer, artis, seniman dam sejenisnya.

Dengan tingkat perkembangan AI saat ini, kita mungkin akan melihat bahwa game dan film yang sepenuhnya dibuat oleh AI dapat menjadi kenyataan dalam beberapa tahun ke depan. Kekhawatiran mungkin bisa ditekan dengan menyetakan bahwa AI generatif hadir untuk meningkatkan proses kreatif manusia dan bukan untuk menggantikannya.

Tags: , , , , ,


COMMENTS