February 27, 2025

Buka Akses Open-Source untuk Model AI Video Generator, Alibaba Cloud Buat Terobosan Dukung Dunia Kreativitas Digital

Penulis: Iwan RS
Buka Akses Open-Source untuk Model AI Video Generator, Alibaba Cloud Buat Terobosan Dukung Dunia Kreativitas Digital 

Mobitekno – Alibaba Cloud, raksasa teknologi cloud di bawah Alibaba Group, membuat terobosan baru di industri AI dengan membuka akses open-source untuk model kecerdasan buatan (AI) penghasil konten video (video generator) terbaru mereka, Wan2.1. Ini bukan hanya membuktikan komitmen Alibaba Cloud dalam mendukung inovasi global, tetapi juga membuka peluang bagi bagi komunitas kreator, peneliti, dan pelaku bisnis yang ingin memanfaatkan teknologi AI mereka untuk menghasilkan konten visual berkualitas tinggi tanpa biaya besar.

Alibaba Cloud

Model Wan2.1, yang merupakan bagian dari seri Tongyi Wanxiang (Wan), hadir dalam empat varian: T2V-14B, T2V-1.3B, I2V-14B-720P, dan I2V-14B-480P. Dengan jumlah parameter mencapai 14 miliar untuk model terbesarnya dan 1,3 miliar untuk versi lebih ringan, Wan2.1 menawarkan fleksibilitas dan kekuatan komputasi yang luar biasa. Model ini mampu mengubah teks atau gambar menjadi video dinamis dengan tingkat realisme yang mengesankan, menjadikannya alat yang sangat dicari di era konten digital saat ini.

Wan2.1: Terunggul pada VBench Leaderboard

Dalam suatu pengujian ditunjukkan jika Wan2.1 memang unggul dalam proses pembuatan video. Ini terbukti dari hasil tes VBench, yaitu tes yang dipakai untuk menilai kemampuan model pembuat video. Wan2.1 mendapat nilai tertinggi, 86,22%. Hebatnya, Wan2.1 jago dalam banyak hal, seperti membuat gerakan yang alami, mengatur posisi benda-benda dalam video, menghasilkan warna yang tepat, dan menangani banyak objek sekaligus.

Wan2.1 juga satu-satunya model gratis yang masuk lima besar di VBench leaderboard di Hugging Face, situs terkenal tempat para ahli AI bekerja sama. Ini menunjukkan bahwa Alibaba Cloud tidak hanya bersaing dengan perusahaan teknologi besar dunia, tetapi juga membuat teknologi canggih ini bisa diakses oleh siapa saja.

Alibaba Cloud buka akses Model AI Penghasil Konten Video

Salah satu keistimewaan Wan2.1 adalah kemampuannya menambahkan teks dalam bahasa Mandarin dan Inggris ke dalam video. Ini adalah yang pertama di industri model pembuat video. Misalnya, Anda bisa mengetik “seorang penari berputar di tengah hujan dengan lampu neon warna-warni,” dan dalam beberapa menit, Wan2.1 akan membuat video yang sangat mirip aslinya. Videonya akan menampilkan gerakan yang akurat, pencahayaan yang dramatis, dan detail fisika yang realistis. Kemampuan ini didukung oleh data pelatihan yang sangat banyak dan komputer yang sangat kuat, yang biasanya hanya dimiliki oleh perusahaan besar.

Demokratisasi teknologi AI

Dengan membuka akses open-source melalui Model Scope dan Hugging Face, Alibaba Cloud memungkinkan siapa saja—mulai dari akademisi, peneliti, hingga startup—untuk mengunduh dan memanfaatkan model Wan2.1. Langkah ini menghilangkan hambatan finansial yang sering kali menjadi kendala dalam mengadopsi teknologi AI mutakhir. Sebagai contoh, model T2V-1.3B dirancang untuk berjalan efisien bahkan pada laptop standar, memungkinkan pengguna menghasilkan video berdurasi 5 detik dengan resolusi 480p hanya dalam waktu 4 menit. Sementara itu, T2V-14B cocok untuk proyek-proyek yang membutuhkan kualitas premium dengan gerakan lebih kompleks.

Tongyi Wanxiang 2.1 Video Generation Architecture
Tongyi Wanxiang 2.1 Video Generation Architecture Diagram.

Tidak hanya berhenti pada teks-ke-video (text-to-video), Wan2.1 juga menawarkan fitur gambar-ke-video (image-to-video) melalui model I2V-14B-720P dan I2V-14B-480P. Cukup unggah sebuah gambar—misalnya, foto matahari terbenam di pantai—dan tambahkan instruksi singkat seperti “burung terbang melintasi langit,” maka model ini akan menghasilkan video pendek yang hidup dan sesuai deskripsi. Fleksibilitas ini membuka peluang tak terbatas bagi kreator konten, advertiser, atau bahkan sineas independen untuk bereksperimen tanpa perlu peralatan mahal.

Warisan open-Source Alibaba Cloud

Keputusan membuka akses Wan2.1 bukanlah langkah pertama Alibaba Cloud dalam mendukung komunitas open-source. Sejak Agustus 2023, perusahaan ini telah merilis model Qwen-7B, yang hingga kini tetap menjadi salah satu model AI terdepan di Hugging Face Open LLM Leaderboards. Lebih dari 100.000 model turunan Qwen telah dikembangkan oleh komunitas global, menjadikannya salah satu ekosistem AI terbesar di dunia. Kesuksesan Qwen menjadi bukti bahwa strategi open-source Alibaba Cloud tidak hanya tentang berbagi teknologi, tetapi juga membangun komunitas inovator yang saling mendukung.

Langkah ini juga menempatkan Alibaba Cloud sebagai pionir di antara perusahaan teknologi global. Sementara banyak raksasa AI memilih untuk menjaga model mereka dalam lingkungan tertutup, Alibaba Cloud justru membuka pintu lebar-lebar. “Akses terbuka memungkinkan lebih banyak bisnis memanfaatkan AI untuk menciptakan konten visual berkualitas tinggi dengan biaya yang lebih hemat,” demikian pernyataan resmi perusahaan. Ini adalah visi yang selaras dengan kebutuhan zaman, di mana konten visual menjadi tulang punggung komunikasi digital.

Peluncuran Wan2.1 menunjukkan bagaimana teknologi telah mengubah cara kita berkreasi. Bagi pelaku bisnis, model AI ini dapat digunakan untuk membuat iklan dalam hitungan menit. Bagi peneliti, ini adalah alat untuk mengeksplorasi batas-batas AI generatif. Dan bagi individu biasa, ini adalah kesempatan untuk mewujudkan imajinasi mereka dalam bentuk visual tanpa perlu keahlian teknis mendalam.

Sebagai tulang punggung teknologi Alibaba Group sejak 2009, Alibaba Cloud telah membuktikan diri sebagai pemimpin di industri cloud, baik di Asia Pasifik maupun dunia. Dengan Wan2.1, mereka tidak hanya mempertahankan posisi tersebut, tetapi juga menetapkan standar baru dalam demokratisasi AI.

Tags: , , , , , , , , ,


COMMENTS