SELULAR.ID – Alibaba tak tinggal diam saat DeepSeek menjadi Top 1 global aplikasi AI yang paling banyak diunduh. Alibaba merilis serangkaian model AI terbaru dari seri Qwen, yakni Qwen2.5-VL. Model AI ini bisa menangani berbagai tugas analisis teks dan gambar.
Model AI Qwen2.5-VL digadang Alibaba bisa membaca dokumen, memahami video, menghitung objek dalam gambar, serta mengontrol komputer. Fitur dalam model ini mirip dengan ‘Operator’ yang diluncurkan OpenAI.
Namun, Alibaba enggan disamakan dengan OpenAI atau perusahaan AI lainnya. Alibaba mengklaim, AI Qwen2.5-VL melampaui GPT-4o dari OpenAI, Claude 3.5 Sonnet dari Anthropic, dan Gemini 2.0 Flash dari Google dalam berbagai aspek, termasuk pemahaman video, matematika, analisis dokumen, serta tanya jawab berbasis AI.
Baca juga: Alibaba Cloud Mengumumkan Model dan Infrastruktur AI Terbaru
Keunggulan Alibaba AI Qwen2.5-VL
AI Qwen2.5-VL saat ini tersedia untuk diuji di aplikasi Qwen Chat milik Alibaba. Selain itu, aplikasi juga bisa diunduh dari dari platform pengembang AI Hugging Face.
Menurut tim Qwen, AI Qwen2.5-VL memiliki kemampuan menganalisis grafik dan diagram, mengekstrak data dari dokumen seperti faktur dan formulir, memahami video berdurasi panjang hingga berjam-jam, serta mengenali karakter dari film dan serial TV, dan berbagai jenis produk.
Alibaba menegaskan, model tersebut menggunakan materi pelatihan dengan hak cipta dalam meningkatkan kemampuannya. Itu terlihat jelas karena AI Qwen2.5-VL bisa mengenali karakter film hingga produk komersial.
Memesan Tiket
Dalam demonstrasinya, AI Qwen2.5-VL bisa membuka aplikasi Booking.com di ponsel berbasis Android, lalu memesan tiket pesawat dengan penerbangan dari Chongqing ke Beijing.
Meski demikian, AI Qwen2.5-VL masih memiliki keterbatasan. Dalam penggunaan di komputer Linux, AI Qwen2.5-VL hanya berhasil berpindah tab tanpa melakukan tugas yang lebih kompleks. Hal ini sejalan dengan hasil uji benchmark OSWorld, di mana model ini mendapatkan skor rendah dalam meniru lingkungan komputer nyata.
Alibaba AI model Qwen2.5-VL juga memiliki seri yang lebih mini, yakni Qwen2.5-VL-3B dan Qwen2.5-VL-7B. Kedua model mini tersebut dirilis dengan lisensi yang lebih fleksibel. Namun, model unggulannya, Qwen2.5-VL-72B, menggunakan lisensi khusus Alibaba.
Hal ini memungkinkan perusahaan atau pengembang dengan lebih dari 100 juta pengguna aktif bulanan harus mendapatkan izin dari Alibaba sebelum menggunakan model ini untuk tujuan komersial.
Baca juga: Alibaba Keluarkan AI Saingi Model o1 OpenAI
Selain memiliki keterbatasan pada Linux, Qwen2.5-VL dan serinya memiliki kekurangan dalam menjalankan perintah. Regulasi Tiongkok asal AI ini diciptakan, membuat kecerdasan buatannya tidak merespon pertanyaan yang sensitif. Sama seperti DeepSeek yang tidak akan menjawab isu politik Tiongkok, serta negara lawannya Taiwan.
Ikuti informasi menarik lainnya dari Selular.id di Google News