Model Gemma 4 baru dari Google menghadirkan keterampilan penalaran yang kompleks ke perangkat berdaya rendah

Google LLC meningkatkan taruhannya pada model kecerdasan buatan berbobot terbuka dengan merilis Gemma 4, rangkaian model “terbuka” tercanggihnya sejauh ini.

Dibangun di atas fondasi arsitektur yang sama dengan Gemini 3, model ini dirancang untuk menangani tugas-tugas penalaran yang kompleks dan mendukung agen AI otonom yang berjalan secara lokal pada perangkat berdaya rendah seperti workstation dan ponsel pintar.

Dengan Gemma 4, peneliti Google DeepMind Clement Farabet dan Olivier Lacombe mengatakan, mereka telah berhasil menghasilkan lebih banyak “kecerdasan per parameter”, sehingga memungkinkan mereka mencapai bobot yang jauh melebihi kelas beratnya. Misalnya, varian 31B Dense saat ini menempati peringkat ketiga dalam model terbuka di papan peringkat Arena AI Text standar industri.

Model Gemma 4 hadir dalam empat varian: Effective 2B, Effective 4B, model Mixture of Experts 26B, dan model Dense 31B. Model “Efektif” yang lebih kecil dirancang untuk kasus penggunaan edge pada perangkat keras ringan seperti ponsel pintar Android atau komputer Raspberry Pi, kata para peneliti. Sementara itu, model MoE 26B memiliki trik cerdas yaitu hanya mengaktifkan 3,8 miliar parameter pada tugas inferensi, sehingga memungkinkannya bekerja dengan kecepatan tinggi tanpa mengorbankan basis pengetahuan mendalam dari model yang lebih besar.

Farabet dan Lacombe menjelaskan bahwa masing-masing model Gemma 4 lebih cocok untuk menjalankan agen AI. Jika iterasi Gemma sebelumnya memaksa pengembang untuk mengubah desain mereka sehingga mereka dapat berinteraksi dengan perangkat lunak lain, model Gemma 4 memiliki dukungan asli untuk pemanggilan fungsi dan keluaran Notasi Objek JavaScript terstruktur. Ini berarti pengembang dapat menggunakannya untuk memberdayakan agen otonom yang berinteraksi dengan alat pihak ketiga dan menjalankan rencana multi-langkah.

Keempat model tersebut memiliki kemampuan untuk memproses gambar dan video, dengan varian E2B dan E4B yang lebih kecil dilengkapi dengan dukungan input audio asli, sehingga memungkinkan pemahaman ucapan secara real-time langsung di perangkat. Google juga telah meningkatkan jendela konteks model, hingga 128K untuk model terkecil dan 256K untuk dua model besar. Ini berarti pengembang akan dapat mengunggah seluruh basis kode atau kumpulan dokumen dalam jumlah besar hanya dengan satu perintah.

Masing-masing model tersedia di bawah lisensi Apache 2.0 yang permisif, yang menghilangkan banyak batasan komersial yang diterapkan pada model AI lainnya, menjadikannya pilihan tepat bagi pengembang yang membangun aplikasi perusahaan, kata Google. Mereka dapat diakses langsung melalui Google Cloud, dan juga tersedia bersama dengan bobot terbukanya di Hugging Face, Kaggle, dan Ollama.

Rilis ini menggarisbawahi ambisi Google untuk mendominasi industri “AI lokal”. Karena model Gemma 4 yang lebih besar pun cukup kecil untuk dijalankan pada satu unit pemrosesan grafis, sehingga cocok untuk kasus penggunaan edge dan aplikasi yang mengutamakan latensi rendah dan kedaulatan digital, kata Holger Mueller, analis di Constellation Research.

“Google membangun keunggulannya dalam AI, tidak hanya dengan mendorong Gemini, tetapi juga membuka model dengan keluarga Gemma 4,” ujarnya. “Hal ini penting untuk membangun ekosistem pengembang AI, dan akan membantu perusahaan untuk memanfaatkan kasus penggunaan fungsional dan vertikal pada berbagai faktor bentuk perangkat. Google menetapkan standar yang tinggi pada rilis Gemma 3 sebelumnya, sehingga ada banyak harapan dengan rilis ini.”

Gambar: Google

Dukung misi kami untuk menjaga konten tetap terbuka dan gratis dengan terlibat dalam komunitas CUBE. Bergabunglah dengan Jaringan Kepercayaan Alumni theCUBEtempat para pemimpin teknologi terhubung, berbagi intelijen, dan menciptakan peluang.

15 juta+ pemirsa video CUBEmendukung percakapan seputar AI, cloud, keamanan siber, dan banyak lagi
11.4k+ alumni CUBE — Terhubung dengan lebih dari 11.400 pemimpin teknologi dan bisnis yang membentuk masa depan melalui jaringan unik berbasis tepercaya.

Tentang Media SiliconANGLE

SiliconANGLE Media adalah pemimpin yang diakui dalam inovasi media digital, yang menyatukan teknologi terobosan, wawasan strategis, dan keterlibatan audiens secara real-time. Sebagai perusahaan induk dari SiliconANGLE, theCUBE Network, theCUBE Research, CUBE365, theCUBE AI dan theCUBE SuperStudios — dengan lokasi utama di Silicon Valley dan New York Stock Exchange — SiliconANGLE Media beroperasi di persimpangan antara media, teknologi, dan AI.

Didirikan oleh visioner teknologi John Furrier dan Dave Vellante, SiliconANGLE Media telah membangun ekosistem dinamis merek media digital terkemuka di industri yang menjangkau 15+ juta profesional teknologi elit. TheCUBE AI Video Cloud milik kami yang baru menjadi terobosan dalam interaksi audiens, memanfaatkan jaringan saraf theCUBEai.com untuk membantu perusahaan teknologi membuat keputusan berdasarkan data dan tetap menjadi yang terdepan dalam percakapan industri.

Model Gemma 4 baru dari Google menghadirkan keterampilan penalaran yang kompleks ke perangkat berdaya rendah