Google, 16 GB RAM’e sahip standart dizüstü bilgisayarlarda çalışabilen ve kodlayıcısız multimodal mimariye sahip yeni açık yapay zeka modeli Gemma 4 12B’yi kullanıma sundu.

Google, açık model ailesinin en yeni üyesi olan Gemma 4 12B sürümünü piyasaya sürdü. Nisan ayında Apache 2.0 lisansıyla duyurulan Gemma 4 serisinin bu yeni versiyonu, mobil cihazlar için optimize edilen E4B ile daha yüksek kapasiteli 26B Mixture of Experts (MoE) modelleri arasındaki segmenti hedefliyor. Yeni model, karmaşık çok adımlı akıl yürütme ve ajansal iş akışlarını daha erişilebilir bir donanım seviyesinde gerçekleştirebiliyor.

Tüketici Donanımlarında Yüksek Performans

Gemma 4 12B, yerel olarak çalıştırılmak için 20 bin dolarlık profesyonel yapay zeka hızlandırıcılarına ihtiyaç duymadan standart tüketici dizüstü bilgisayarlarında görev yapabiliyor. 16 GB sistem RAM’i veya VRAM’i bulunan bilgisayarlarda sorunsuz çalışan model, 26B MoE versiyonunun ihtiyaç duyduğu bellek kapasitesinin yalnızca yarısını kullanıyor. Bu optimizasyon, geliştiricilerin kaliteden ödün vermeden yerel cihazlarda ajansal multimodal zekayı çalıştırmasına olanak tanıyor.

Kodlayıcısız Multimodal Mimari ve MTP Desteği

Modelin en dikkat çekici teknik özelliklerinden biri, ses ve görüntü girdilerini ayrı kodlayıcılara ihtiyaç duymadan doğrudan büyük dil modeli (LLM) omurgasına aktarabilen birleşik multimodal mimarisi. Görme işlemleri için tek matris çarpımı ve konumsal gömme özelliğine sahip yeni bir modül kullanan sistem, görsel verileri uzamsal farkındalıkla işliyor. Ses tarafında ise geleneksel kodlama süreçleri yerine, ham ses sinyalleri metin belirteçleri için kullanılan vektörlerle aynı alana yansıtılıyor.

Daha az parametre sayısına rağmen model, Multi-Token Prediction (MTP) taslaklayıcılarıyla birlikte sunuluyor. Bu yapı, sistemin bir sonraki token yerine birden fazla olası tokeni önceden tahmin etmesini sağlayarak işlem gecikmesini önemli ölçüde azaltıyor. Gemma 4 12B, bu özelliği seride ilk kez hazır olarak sunan model konumunda bulunuyor.

Geliştirici Ekosistemi ve Erişilebilirlik

Bugüne kadar 150 milyon indirme sayısını aşan Gemma 4 ailesinin yeni üyesi; LM Studio, Ollama, Google AI Edge Gallery ve LiteRT-LM CLI gibi platformlar üzerinden test edilebiliyor. Modelin önceden eğitilmiş ağırlıkları Hugging Face ve Kaggle üzerinden erişime açılırken, ajan geliştirme süreçlerini desteklemek amacıyla Gemma Skills Repository adlı resmi bir beceri kütüphanesi de ekosisteme dahil edildi.

”Google Verilerinizi Analiz Edip Size Yapay Zekâ ile Öneriler Sunacak” içeriğimizin detayları için tıklayın!

FounderN Kimdir?

FounderN, girişimcilik dünyasının en güncel haberleri, inovasyon odaklı içerikleri ve ekosistemin her bir parçasına değer katan çalışmalarıyla, faaliyet gösteren dinamik bir dijital medya platformudur. 2020 yılında “Girişim Haberleri” adıyla başlayan serüvenimiz, Eylül 2024 itibarıyla FounderN kimliği ile, girişimcilik ekosisteminin ilham veren dinamik sesi olma yolculuğuna devam ediyor. FounderN; teknoloji, girişim ve yatırım dünyasındaki gelişmeleri yaratıcı ve yenilikçi bir perspektifle sunarak iş dünyasının liderlerini, yatırımcılarını ve girişimcilerini sizlerle bir araya getirir.

FounderN olarak misyonumuz, yalnızca yaşanan son gelişmeleri paylaşmak değil, okurlarımızı bu gelişmelerin aktif bir parçası haline getirmek ve ekosistemin sürdürülebilir büyümesine katkı sağlamaktır. Ekosistemdeki en yeni gelişmelerden haberdar olmak, büyüyen bu topluluğun bir parçası olmak istiyorsanız, bültenimize abone olabilir, sosyal medya hesaplarımızdan bizi takip ederek ilham dolu bu yolculuğa katılabilirsiniz.

Bizimle Keşfetmeye Devam Edin: İlginizi çekebilecek diğer #Teknoloji Haberleri için tıklayın!

Foundern LinkedIn hesabına buradan ulaşabilirsiniz.

Foundern Instagram hesabına buradan ulaşabilirsiniz