Alibaba’nın yeni Qwen 3.5 serisi, hibrit mimarisi ve kompakt yapısına rağmen, kendisinden 13,5 kat daha büyük olan OpenAI’ın gpt-oss-120B modelini performans testlerinde geride bırakarak yapay zeka verimliliğinde kuralları yeniden yazıyor.

Alibaba bünyesindeki Qwen ekibi, yapay zeka dünyasında dengeleri değiştirecek Qwen 3.5 Small Model Serisi’ni resmen tanıttı. 0.8B, 2B, 4B ve 9B parametre seçenekleriyle gelen bu yeni seri, özellikle mobil cihazlarda ve düşük güç tüketimi gerektiren senaryolarda yüksek performans sunmak üzere optimize edildi. Serinin en dikkat çeken üyesi olan Qwen3.5-9B, kompakt yapısına rağmen kendisinden hacimce çok daha büyük rakiplerine meydan okuyor.

Devlerle Yarışan Kompakt Güç

Yeni serinin amiral gemisi niteliğindeki Qwen3.5-9B, yapılan benchmark testlerinde şaşırtıcı sonuçlara imza attı. Model, lisansüstü düzeyde muhakeme ve çok dilli bilgi testlerinde, parametre sayısı bakımından kendisinden 13,5 kat daha büyük olan OpenAI‘ın açık kaynaklı gpt-oss-120B modelini geride bıraktı. GPQA Diamond karşılaştırmasında 9B modeli 81,7 puan alırken, gpt-oss-120B modeli 80,1 puanda kaldı. Bu durum, model boyutunun artık tek başına belirleyici bir faktör olmadığını, mimari verimliliğin ön plana çıktığını gösteriyor.

Verimli Hibrit Mimari ve Bellek Duvarı

Qwen 3.5 serisinin başarısının arkasında yatan teknik temel, “Verimli Hibrit Mimari” yaklaşımına dayanıyor. Standart Transformer mimarilerinden farklılaşan Alibaba, bu seride Gated Delta Networks (bir tür doğrusal dikkat mekanizması) ile seyrek Mixture-of-Experts (MoE) yapısını birleştiriyor. Bu stratejik hamle, küçük modelleri genellikle kısıtlayan ve sektörde “bellek duvarı” olarak bilinen sorunu ortadan kaldırıyor. Sonuç olarak, daha yüksek işlem hacmi ve önemli ölçüde daha düşük gecikme süreleri elde ediliyor.

Çok Modlu Yetenekler ve Ticari Kullanım

Doğal olarak çok modlu (multimodal) bir yapıya sahip olan Qwen 3.5, görsel anlama konusunda da iddialı. 4B ve 9B modelleri, daha önce on kat daha büyük modellerin yapabildiği görsel analizleri başarıyla gerçekleştiriyor. MMMU-Pro görsel muhakeme ölçütünde Gemini 2.5 Flash-Lite gibi güçlü rakipleri geride bırakan modeller, arayüz öğelerini okuma veya videodaki nesneleri sayma gibi karmaşık görevleri kolaylıkla yerine getirebiliyor.

Modellerin ağırlıkları, Apache 2.0 lisansı altında Hugging Face ve ModelScope üzerinden küresel erişime açıldı. Bu hamle, kurumsal şirketlerin ve girişimcilerin modelleri ticari projelerinde özgürce kullanabilmesine ve özelleştirebilmesine olanak tanıyor.

”Yapay Zeka Destekli İlaç Keşif Platformu Antiverse, 9,3 Milyon Dolarlık Seri A Turunu Tamamladı!” içeriğimizin detayları için tıklayın!

FounderN Kimdir?

FounderN, girişimcilik dünyasının en güncel haberleri, inovasyon odaklı içerikleri ve ekosistemin her bir parçasına değer katan çalışmalarıyla, faaliyet gösteren dinamik bir dijital medya platformudur. 2020 yılında “Girişim Haberleri” adıyla başlayan serüvenimiz, Eylül 2024 itibarıyla FounderN kimliği ile, girişimcilik ekosisteminin ilham veren dinamik sesi olma yolculuğuna devam ediyor. FounderN; teknoloji, girişim ve yatırım dünyasındaki gelişmeleri yaratıcı ve yenilikçi bir perspektifle sunarak iş dünyasının liderlerini, yatırımcılarını ve girişimcilerini sizlerle bir araya getirir.

FounderN olarak misyonumuz, yalnızca yaşanan son gelişmeleri paylaşmak değil, okurlarımızı bu gelişmelerin aktif bir parçası haline getirmek ve ekosistemin sürdürülebilir büyümesine katkı sağlamaktır. Ekosistemdeki en yeni gelişmelerden haberdar olmak, büyüyen bu topluluğun bir parçası olmak istiyorsanız, bültenimize abone olabilir, sosyal medya hesaplarımızdan bizi takip ederek ilham dolu bu yolculuğa katılabilirsiniz.

Bizimle Keşfetmeye Devam Edin: İlginizi çekebilecek diğer #Teknoloji Haberleri için tıklayın!

Foundern LinkedIn hesabına buradan ulaşabilirsiniz.

Foundern Instagram hesabına buradan ulaşabilirsiniz