Çin’in teknoloji devlerinden Alibaba, yapay zekâ geliştirme yarışında geri kalmamak adına önemli bir adım attı. Alibaba’nın Qwen ekibi, “Qwen2.5-VL” adını verdikleri yeni bir yapay zekâ modeli serisini piyasaya sürdü. Bu modeller, hem metin hem de görsel analiz görevlerini yerine getirebilmenin yanı sıra bilgisayar ve mobil cihazları kontrol etme yeteneğine sahip.
Qwen2.5-VL modelleri; dosya analizi, video anlama, resimlerdeki nesneleri sayma gibi görevleri başarıyla yerine getiriyor. Ayrıca, grafik ve tabloları analiz edebiliyor, faturalardan ve formlardan veri çıkarabiliyor ve saatler süren videoları anlayabiliyor. Qwen ekibinin açıklamasına göre bu modeller, OpenAI’nin GPT-4o, Anthropic’in Claude 3.5 Sonnet’i ve Google’ın Gemini 2.0 Flash’ı gibi güçlü rakiplerini birçok testte geride bırakmayı başardı.
Hali hazırda Alibaba’nın Qwen Chat uygulaması üzerinden test edilebilen model, yapay zekâ geliştiricileri için Hugging Face platformunda da indirilebilir durumda.
Dikkat Çeken Özellikler
Qwen2.5-VL’nin en ilginç özelliklerinden biri, bilgisayar ve mobil cihazlarda uygulamaları kontrol edebilmesi. Örneğin, Hugging Face’te bir teknik lider olan Philipp Schmid, paylaştığı bir videoda modelin Android’de Booking.com uygulamasını açarak Chongqing’den Pekin’e bir uçuş rezervasyonu yaptığını gösterdi. Aynı şekilde, model bir Linux masaüstü ortamında uygulamalar arasında geçiş yapabiliyor. Ancak bu kontrol yeteneği şu an için tam anlamıyla olgunlaşmış değil; OSWorld gibi gerçek bilgisayar ortamlarını simüle eden testlerde modelin performansı düşük kalıyor.
Çin’deki Düzenlemelerin Etkisi
bir Çin şirketi tarafından geliştirildiği için Qwen2.5-VL’nin bazı hassas konulara yanıt vermediği belirtiliyor. Örneğin, Xi Jinping’in hatalarıyla ilgili bir soru sorulduğunda Qwen Chat, bir hata mesajı veriyor. Çin’in internet düzenleyicileri, ülke içindeki yapay zekâ modellerinin “sosyalist değerleri yansıtmasını” zorunlu kılıyor ve tartışmalı konuların ele alınmasını sınırlandırıyor.
Qwen2.5-VL serisindeki iki daha küçük model (Qwen2.5-VL-3B ve Qwen2.5-VL-7B), serbest bir lisansla kullanıma sunulmuş durumda. Ancak serinin amiral gemisi olan Qwen2.5-VL-72B, Alibaba’nın özel lisansı altında. Bu lisansa göre, aylık 100 milyon aktif kullanıcıdan fazla erişimi olan şirketler ve geliştiriciler, modeli ticari olarak kullanmadan önce Alibaba’dan izin almak zorunda.
Alibaba, Qwen2.5-VL ile yapay zekâ alanında yeni bir döneme geçiş yapmayı hedefliyor. Ancak modelin tam potansiyeline ulaşabilmesi için daha fazla test ve geliştirme yapılması gerektiği görülüyor.
“Meta, 2025 Yılında Yapay Zeka Yatırımlarını 65 Milyar Dolara Çıkarmayı Planlıyor” içeriğimizin detaylarına buradan ulaşabilirsiniz!
FounderN Kimdir?
FounderN, girişimcilik dünyasının en güncel haberleri, inovasyon odaklı içerikleri ve ekosistemin her bir parçasına değer katan çalışmalarıyla, faaliyet gösteren dinamik bir dijital medya platformudur. 2020 yılında “Girişim Haberleri” adıyla başlayan serüvenimiz, Eylül 2024 itibarıyla FounderN kimliği ile, girişimcilik ekosisteminin ilham veren dinamik sesi olma yolculuğuna devam ediyor. FounderN; teknoloji, girişim ve yatırım dünyasındaki gelişmeleri yaratıcı ve yenilikçi bir perspektifle sunarak iş dünyasının liderlerini, yatırımcılarını ve girişimcilerini sizlerle bir araya getirir.
FounderN olarak misyonumuz, yalnızca yaşanan son gelişmeleri paylaşmak değil, okurlarımızı bu gelişmelerin aktif bir parçası haline getirmek ve ekosistemin sürdürülebilir büyümesine katkı sağlamaktır. Ekosistemdeki en yeni gelişmelerden haberdar olmak, büyüyen bu topluluğun bir parçası olmak istiyorsanız, bültenimize abone olabilir, sosyal medya hesaplarımızdan bizi takip ederek ilham dolu bu yolculuğa katılabilirsiniz.
Bizimle Keşfetmeye Devam Edin: İlginizi çekebilecek diğer #Gündem Haberleri için tıklayın!
Foundern LinkedIn hesabına buradan ulaşabilirsiniz.
Foundern Instagram hesabına buradan ulaşabilirsiniz.