Microsoft, Phi yapay zeka serisi kapsamında üç yeni modelini tanıttı. Bu modeller, sırasıyla 3,82 milyar parametreli Phi-3.5-mini-instruct, 41,9 milyar parametreli Phi-3.5-MoE-instruct ve 4,15 milyar parametreli Phi-3.5-vision-instruct’tan oluşuyor. Her bir model farklı ihtiyaçlara hitap ederek, çeşitli alanlarda güçlü performanslar sunuyor.
Phi-3.5 Mini Instruct
Microsoft Phi-3.5 Mini Instruct, 3,8 milyar parametreye ve 128 bin token’lık bağlam penceresine sahip kompakt bir yapay zeka modelidir. Bellek veya bilgisayar kısıtlı ortamlarda etkili muhakeme yetenekleri arayan kullanıcılar için ideal bir seçenek sunar. Model, kod üretimi, matematiksel problem çözme ve mantık tabanlı muhakeme gibi görevlerde yüksek performans sergileyebilir. Eğitim sürecinde 10 gün boyunca 512 H100-80G GPU kullanılarak 3,4 trilyon token üzerinde eğitildi. Microsoft Phi-3.5 Mini Instruct, çok dilli ve çok yönlü konuşma görevlerinde de rekabetçi bir performans sergileyerek, benzer boyuttaki diğer modelleri geride bırakıyor.
Phi-3.5 MoE
Phi-3.5 MoE, 41,9 milyar parametreli geniş bir mimariye sahip olup, 128 bin token’lık bağlam penceresi sunar. Ancak, model yalnızca 6,6 milyar aktif parametre ile çalışmaktadır. Bu model, çeşitli görevlerde uzmanlaşmış birden fazla model türünü bir araya getirerek kod, matematik ve çok dilli dil anlamada güçlü performans sunar. Phi-3.5 MoE, RepoQA gibi kıyaslama testlerinde genellikle daha büyük modellerden üstün sonuçlar gösteriyor. Ayrıca, beş atışlı Çok Görevli Dil Anlama (MMLU) ölçütünde GPT-4o mini’yi geride bırakmıştır. Model, 23 gün boyunca 512 H100-80G GPU kullanılarak 4,9 trilyon token üzerinde eğitildi.
Phi-3.5 Vision Instruct
Phi-3.5 Vision Instruct, metin ve görüntü işleme yetenekleriyle öne çıkan çok modlu bir modeldir. 128 bin token’lık bağlam uzunluğuna sahip olan bu model, genel görüntü anlama, optik karakter tanıma, grafik ve tablo anlama ile video özetleme gibi görevler için tasarlanmıştır. Eğitim sürecinde, model 6 gün boyunca 256 A100-80G GPU kullanılarak 500 milyar token üzerinde eğitilmiştir. Eğitimin odak noktası yüksek kaliteli, muhakeme yoğun veriler olmuştur.
Microsoft’un Phi-3.5 serisi, Hugging Face platformu üzerinden geliştiricilere sunulmuş olup, ince ayar yapma ve özelleştirme imkânı tanımaktadır. Yapılan çeşitli üçüncü taraf testleri, bu modellerin son teknoloji performansa sahip olduğunu ve bazı durumlarda Google’ın Gemini 1.5 Flash, Meta’nın Llama 3.1 ve OpenAI’ın GPT-4o’sunu geride bırakabildiklerini göstermektedir.
”Google, Chrome Kullanıcı Verilerini İzinsiz Toplamakla Suçlanıyor” haberine buradan ulaşabilirsiniz.