Yapay zekâ sistemlerinin yetenekleri arttıkça, makinelerle iletişimde ses kullanımı giderek öne çıkıyor. Fransız yapay zekâ girişimi Mistral, bu alanda söz sahibi olmak için ilk açık sesli modeli olan Voxtral’ı tanıttı. Şirket, bu adımıyla kapalı sistemlerin egemenliğine karşı açık ağırlıklı (open-weight) bir alternatif sunmayı hedefliyor.
Salı günü duyurulan Voxtral, özellikle işletmeleri hedefleyen bir ses anlayış modeli ailesi olarak konumlanıyor. Mistral, Voxtral’ı üretim ortamlarında gerçekten kullanılabilecek düzeyde ses zekâsı sunan ilk açık kaynak model olarak lanse ediyor.
Bugüne dek geliştiriciler, ya ucuz ama hatalı transkripsiyonlar yapan açık sistemlerle ya da pahalı ve kapalı sistemlerle çalışmak zorunda kalıyordu. Mistral ise Voxtral ile bu ikilemi ortadan kaldırmayı vadediyor. Şirket, çözümün rakiplerine göre %50’den daha ucuz olduğunu iddia ediyor.
Voxtral, 30 dakikaya kadar ses transkribe edebiliyor. Mistral’in LLM taban modeli olan Mistral Small 3.1 sayesinde 40 dakikaya kadar olan ses içeriklerini anlayabiliyor. Bu da kullanıcıların ses dosyaları hakkında sorular sormasına, özet çıkarmasına ya da sesli komutları gerçek zamanlı API çağrıları veya fonksiyonlara dönüştürmesine olanak tanıyor.
Çok dilli desteğe sahip olan Voxtral, İngilizce, İspanyolca, Fransızca, Portekizce, Hintçe, Almanca, Hollandaca ve İtalyanca gibi dilleri destekliyor.
Mistral, iki model seçeneği sunuyor:
- Voxtral Small: 24 milyar parametreyle, üretim ölçeğinde kullanımlar için tasarlandı. ElevenLabs Scribe, GPT-4o-mini ve Gemini 2.5 Flash gibi modellerle rekabet ediyor.
- Voxtral Mini: 3 milyar parametreyle, yerel ve uç birimlerde (edge) kullanım için optimize edildi.
Bunun dışında, yalnızca transkripsiyon odaklı kullanım için geliştirilmiş, çok hızlı ve ultra ucuz bir API versiyonu olan Voxtral Mini Transcribe da mevcut. Bu modelin, OpenAI Whisper’dan daha iyi performans sunduğu ve fiyatının yarısından az olduğu belirtiliyor.

Kullanıcılar, Voxtral’ı Hugging Face üzerinden API’yi indirerek veya Mistral’in sohbet botu Le Chat üzerinden ücretsiz deneyebiliyor. Uygulamalara entegre etmek için başlangıç fiyatı dakika başına 0.001 dolar olarak duyuruldu.
Bu lansman, Mistral’in geçen ay tanıttığı adım adım problem çözme yeteneğine sahip Magistral model ailesinden sonra geliyor. Avrupa’nın en dikkat çeken yapay zekâ şirketlerinden biri olan Mistral, açık kaynak yapay zekâ savunuculuğuyla biliniyor. TechCrunch’a göre şirket, Abu Dabi merkezli MGX fonu dahil olmak üzere yatırımcılardan 1 milyar dolara kadar yeni yatırım almak üzere görüşmeler yürütüyor.
”xAI, Grok 4’ün Sorunlu Yanıtlarını Düzelttiğini Açıkladı!”haberimizin detaylarına buradan ulaşabilirsiniz!
FounderN Kimdir?
FounderN, girişimcilik dünyasının en güncel haberleri, inovasyon odaklı içerikleri ve ekosistemin her bir parçasına değer katan çalışmalarıyla, faaliyet gösteren dinamik bir dijital medya platformudur. 2020 yılında “Girişim Haberleri” adıyla başlayan serüvenimiz, Eylül 2024 itibarıyla FounderN kimliği ile, girişimcilik ekosisteminin ilham veren dinamik sesi olma yolculuğuna devam ediyor. FounderN; teknoloji, girişim ve yatırım dünyasındaki gelişmeleri yaratıcı ve yenilikçi bir perspektifle sunarak iş dünyasının liderlerini, yatırımcılarını ve girişimcilerini sizlerle bir araya getirir.
FounderN olarak misyonumuz, yalnızca yaşanan son gelişmeleri paylaşmak değil, okurlarımızı bu gelişmelerin aktif bir parçası haline getirmek ve ekosistemin sürdürülebilir büyümesine katkı sağlamaktır. Ekosistemdeki en yeni gelişmelerden haberdar olmak, büyüyen bu topluluğun bir parçası olmak istiyorsanız, bültenimize abone olabilir, sosyal medya hesaplarımızdan bizi takip ederek ilham dolu bu yolculuğa katılabilirsiniz.
Bizimle Keşfetmeye Devam Edin: İlginizi çekebilecek diğer #Gündem Haberleri için tıklayın!
FounderN LinkedIn hesabına buradan ulaşabilirsiniz.
FounderN Instagram hesabına buradan ulaşabilirsiniz.