Salı, Temmuz 7, 2026

Login

Girişimcilik, Startup ve Teknoloji Haberleri

No Result

View All Result

No Result

View All Result

Girişimcilik, Startup ve Teknoloji Haberleri

No Result

View All Result

Google, Görsel ve Video Üretimi İçin Gemini Omni Modelini Duyurdu

by İsmail Karaçengel

in Yapay Zeka Gündemi

Reading Time: 7 mins read

Gemini Omni

Gemini Omni

Facebook'ta Paylaş X'te Paylaş Whatsapp'ta Paylaş Linkedln'de Paylaş

Google, yapay zekâ modellerini metin tahmin eden sistemlerden gerçekliği daha iyi anlayan ve simüle edebilen yapılara taşımak için yeni Gemini Omni model ailesini duyurdu. Şirketin yeni modeli, farklı girdi türlerinden farklı çıktı formatları üretebilen çok modlu bir yapay zekâ sistemi olarak konumlanıyor.

Google’a göre Gemini Omni, Gemini’nin akıl yürütme kabiliyetini şirketin üretken medya modelleriyle birleştiriyor. Bu sayede kullanıcılar görsel, ses, video ve metin gibi farklı girdileri bir araya getirerek yüksek kaliteli video çıktıları oluşturabilecek. Modelin ilk aşamada video üretimine odaklanacağı, ilerleyen dönemde ise görsel ve ses gibi farklı çıktı türlerini de destekleyeceği belirtiliyor.

Google, Omni ailesinin ilk modeli olarak Gemini Omni Flash’ı kullanıma sundu. Model bugünden itibaren Gemini uygulaması, Google Flow ve YouTube Shorts üzerinden denenebilecek. Şirket, önümüzdeki haftalarda Gemini Omni Flash’ı geliştiricilere ve kurumsal müşterilere API’ler üzerinden de açmayı planlıyor.

Bu duyuru, Google’ın geçtiğimiz yıl kullanıma sunduğu Nano Banana modelinin ardından geliyor. Nano Banana, Gemini’nin zekâsını görsel üretim ve düzenleme tarafına taşıyarak kullanıcıların eski fotoğrafları yenilemesine, eskizlerden tasarımlar oluşturmasına ve fikirlerini görselleştirmesine yardımcı olmuştu. Google şimdi bu yaklaşımı video üretimi ve daha kapsamlı çok modlu içerik oluşturma tarafına genişletiyor.

Gemini Omni’nin dikkat çeken taraflarından biri, yalnızca içerik üretmesi değil, aynı zamanda kullanıcıların videoları konuşarak düzenleyebilmesi. Kullanıcılar, oluşturdukları videolar üzerinde sohbet ederek değişiklik isteyebilecek ve model bu istekleri Gemini’nin gerçek dünya bilgisiyle birlikte değerlendirebilecek.

Google, Gemini’yi en başından itibaren yerel olarak çok modlu bir model ailesi olarak geliştirdiğini belirtiyor. Gemini Omni ile şirket, bu stratejide bir sonraki adıma geçerek yapay zekânın sadece metin, görsel veya video üreten ayrı araçlar yerine; farklı veri türlerini anlayan ve bunlardan yeni medya çıktıları oluşturabilen birleşik bir modele dönüşmesini hedefliyor.

Bu hamle, Google’ın üretken yapay zekâ yarışında özellikle video üretimi, görsel düzenleme ve çok modlu içerik oluşturma alanlarında daha agresif bir pozisyon almaya başladığını gösteriyor. Gemini Omni Flash’ın YouTube Shorts’a entegre edilmesi ise Google’ın bu teknolojiyi yalnızca profesyonel üretim araçlarında değil, günlük içerik üretimi ve kısa video ekosisteminde de yaygınlaştırmak istediğine işaret ediyor.

Gemini Omni Nedir?

Gemini Omni, Google’ın farklı girdi türlerinden farklı medya çıktıları üretebilen yeni çok modlu yapay zekâ model ailesidir. Model; metin, görsel, ses ve video gibi girdileri anlayarak ilk aşamada yüksek kaliteli video çıktıları oluşturabiliyor. İlerleyen dönemde görsel ve ses üretimi gibi farklı çıktı türlerini de desteklemesi planlanıyor.

Gemini Omni ile Videolar Doğal Dil Komutlarıyla Düzenlenebilecek

Gemini Omni, videoları doğal dil komutlarıyla düzenlemeyi kolaylaştırıyor. Kullanıcıların verdiği her yeni talimat, bir öncekinin üzerine inşa ediliyor. Böylece karakterler tutarlılığını koruyor, fiziksel gerçeklik bozulmuyor ve sahne daha önce yaşananları hatırlayarak ilerliyor.

Gemini Omni ile kullanıcılar çevrelerindeki dünyayı dönüştürebiliyor. Videodaki belirli unsurları değiştirmek ya da sahnenin tamamını yeniden kurgulamak mümkün hale geliyor. Böylece mevcut video, kullanıcıların kendi başına çekemeyeceği yeni bir görsel anlatının başlangıç noktasına dönüşüyor.

Prompt: Baloncuklardan bir heykel yapın.

Gemini Omni ile Videodaki Aksiyon Yeniden Kurgulanabilecek

Gemini Omni, kullanıcıların çektikleri videolardaki aksiyonu yalnızca doğal dil komutlarıyla yeniden kurgulamasına olanak tanıyor. Kullanıcılar Omni’den videoda yaşananları değiştirmesini isteyerek sahnedeki hareket akışını düzenleyebiliyor.

Bu özellik sayesinde videoya yeni karakterler veya nesneler eklemek, mevcut aksiyonu değiştirmek ya da sıradan bir anı beklenmedik bir sahneye dönüştürmek mümkün hale geliyor.

Prompt: Kişi aynaya dokunduğunda, ayna sıvı gibi güzelce dalgalansın ve kişinin kolu yansıtıcı ayna malzemesine dönüşsün.

Prompt: Odanın ışıklarını kısın. Elin üzerinde hareket eden, havada süzülen cam bir kürenin içine siyah beyaz dama desenli bir oda yerleştirin. Odanın içinde, küreyi tutan aynı elin tekrarlayan bir temsili yer alsın ve böylece sonsuz sayıda oda döngüsü oluşsun. Kamera yavaşça kürenin içine yaklaşarak bir video döngüsü oluştursun.

Gemini Omni, Fikirleri Gemini’nin Dünya Bilgisiyle Hayata Geçiriyor

Gemini Omni, yalnızca gerçekçi görünen sahneler oluşturmakla kalmıyor; bir sahnede bundan sonra ne olması gerektiğini de akıl yürüterek belirleyebiliyor. Fizik kurallarına dair sezgisel anlayışını Gemini’nin tarih, bilim ve kültürel bağlam bilgisiyle birleştiren model, fotogerçekçilik ile anlamlı hikâye anlatımı arasındaki boşluğu kapatmayı hedefliyor.

Omni, yerçekimi, kinetik enerji ve akışkan dinamiği gibi kuvvetlere dair gelişmiş sezgisel anlayışı sayesinde daha gerçekçi sahneler oluşturulmasına imkân tanıyor. Böylece kullanıcılar, fiziksel olarak daha tutarlı ve inandırıcı görseller üretebiliyor.

Prompt: Zincirleme reaksiyon tarzında bir ray üzerinde hızla yuvarlanan bir bilye, kesintisiz ve akıcı bir çekim.

Gemini Omni, Farklı Girdi Türlerinden Tek Bir Video Oluşturabiliyor

Gemini Omni, kullanıcıların farklı referans türlerini bir araya getirerek video üretmesine olanak tanıyor. Görsel, metin, video veya ses gibi herhangi bir referans, Omni tarafından tek ve bütünlüklü bir çıktıya dönüştürülebiliyor.

İlk aşamada ses tarafında yalnızca ses referansları desteklenecek. Ancak Google, diğer ses girdi türlerinin de yakında kullanıma sunulacağını belirtiyor.

Prompt: image_0.png dosyasına dayalı, dinamik bilim kurgu film tarzı bir video. Öğeler, audio_0.wav dosyasındaki müziğin ritmine senkronize olarak video_0.mp4 dosyasındaki gibi ışık saçsın.

Gemini Omni ile Kullanıcılar Kendi Dijital Avatarlarıyla Video Oluşturabilecek

Google, yapay zekâyı sorumlu şekilde geliştirmeye odaklandığını ve kullanıcıları olası zararlardan korumak için yapay zekâ araçlarının kullanımına yönelik net politikalara sahip olduğunu belirtiyor. İlk aşamada kullanıcılar, Avatarlar özelliğiyle kendi seslerini kullanarak videolar oluşturabilecek. Bu özellik, kullanıcıların kendilerine benzeyen ve kendileri gibi konuşan dijital bir versiyon oluşturarak video üretmesine imkân tanıyor.

Avatar özelliğinin ötesinde, videolardaki ses ve konuşmaları değiştirmeye yönelik düzenleme kabiliyetleri için Google’ın test süreci devam ediyor. Şirket, bu özelliği kullanıcılara sorumlu bir şekilde nasıl sunabileceğini daha iyi anlamak için çalışmalarını sürdürüyor.

Omni ile oluşturulan tüm videolarda, Google’ın görünmez SynthID dijital filigranı yer alıyor. Kullanıcılar, videoların Gemini Omni ile üretilip üretilmediğini Gemini uygulaması, Chrome’daki Gemini ve Google Arama üzerinden kolayca doğrulayabiliyor. Google ayrıca, içeriklerin web genelinde nasıl oluşturulduğunu ve düzenlendiğini anlamaya yardımcı olmak için içerik şeffaflığı ve doğrulama araçlarını genişlettiğini belirtiyor.

Google, Omni ailesinin ilk modeli olan Gemini Omni Flashı kullanıma sundu. Gemini Omni Flash, bugünden itibaren dünya genelindeki Google AI Plus, Pro ve Ultra abonelerine Gemini uygulaması ve Google Flow üzerinden sunuluyor. Model ayrıca bu haftadan itibaren YouTube Shorts ve YouTube Create App kullanıcılarına ücretsiz olarak açılıyor.

Google, Gemini Omni Flash’ın önümüzdeki haftalarda geliştiriciler ve kurumsal müşteriler için API üzerinden de kullanıma sunulacağını açıkladı.

FounderN, Türkiye’nin girişim ve teknoloji haber platformudur.

LinkedIn | Instagram | FounderN 09:13 Bülteni | FounderN Daily

İsmail Karaçengel

İsmail Karaçengel, uzun yıllar girişimcilik ve teknoloji odaklı içerikler üreten. Teknolojiyi ve insanı odağına alan fikirler ile birçok girişim kuran bir internet girişimcisidir. 2020 yılında FounderN kurarak amacı girişimcilik ve teknoloji ekosistemi için yeni bir kaynak yaratmaktır.

İlginizi çekebilir

Anthropic - Claude Kimlik Doğrulaması

Alibaba, Çalışanlarına Claude Code Kullanımını Yasaklıyor

by İsmail Karaçengel

Alibaba’nın, Anthropic’in kodlama aracı Claude Code’u yüksek riskli yazılım olarak sınıflandırdığı ve çalışanlarını kendi Qoder aracına yönlendirdiği bildirildi. Çin merkezli teknoloji devi Alibaba, çalışanlarının Anthropic’in Claude Code adlı...

OpenAI Trump

OpenAI’dan ABD Kamu Fonuna Yüzde 5 Hisse Önerisi

by İsmail Karaçengel

OpenAI CEO’su Sam Altman’ın, şirketin yüzde 5 hissesinin ABD’de kurulacak bir egemen varlık fonuna devredilmesini önerdiği bildirildi. Financial Times’ın konuya yakın iki kaynağa dayandırdığı haberine göre OpenAI CEO’su...

microsoft scaled

Microsoft’tan 2,5 Milyar Dolarlık Kurumsal AI Hamlesi: Microsoft Frontier Company

by İsmail Karaçengel

Microsoft, kurumsal müşterilerin yapay zekâ projelerini daha başarılı şekilde hayata geçirmesine odaklanan yeni bir operasyonel iş birimi kurduğunu duyurdu. Microsoft Frontier Company adı verilen yeni yapı, Microsoft’un mevcut...

Etched

Nvidia Rakibi Etched, AI Çipi İçin 1 Milyar Dolarlık Sipariş Aldı

by İsmail Karaçengel

Nvidia’ya rakip yapay zekâ çipi geliştiren Etched, ilk ürününe yönelik 1 milyar dolarlık sözleşmeli sipariş aldığını açıkladı. Şirket, TSMC’nin yılın başlarında çipi başarıyla üretmesinin ardından ürününü müşterilerle test...

Next Post

GeminiAI Asistan

Gemini, 7/24 Çalışan Daha Proaktif Bir AI Asistanına Dönüşüyor

Girişim Haberleri, Kasım 2020'den bu yana aktif olan bir dijital medya platformudur. Girişimcilik dünyasının en güncel haberlerini yenilikçi yaklaşımlarla sunan FounderN, Eylül 2024 itibarıyla bu isimle faaliyetlerine devam edecek.

Bizi takip et.

©️ FounderN, 2020 Tüm hakları saklıdır. Bu web sitesinde yer alan tüm yazılar, bilgi notları, görseller ve logolar 5846 sayılı Fikir ve Sanat Eserleri Kanunu kapsamında koruma altındadır. İçeriklerin tamamının veya bir kısmının izinsiz kopyalanması, çoğaltılması, yayılması veya kaynak gösterilmeksizin paylaşılması yasaktır. İzinsiz kullanım halinde hukuki yollara başvurma hakkı saklıdır.

No Result

View All Result

©️ FounderN, 2020 Tüm hakları saklıdır. Bu web sitesinde yer alan tüm yazılar, bilgi notları, görseller ve logolar 5846 sayılı Fikir ve Sanat Eserleri Kanunu kapsamında koruma altındadır. İçeriklerin tamamının veya bir kısmının izinsiz kopyalanması, çoğaltılması, yayılması veya kaynak gösterilmeksizin paylaşılması yasaktır. İzinsiz kullanım halinde hukuki yollara başvurma hakkı saklıdır.