Çarşamba, Mayıs 20, 2026
  • Login
Girişimcilik, Startup ve Teknoloji Haberleri
  • Haberler
    • Teknoloji Haberleri
    • Gündem Haberleri
      • Sosyal Girişimcilik
      • Yapay Zeka Gündemi
      • Fintech Gündemi
      • Sağlık Teknolojileri Gündemi
      • Sürdürülebilirlik Gündemi
      • Oyun(Gaming) Girişimciliği
      • Günlük Bülten
      • Dijital Dünya
    • Yatırım Haberleri
    • Girişim Haberleri
      • Türk Girişimler
      • Kurum İçi Girişimcilik
  • FN’Raporlar
  • FN’Blog
  • Yapay Zekâ Terimleri Sözlüğü
  • FN Etkinlikleri
  • İletişim
No Result
View All Result
  • Haberler
    • Teknoloji Haberleri
    • Gündem Haberleri
      • Sosyal Girişimcilik
      • Yapay Zeka Gündemi
      • Fintech Gündemi
      • Sağlık Teknolojileri Gündemi
      • Sürdürülebilirlik Gündemi
      • Oyun(Gaming) Girişimciliği
      • Günlük Bülten
      • Dijital Dünya
    • Yatırım Haberleri
    • Girişim Haberleri
      • Türk Girişimler
      • Kurum İçi Girişimcilik
  • FN’Raporlar
  • FN’Blog
  • Yapay Zekâ Terimleri Sözlüğü
  • FN Etkinlikleri
  • İletişim
No Result
View All Result
Girişimcilik, Startup ve Teknoloji Haberleri
No Result
View All Result

Google, Görsel ve Video Üretimi İçin Gemini Omni Modelini Duyurdu

İsmail Karaçengel by İsmail Karaçengel
20/05/2026
in Yapay Zeka Gündemi
Reading Time: 7 mins read
0
Gemini Omni

Gemini Omni

Facebook'ta PaylaşX'te PaylaşWhatsapp'ta PaylaşLinkedln'de Paylaş

Google, yapay zekâ modellerini metin tahmin eden sistemlerden gerçekliği daha iyi anlayan ve simüle edebilen yapılara taşımak için yeni Gemini Omni model ailesini duyurdu. Şirketin yeni modeli, farklı girdi türlerinden farklı çıktı formatları üretebilen çok modlu bir yapay zekâ sistemi olarak konumlanıyor.

Google’a göre Gemini Omni, Gemini’nin akıl yürütme kabiliyetini şirketin üretken medya modelleriyle birleştiriyor. Bu sayede kullanıcılar görsel, ses, video ve metin gibi farklı girdileri bir araya getirerek yüksek kaliteli video çıktıları oluşturabilecek. Modelin ilk aşamada video üretimine odaklanacağı, ilerleyen dönemde ise görsel ve ses gibi farklı çıktı türlerini de destekleyeceği belirtiliyor.

Google, Omni ailesinin ilk modeli olarak Gemini Omni Flash’ı kullanıma sundu. Model bugünden itibaren Gemini uygulaması, Google Flow ve YouTube Shorts üzerinden denenebilecek. Şirket, önümüzdeki haftalarda Gemini Omni Flash’ı geliştiricilere ve kurumsal müşterilere API’ler üzerinden de açmayı planlıyor.

Bu duyuru, Google’ın geçtiğimiz yıl kullanıma sunduğu Nano Banana modelinin ardından geliyor. Nano Banana, Gemini’nin zekâsını görsel üretim ve düzenleme tarafına taşıyarak kullanıcıların eski fotoğrafları yenilemesine, eskizlerden tasarımlar oluşturmasına ve fikirlerini görselleştirmesine yardımcı olmuştu. Google şimdi bu yaklaşımı video üretimi ve daha kapsamlı çok modlu içerik oluşturma tarafına genişletiyor.

Gemini Omni’nin dikkat çeken taraflarından biri, yalnızca içerik üretmesi değil, aynı zamanda kullanıcıların videoları konuşarak düzenleyebilmesi. Kullanıcılar, oluşturdukları videolar üzerinde sohbet ederek değişiklik isteyebilecek ve model bu istekleri Gemini’nin gerçek dünya bilgisiyle birlikte değerlendirebilecek.

Google, Gemini’yi en başından itibaren yerel olarak çok modlu bir model ailesi olarak geliştirdiğini belirtiyor. Gemini Omni ile şirket, bu stratejide bir sonraki adıma geçerek yapay zekânın sadece metin, görsel veya video üreten ayrı araçlar yerine; farklı veri türlerini anlayan ve bunlardan yeni medya çıktıları oluşturabilen birleşik bir modele dönüşmesini hedefliyor.

Bu hamle, Google’ın üretken yapay zekâ yarışında özellikle video üretimi, görsel düzenleme ve çok modlu içerik oluşturma alanlarında daha agresif bir pozisyon almaya başladığını gösteriyor. Gemini Omni Flash’ın YouTube Shorts’a entegre edilmesi ise Google’ın bu teknolojiyi yalnızca profesyonel üretim araçlarında değil, günlük içerik üretimi ve kısa video ekosisteminde de yaygınlaştırmak istediğine işaret ediyor.

Gemini Omni Nedir?

Gemini Omni, Google’ın farklı girdi türlerinden farklı medya çıktıları üretebilen yeni çok modlu yapay zekâ model ailesidir. Model; metin, görsel, ses ve video gibi girdileri anlayarak ilk aşamada yüksek kaliteli video çıktıları oluşturabiliyor. İlerleyen dönemde görsel ve ses üretimi gibi farklı çıktı türlerini de desteklemesi planlanıyor.

Gemini Omni ile Videolar Doğal Dil Komutlarıyla Düzenlenebilecek

Gemini Omni, videoları doğal dil komutlarıyla düzenlemeyi kolaylaştırıyor. Kullanıcıların verdiği her yeni talimat, bir öncekinin üzerine inşa ediliyor. Böylece karakterler tutarlılığını koruyor, fiziksel gerçeklik bozulmuyor ve sahne daha önce yaşananları hatırlayarak ilerliyor.

Gemini Omni ile kullanıcılar çevrelerindeki dünyayı dönüştürebiliyor. Videodaki belirli unsurları değiştirmek ya da sahnenin tamamını yeniden kurgulamak mümkün hale geliyor. Böylece mevcut video, kullanıcıların kendi başına çekemeyeceği yeni bir görsel anlatının başlangıç noktasına dönüşüyor.

Prompt: Baloncuklardan bir heykel yapın.

Gemini Omni ile Videodaki Aksiyon Yeniden Kurgulanabilecek

Gemini Omni, kullanıcıların çektikleri videolardaki aksiyonu yalnızca doğal dil komutlarıyla yeniden kurgulamasına olanak tanıyor. Kullanıcılar Omni’den videoda yaşananları değiştirmesini isteyerek sahnedeki hareket akışını düzenleyebiliyor.

Bu özellik sayesinde videoya yeni karakterler veya nesneler eklemek, mevcut aksiyonu değiştirmek ya da sıradan bir anı beklenmedik bir sahneye dönüştürmek mümkün hale geliyor.

Prompt: Kişi aynaya dokunduğunda, ayna sıvı gibi güzelce dalgalansın ve kişinin kolu yansıtıcı ayna malzemesine dönüşsün.
Prompt: Odanın ışıklarını kısın. Elin üzerinde hareket eden, havada süzülen cam bir kürenin içine siyah beyaz dama desenli bir oda yerleştirin. Odanın içinde, küreyi tutan aynı elin tekrarlayan bir temsili yer alsın ve böylece sonsuz sayıda oda döngüsü oluşsun. Kamera yavaşça kürenin içine yaklaşarak bir video döngüsü oluştursun.

Gemini Omni, Fikirleri Gemini’nin Dünya Bilgisiyle Hayata Geçiriyor

Gemini Omni, yalnızca gerçekçi görünen sahneler oluşturmakla kalmıyor; bir sahnede bundan sonra ne olması gerektiğini de akıl yürüterek belirleyebiliyor. Fizik kurallarına dair sezgisel anlayışını Gemini’nin tarih, bilim ve kültürel bağlam bilgisiyle birleştiren model, fotogerçekçilik ile anlamlı hikâye anlatımı arasındaki boşluğu kapatmayı hedefliyor.

Omni, yerçekimi, kinetik enerji ve akışkan dinamiği gibi kuvvetlere dair gelişmiş sezgisel anlayışı sayesinde daha gerçekçi sahneler oluşturulmasına imkân tanıyor. Böylece kullanıcılar, fiziksel olarak daha tutarlı ve inandırıcı görseller üretebiliyor.

Prompt: Zincirleme reaksiyon tarzında bir ray üzerinde hızla yuvarlanan bir bilye, kesintisiz ve akıcı bir çekim.

Gemini Omni, Farklı Girdi Türlerinden Tek Bir Video Oluşturabiliyor

Gemini Omni, kullanıcıların farklı referans türlerini bir araya getirerek video üretmesine olanak tanıyor. Görsel, metin, video veya ses gibi herhangi bir referans, Omni tarafından tek ve bütünlüklü bir çıktıya dönüştürülebiliyor.

İlk aşamada ses tarafında yalnızca ses referansları desteklenecek. Ancak Google, diğer ses girdi türlerinin de yakında kullanıma sunulacağını belirtiyor.

Prompt: image_0.png dosyasına dayalı, dinamik bilim kurgu film tarzı bir video. Öğeler, audio_0.wav dosyasındaki müziğin ritmine senkronize olarak video_0.mp4 dosyasındaki gibi ışık saçsın.

Gemini Omni ile Kullanıcılar Kendi Dijital Avatarlarıyla Video Oluşturabilecek

Google, yapay zekâyı sorumlu şekilde geliştirmeye odaklandığını ve kullanıcıları olası zararlardan korumak için yapay zekâ araçlarının kullanımına yönelik net politikalara sahip olduğunu belirtiyor. İlk aşamada kullanıcılar, Avatarlar özelliğiyle kendi seslerini kullanarak videolar oluşturabilecek. Bu özellik, kullanıcıların kendilerine benzeyen ve kendileri gibi konuşan dijital bir versiyon oluşturarak video üretmesine imkân tanıyor.

Avatar özelliğinin ötesinde, videolardaki ses ve konuşmaları değiştirmeye yönelik düzenleme kabiliyetleri için Google’ın test süreci devam ediyor. Şirket, bu özelliği kullanıcılara sorumlu bir şekilde nasıl sunabileceğini daha iyi anlamak için çalışmalarını sürdürüyor.

Omni ile oluşturulan tüm videolarda, Google’ın görünmez SynthID dijital filigranı yer alıyor. Kullanıcılar, videoların Gemini Omni ile üretilip üretilmediğini Gemini uygulaması, Chrome’daki Gemini ve Google Arama üzerinden kolayca doğrulayabiliyor. Google ayrıca, içeriklerin web genelinde nasıl oluşturulduğunu ve düzenlendiğini anlamaya yardımcı olmak için içerik şeffaflığı ve doğrulama araçlarını genişlettiğini belirtiyor.

Google, Omni ailesinin ilk modeli olan Gemini Omni Flashı kullanıma sundu. Gemini Omni Flash, bugünden itibaren dünya genelindeki Google AI Plus, Pro ve Ultra abonelerine Gemini uygulaması ve Google Flow üzerinden sunuluyor. Model ayrıca bu haftadan itibaren YouTube Shorts ve YouTube Create App kullanıcılarına ücretsiz olarak açılıyor.

Google, Gemini Omni Flash’ın önümüzdeki haftalarda geliştiriciler ve kurumsal müşteriler için API üzerinden de kullanıma sunulacağını açıkladı.

FounderN, Türkiye’nin girişim ve teknoloji haber platformudur.

LinkedIn | Instagram | FounderN 09:13 Bülteni | FounderN Daily

Share187Tweet117SendShare33
İsmail Karaçengel

İsmail Karaçengel

İsmail Karaçengel, uzun yıllar girişimcilik ve teknoloji odaklı içerikler üreten. Teknolojiyi ve insanı odağına alan fikirler ile birçok girişim kuran bir internet girişimcisidir. 2020 yılında FounderN kurarak amacı girişimcilik ve teknoloji ekosistemi için yeni bir kaynak yaratmaktır.

İlginizi çekebilir

Osaurus

Mac Kullanıcılarına Yapay Zeka Özgürlüğü: Osaurus Hem Yerel Hem Bulut Modellerini Birleştiriyor

by Eda Arslantaş
15/05/2026
0

Eski Tesla ve Netflix mühendisi Terence Pae tarafından geliştirilen Osaurus, Mac ekosisteminde yapay zeka ajanları için devrimsel bir işletim katmanı sunuyor. Platform, kullanıcıların verilerini kendi cihazlarında tutarken yerel modeller...

openai scaled

Yapay Zeka Devinde Güvenlik Krizi: OpenAI Yazılım Saldırısını ve Sızıntıyı Kabul Etti

by Eda Arslantaş
15/05/2026
0

Popüler açık kaynak kütüphanesi TanStack’e düzenlenen sofistike bir siber saldırı, OpenAI’ı vurdu. İki şirket çalışanının cihazının ele geçirildiğini ve bazı iç kod depolarının sızdırıldığını doğrulayan yapay zeka devi,...

codex

Yazılımcılara Mobil Özgürlük: OpenAI Codex, ChatGPT Uygulamasına Geldi

by Eda Arslantaş
15/05/2026
0

Yapay zeka pazarındaki liderliğini korumak isteyen OpenAI, yapay zeka destekli kodlama asistanı Codex’i akıllı telefonlara taşıdı. iOS ve Android'deki ChatGPT uygulaması üzerinden erişilebilen bu yeni özellik, yazılımcıların hareket...

OpenAI - Daybreak

OpenAI’dan Siber Güvenlik Odaklı Yeni Girişim: Daybreak

by Burak Erdoğan
13/05/2026
0

OpenAI, siber savunma süreçlerini otomatize ederek hızlandıran ve Anthropic'in hamlelerine doğrudan rakip olarak konumlanan GPT-5.5 destekli Daybreak girişimini duyurdu. OpenAI, siber savunma mekanizmalarını yapay zeka modelleriyle entegre ederek...

Please login to join discussion
FounderN Logo Red e1777310691661

Girişim Haberleri, Kasım 2020'den bu yana aktif olan bir dijital medya platformudur. Girişimcilik dünyasının en güncel haberlerini yenilikçi yaklaşımlarla sunan FounderN, Eylül 2024 itibarıyla bu isimle faaliyetlerine devam edecek.

Bizi takip et.

  • FounderN Künye
  • İletişim
  • Etkinlikler
  • Editoryal Politika
  • Hakkımızda

©️ FounderN, 2020 Tüm hakları saklıdır. Bu web sitesinde yer alan tüm yazılar, bilgi notları, görseller ve logolar 5846 sayılı Fikir ve Sanat Eserleri Kanunu kapsamında koruma altındadır. İçeriklerin tamamının veya bir kısmının izinsiz kopyalanması, çoğaltılması, yayılması veya kaynak gösterilmeksizin paylaşılması yasaktır. İzinsiz kullanım halinde hukuki yollara başvurma hakkı saklıdır.

Welcome Back!

Login to your account below

Forgotten Password?

Retrieve your password

Please enter your username or email address to reset your password.

Log In

Add New Playlist

No Result
View All Result
  • Haberler
    • Teknoloji Haberleri
    • Gündem Haberleri
      • Sosyal Girişimcilik
      • Yapay Zeka Gündemi
      • Fintech Gündemi
      • Sağlık Teknolojileri Gündemi
      • Sürdürülebilirlik Gündemi
      • Oyun(Gaming) Girişimciliği
      • Günlük Bülten
      • Dijital Dünya
    • Yatırım Haberleri
    • Girişim Haberleri
      • Türk Girişimler
      • Kurum İçi Girişimcilik
  • FN’Raporlar
  • FN’Blog
  • Yapay Zekâ Terimleri Sözlüğü
  • FN Etkinlikleri
  • İletişim

©️ FounderN, 2020 Tüm hakları saklıdır. Bu web sitesinde yer alan tüm yazılar, bilgi notları, görseller ve logolar 5846 sayılı Fikir ve Sanat Eserleri Kanunu kapsamında koruma altındadır. İçeriklerin tamamının veya bir kısmının izinsiz kopyalanması, çoğaltılması, yayılması veya kaynak gösterilmeksizin paylaşılması yasaktır. İzinsiz kullanım halinde hukuki yollara başvurma hakkı saklıdır.