
Runway AI’nin yeni Gen-4 modelinin Sora’yı geride bırakması gerektiği bir dönemde, yapay zeka video jeneratörlerine duyduğum ilgi beni her zaman heyecanlandırıyor. Bu teknolojiler her ne kadar bazen eksik olsa da eğlenceli olabiliyor, ve doğru şekilde çalıştıklarında ise oldukça etkileyici sonuçlar ortaya çıkarabiliyorlar. Son zamanlarda, Runway’in yeni Gen-4 modelinin tanıtıldığı haberi üzerine merakım arttı ve hemen bu yeni modelle oynamaya başladım.
Runway, Gen-4 modelinin önceki Gen-3 modeline göre kalite ve tutarlılık açısından büyük bir adım atacağına dair iddialarda bulunuyordu. Özellikle, karakterlerin sahneler arasında tutarlı bir şekilde görünmesini sağlamak, daha akıcı hareketler ve gelişmiş çevresel fiziklerin iyileştirilmesi vaat ediliyordu. Bu tür iddialar kulağa oldukça etkileyici geliyor, ancak bu tür yapay zeka sistemlerinin her zaman vaat ettikleri gibi çalışmadığı da bir gerçek. Dolayısıyla, yeni Runway modelinin bu vaatlerini test etmek için heyecanlandım.
Gen-4’ün tanıtımı, görsel referanslar ve açıklayıcı metinler verildiğinde, videoların kullanıcıların hayal ettiği şekilde benzer bir içerik üretme konusunda son derece iyi olduğunu belirtiyordu. Bu açıklama, OpenAI’nin kendi AI video oluşturma aracı olan Sora’yı tanıtmaya benziyordu. Ancak Sora’nın ürettiği videolar, genellikle muazzam güzellikte olsalar da, bazen kalite açısından güvenilir olmuyordu. Bir sahne mükemmel olabiliyor, ancak bir sonraki sahnede karakterler hayalet gibi havada süzülebiliyor ya da kapılar hiç bir yere gitmiyordu.
Runway Gen-4, video üretiminde sihirli bir dokunuş vaat ediyordu, bu yüzden ben de bunu test etmek istedim. Fantezi temalı küçük bir üçleme oluşturmak istedim ve bu hikayede bir büyücüyü anlatmayı planladım. Hikayede, büyücü bir elf prensesiyle karşılaşıyor ve onu sihirli portallar aracılığıyla kovalamaya başlıyor. Sonra, karşılaştığı elf prensesi sihirli bir hayvan kılığına giriyor ve büyücü onu tekrar prenses haline dönüştürüyor.
Bu amaçla, büyük bir blockbuster film yapmak istemedim. Tek amacım, Gen-4’ün ne kadar esneyebileceğini görmekti. Gerçek bir büyücü fotoğrafım olmadığı için, ChatGPT’nin yeni geliştirilmiş görsel jeneratörünü kullanarak ikna edici görseller oluşturmayı tercih ettim. Sora, Hollywood’u fethetmeyebilir belki, ama ChatGPT tarafından üretilen bazı resimlerin kalitesini göz ardı edemem. İlk videomu oluşturduktan sonra, Runway’in “seed” ayarını kullanarak karakterlerin videolar arasında tutarlı görünmesini sağladım. Üç videoyu birleştirip tek bir film haline getirdim, her birinin arasında kısa bir ara verdim.
Sonuçlar ise beklentilerimle karışıktı. Video tamamen mükemmel değildi. Bazı nesnelerin hareketlerinde gariplikler vardı, arka plan öğeleri zaman zaman tuhaf bir şekilde parlıyordu. Ancak, karakterlerin hareketleri, ifadeleri ve duyguları oldukça gerçekçi ve etkileyiciydi. Bu, özellikle yapay zekanın video üretiminde geldiği noktayı düşündüğümüzde önemli bir gelişme.
Ayrıca, Runway’in sunduğu iterasyon seçenekleri hoşuma gitti. Bu seçenekler, bana fazla manuel ayar yapma yükü vermeden, yaratıcı sürece dahil olmamı sağladı. Yani, sadece bir düğmeye basarak video yaratma sürecinde yer almak yerine, biraz da olsa süreci yönlendirebiliyordum. Bu, beni pasif bir kullanıcı olmaktan çıkarıp, aktif bir yaratıcı yapıyordu.
Peki, Runway Gen-4, Sora ve OpenAI’nin profesyonel film yapımcılarıyla iş birliği yaptığı video üretim alanında bir devrim yaratabilir mi? Şu an için hayır, ama amatör bir film yapımcısı olsaydım ve yaratmak istediğim fikirlerin nasıl görüneceğini düşük maliyetle görmek isteseydim, kesinlikle Runway’i denemek isterdim. Bu, Hollywood tarzı bir film çekmeye başlamadan önce, fikirlerimi görselleştirme konusunda daha uygun maliyetli bir başlangıç noktası olabilir.
Eğer bu teknolojiyle rahatlamayı başarır ve her seferinde istediğim sonuçları alacak kadar ustalaşırsam, belki de Sora’yı hiç düşünmem. Çünkü Runway, kullanıcı tabanını etkilemeyi hedefliyorsa, bu tür gelişmiş araçlarla potansiyel yaratıcılarına büyük fırsatlar sunuyor olabilir.








