Sony’nin Yeni Müzik Dehası: Diff-A-Riff

  • Sony CSL’deki araştırmacılar, müzisyenlere, müzik yapımcılarına ve diğer müzik meraklılarına yaratıcı çalışmalarında yardımcı olmak için tasarlanmış çeşitli yapay zeka destekli çözümler üzerinde çalışıyor.
  • arXiv ön baskı sunucusunda yayınlanan bir makalede, herhangi bir müzik için yüksek kaliteli enstrümantal eşlik üretebilen, gelecek vaat eden bir hesaplama modeli olan Diff-A-Riff’i tanıtıldı.

Son yıllarda birçok mühendis, sanatçıların çalışmalarını destekleyebilecek, farklı içerik türlerinin üretimini hızlandıracak veya geliştirecek yapay zeka (AI) tabanlı araçlar geliştirmeye başladı. Bunlar arasında müzik parçaları oluşturabilen ve müzik prodüksiyonunun bazı yönlerini kolaylaştırabilen hesaplama modelleri de yer alıyor.

Sony CSL Paris’in müzik ekibi Tech Xplore’a verdiği demeçte, “Son makalemiz, bas eşlikleri oluşturma konusundaki önceki araştırmamızı temel alıyor” dedi. “Daha önceki çalışmamız mevcut parçaları tamamlamak için bas hatları oluşturmaya odaklanırken, Diff-A-Riff bu konsepti herhangi bir enstrüman türünde tek enstrüman eşlikleri oluşturacak şekilde genişletiyor.”

Diff-A-Riff şematik görseli

“Bu evrim, genellikle ek enstrümanlar ekleyerek mevcut kompozisyonlarını geliştirmek için araçlar arayan müzik yapımcılarının ve sanatçıların pratik ihtiyaçlarından ve enstrüman türleri / tınıları konusunda esnek olma isteklerinden ilham aldı.”

Sony CSL Paris’teki müzik ekibinin son çalışmasının temel amacı, her seferinde tek bir enstrümana odaklanarak belirli bir müzikal bağlamla sorunsuz bir şekilde bütünleşen yüksek kaliteli enstrümantal eşlikler üretebilen çok yönlü bir yapay zeka sistemi oluşturmaktı. Geliştirdikleri araç, iki farklı ve güçlü derin öğrenme tekniğine dayanıyor: gizli difüzyon modelleri ve tutarlılık oto kodlayıcıları.

Diff-A-Riff, enstrümantal eşlik üretimi için diğer araçlara göre çok sayıda avantaja sahip. Bunlardan ilki, kullanıcıların hem ses hem de metin istemlerini koşullandırmasına olanak tanıyan ve eşliklerin oluşturulmasına rehberlik etmede daha fazla esneklik sunan çok yönlü kontrolü. Buna ek olarak, Diff-A-Riff 48kHz’lik sahte stereo ses ile yüksek kaliteli çıktılar üretiyor.

Sony CSL, Diff-A-Riff YouTube tanıtım filmi

Ekip, “Diff-A-Riff ayrıca 64x sıkıştırma oranı kullandığımız için yaratım süresini ve bellek kullanımını önceki sistemlere kıyasla önemli ölçüde azaltıyor” dedi. “Herhangi bir müzikal bağlam için eşlik üretebildiğini gördük, bu da onu müzik yapımcıları ve sanatçılar için değerli bir araç haline getiriyor.

“Ayrıca, enstrüman referansları ve metin istemleri arasında enterpolasyon, stereo genişliğinin tanımlanması ve döngüler için kesintisiz geçişler oluşturma imkanı gibi ek kontrollere sahip.”

Sony CSL müzik ekibi, modellerini bir dizi testle değerlendirdi. Model, insan dinleyicilerin insan müzisyenler tarafından çalınan kayıtlı eşliklerden ayırt edemediği çeşitli müzik parçaları için yüksek kaliteli enstrümantal eşlikler ürettiği için bulgular oldukça umut verici.

Bir Dakikalık Ses İçin Üç Saniyelik Üretim Hızı

“Diff-A-Riff, gerçek dünya senaryolarında müzik prodüksiyonuna, yaratıcı iş birliğine ve ses tasarımına uygulanabilir.”. “Bir dakikalık ses için üç saniyelik üretim hızı benzeri görülmemiş bir hız ve bu tutarlılık otomatik kodlayıcının yüksek sıkıştırma oranıyla elde ediliyor” açıklaması yapıldı. 

Sony CSL’de geliştirilen enstrümantal eşlik oluşturma aracı, yakında dünya çapındaki müzik yapımcıları tarafından kullanılabilir ve mevcut bestelerini tamamlayan enstrümantal parçalar oluşturmalarına olanak tanıyabilir. Diff-A-Riff ayrıca sanatçılar tarafından yeni müzikal fikirleri kolayca keşfetmek için veya ses tasarımcıları tarafından projeleri için farklı tınıları veya çalma stillerini hızla test etmek için kullanılabilir.

Ekip, “Gelecekteki araştırma planlarımız arasında kontrol mekanizmalarını geliştirerek Diff-A-Riff’in yeteneklerini arttırmak ve modeli müzik üretim sürecinin çeşitli aşamalarına entegre etmenin yeni yollarını keşfetmek yer alıyor” diye ekledi.

“Modeli amatörler ve profesyoneller de dahil olmak üzere sanatçılar için daha erişilebilir ve kullanışlı hale getirmek için daha da sezgisel girdiler sağlamayı hedefliyoruz. Ayrıca, modellerimizi daha da iyileştirmek ve doğrulamak için müzisyenler ve bestecilerle işbirliği yaparak müzik endüstrisindeki kullanıcıların pratik ihtiyaçlarını karşılamalarını sağlamayı planlıyoruz.”

Derleyen: Enis Yabar

En Son

Project Hail Mary: NASA Bilimi Bilim Kurgunun Gerçek Sınırlarını Zorluyor mu?

*Project Hail Mary* ile yeniden gündeme gelen derin uzay yolculuğu ve NASA’nın gerçek bilimsel çalışmaları, bilim kurgu ile gerçeklik arasındaki sınırın aslında ne kadar ince olduğunu bir kez daha tartışmaya açıyor.

Avatar Video Oyunu O Kadar İyi ki Filmlere Gerek Kalmayabilir

Avatar evreni uzun süredir sinema ile özdeşleşmiş olsa da, yeni video oyunu deneyimi bu dünyayı izlemekten çıkarıp doğrudan yaşanabilir bir gerçekliğe dönüştürerek filmlerin rolünü bile sorgulatıyor.

Bu Ay İzleyebileceğiniz En İyi 10 Dizi

Dijital platformların içerik bombardımanına dönüştüğü günümüzde, gerçekten izlemeye değer dizileri seçmek her zamankinden daha zor hale gelirken, öne çıkan yapımlar izleyicilere güçlü ve unutulmaz deneyimler sunmayı başarıyor.

Yılın En Aptalca Hack’i Çok Gerçek Bir Sorunu Ortaya Çıkardı

Silikon Vadisi’nde yaya geçidi butonlarının hacklenmesiyle ortaya çıkan tuhaf olay, ilk bakışta basit bir şaka gibi görünse de aslında modern şehirlerin siber güvenlik konusunda ne kadar savunmasız olduğunu gözler önüne serdi.

Bültene Kaydol

Üye Özel

Yapay Zekâ Damgası: Dünyanın Prestijli Girişim Gününde 16 Çarpıcı Startup

Y Combinator’ın Winter 2026 Demo Day etkinliğinde tanıtılan yaklaşık 190 girişim arasından öne çıkan 16 startup, yapay zekânın farklı sektörlerde nasıl dönüştürücü bir rol üstlendiğini gözler önüne serdi. Hukuktan sağlığa, güvenlikten enerjiye uzanan projeler dikkat çekti.

Kagi’nin İnsan Odaklı İnterneti: ‘Küçük Web’le Tanışın

Kagi’nin ‘Küçük Web’ girişimi, interneti sadece insanlar tarafından yazılmış içeriklerle keşfetmeye odaklanıyor. Kişisel bloglar, bağımsız videolar ve web çizgi romanları, mobil ve web uygulamaları üzerinden daha erişilebilir hâle geliyor.

Yapay Zekâyla Konuşmanın Doğru Yolu

Yapay zekâya “lütfen” demek işe yarıyor mu? Onu tehdit etmek mi, yoksa bir bilim kurgu dizisindeki karakter gibi konuşturmak mı daha etkili? Uzmanlara göre sohbet robotlarından daha iyi sonuç almanın yolu sandığınız kadar gizemli değil.

LGBTQ+ Sporcular 2026 Kış Olimpiyat Oyunlarında Ön Planda Olacak

Açık kimlikleriyle LGBTQ+ olan yaklaşık 50 Olimpiyat sporcusu, konuşma ve yarışma hakları saldırı altında olmasına rağmen Kış Olimpiyat Oyunları boyunca çeşitli etkinliklerde yer alıyor.

Kripto Parayla Finanse Edilen İnsan Ticareti Hızla Artıyor

Tahminlere göre, fuhuş ve dolandırıcılık amacıyla insan ticareti işlemlerinde kripto para birimlerinin kullanımı 2025 yılında neredeyse iki katına çıktı.

- dijitaliyidir Sponsor Desteği -

spot_imgspot_img

Project Hail Mary: NASA Bilimi Bilim Kurgunun Gerçek Sınırlarını Zorluyor mu?

*Project Hail Mary* ile yeniden gündeme gelen derin uzay yolculuğu ve NASA’nın gerçek bilimsel çalışmaları, bilim kurgu ile gerçeklik arasındaki sınırın aslında ne kadar ince olduğunu bir kez daha tartışmaya açıyor.

Bu Ay İzleyebileceğiniz En İyi 10 Dizi

Dijital platformların içerik bombardımanına dönüştüğü günümüzde, gerçekten izlemeye değer dizileri seçmek her zamankinden daha zor hale gelirken, öne çıkan yapımlar izleyicilere güçlü ve unutulmaz deneyimler sunmayı başarıyor.