Google, “metin açıklamalarından yüksek doğrulukta müzik” üretebilen ve DALL-E 2 ile benzer çalışan MusicLM adlı yeni yapay zekâ modelini tanıttı.
Yapay zekânın gün geçtikçe popülerleşmesiyle kullanım alanı genişliyor. ChatGPT patlamasının ardından gözler yapay zekâ destekli müzik programlarına çevrilmişti. Google da çorbada tuzum olsun diyerek yazılanları müziğe dönüştürebilen yeni yapay zekâsı MusicLM’in testlerine başladı.
Geçtiğimiz yıl AudioLM adı verilen ve birkaç saniyelik sesle yönlendirildikten sonra ses üreten farklı bir yapay zekâ sistemini test eden Google araştırmacıları, net bir açıklamaya dayalı olarak müzik oluşturan yeni bir yapay zekâ modeli olan MusicLM’in haberini paylaştı.
Açıklamaya göre MusicLM “birkaç dakika boyunca tutarlı kalan 24 kHz’de müzik üretiyor” ve “hem ses kalitesi hem de metin açıklamasına bağlılık açısından önceki sistemlerden daha iyi performans gösteriyor:
“Gelecekteki araştırmaları desteklemek için uzmanlar tarafından sağlanan zengin metin açıklamaları ile 5.5k müzik-metin çiftlerinden oluşan bir veri kümesi olan MusicCaps’i herkese açık olarak yayımlıyoruz.”
DALL-E 2 ile benzerliği bulunan MusicLM, DALL-E 2’den farklı olarak yazılanların görsel karşılığını üretmek yerine müzik olarak ortaya çıkarıyor. Bir enstrümanla ritim oluşturabileceğiniz gibi tam anlamıyla bitmiş bir parça da üretebilirsiniz.
Sözleri aklınızda değilse yazmak yerine mırıldanmanıza da imkân tanıyor:
MusicLM’nin ürettiği sese ilişkin çeşitli açıklamalar bulunuyor: “Yükselen bir synth, çok fazla yankı ile bir arpej çalıyor. Pedler, alt bas hattı ve yumuşak davullarla destekleniyor. Bu şarkı yatıştırıcı ve maceracı bir atmosfer yaratan synth sesleriyle dolu. Bir festivalde iki şarkı boyunca bir birikim için çalınabilir.”
Bu ayın başlarında Nick Cave kendi tarzında yazılmış AI ChatGPT sözlerine yanıt vererek şarkının “berbat” olduğunu ve “kıyametin yolda olduğunu” söylemişti.
MusicLM’in Github sayfasında Google AI ekibi tarafından yapay zekâya hazırlatılmış bazı örnekler bulunuyor. Şu anlık geliştirme aşamasındaki yapay zekâ bazı sesleri net veremese de üretilmiş seslerin Hi-Fiyani yüksek çözünürlükte olduğu görülüyor. Ek olarak bu yapay zekâyı ChatGPT ile birleştirerek çok daha detaylı ve özgün müziklerin de hazırlanabileceği belirtiliyor.
Test aşamasındaki yapay zekânın hazırladığı müzikleri buradan deneyebilirsiniz.
Derleyen: Hatice Bulut