- NVIDIA, metinlerden ses üretebilen ve mevcut ses dosyalarını düzenleyebilen yeni bir yapay zeka modeli olan Fugatto’yu tanıttı.
NVIDIA, “ses için İsviçre çakısı” olarak tanımladığı yeni bir deneysel yapay zeka modeli olan Fugatto’yu duyurdu. Foundational Generative Audio Transformer Opus 1’in kısaltması olan Fugatto, metin istemlerinden komutlar alarak ses oluşturabiliyor veya mevcut müzik, ses ve ses dosyalarını düzenleyebiliyor.
Fugatto’nun Yetenekleri
- Metinden Ses Üretme: Fugatto, verilen metin açıklamalarına dayanarak çeşitli sesler, müzikler ve efektler üretebilir.
- Ses Düzenleme: Mevcut ses dosyalarını düzenleyebilir, örneğin bir şarkının temposunu değiştirebilir veya bir ses kaydına efektler ekleyebilir.
- Çok Dilli ve Çok Aksanlı: Dünya çapında bir yapay zeka araştırmacıları ekibi tarafından tasarlanan Fugatto, farklı dillerde ve aksanlarda ses üretebilir.
Kullanım Alanları
NVIDIA, Fugatto’nun müzik prodüksiyonu, dil öğrenme araçları, video oyun geliştirme gibi birçok alanda kullanılabileceğini belirtiyor.
- Müzik Prodüksiyonu: Müzik yapımcıları, şarkı fikirleri için hızlı bir şekilde prototip oluşturmak ve farklı stiller, sesler ve enstrümanlar denemek için Fugatto’yu kullanabilir.
- Dil Öğrenme: Fugatto, kullanıcıların seçtiği sesle dil öğrenme materyalleri oluşturmak için kullanılabilir.
- Oyun Geliştirme: Oyun geliştiricileri, oyun içi olaylara ve oyuncu seçimlerine göre önceden kaydedilmiş ses dosyalarının varyasyonlarını oluşturmak için Fugatto’dan yararlanabilir.
Fugatto’nun Diğer Özellikleri
Araştırmacılar, Fugatto’nun ince ayarlarla önceden eğitilmediği görevleri de yerine getirebildiğini keşfetti. Örneğin, belirli bir aksanla öfkeli konuşma üretmek veya gök gürültülü fırtına sırasında kuşların şarkı söyleme sesi gibi ayrı ayrı eğitildiği talimatları birleştirebilir. Ayrıca, zamanla değişen sesler de üretebilir, örneğin bir yağmur fırtınasının şiddetini artırarak veya azaltarak.
Erişilebilirlik
NVIDIA, Fugatto’nun halka açık olup olmayacağını henüz açıklamadı. Ancak, metinden ses üretebilen ilk yapay zeka teknolojisi değil. Meta daha önce metin açıklamalarından sesler oluşturabilen açık kaynaklı bir yapay zeka kiti yayınlamıştı. Google’ın da MusicLM adlı metinden müziğe yapay zekası bulunuyor ve insanlar şirketin AI Test Kitchen web sitesi aracılığıyla buna erişebiliyor.
Derleyen: Enis Yabar