- Geliştirilen hoparlör, odadaki farklı sesleri tanımlamak ve komut üzerine bunları susturmak için kendi kendine konuşlanan bazı mikrofonlar kullanıyor.
- Araştırmacılar, her bir kişinin sesini ayırmak ve konumlarını takip etmek için sinir ağlarından yardım alıyor.
Yeni icat edilen bu hoparlör, odada “konuşma bölgeleri” oluşturarak mikrofon sistemini kendi kendine konuşlanacak şekilde düzenliyor. Böylece farklı sesleri hareket ederken bile takip edebiliyor ve tanımlayabiliyor.
Buluşun arkasındaki araştırmacılar, bu nokta tespit lokalizasyonunun, yalnızca eşzamanlı konuşmaları ayırmalarına değil, aynı zamanda toplantılardaki video konferanslar gibi uygulamalar için gürültülü bölgeleri hatta rahatsız edici buldukları insanları bile sessize almalarına olanak tanıdığını söylüyor.
Nature Communications dergisinde, alışılmışın dışındaki bu hoparlör; kendiliğinden konuşlanan mikrofonlar, birbirleriyle iletişim kuran minik tekerlekleri üzerinde kendi başlarına farklı noktalara hareket eden ve gerektiğinde şarj istasyonuna dönen yüksük boyutlu robotlar olarak tanımlanıyor.
Çalışmanın eş başkan yazarı Malek Itani, Paul G. Allen Bilgisayar Bilimi ve Mühendisliği Okulunda yapılan bir açıklamada, “İlk defa, robotik ‘akustik sürü’ dediğimiz şeyi kullanarak bir odada konuşan birden fazla kişinin konumunu takip edebiliyor ve konuşmalarını ayırabiliyoruz.” dedi.
Araştırmacılar, prototip botların çevrelerinde gezinmek için yüksek frekanslı ekolokasyona benzer bir teknik kullandığını söylüyor. Veriyi işleyen sinir ağı, mikrofonları olabildiğince uzağa yayarak daha hassas hesaplamalar yapabiliyor. Ancak şimdilik robotlar, yalnızca 2 boyutlu alanda konumlanabildikleri için dolaşımları masa üstleriyle sınırlı.
Allen Okulundan eş baş yazar Tuochao Chen yaptığı açıklamada, “Dört kişinin ikili konuşma yapmasını sağlayabilir, dört sesten herhangi birini izole edebilir ve seslerin her birinin odadaki yerini tespit edebilirsiniz.” dedi.
Chen’in iddiaları gerçek dünyadaki deneylerin sonuçlarıyla doğrulanıyor.
Araştırmacılar robot sürüsünü ofis ve mutfak gibi yerlerde üç ila beş kişi konuşurken test etti; sistemin konumlar veya sesler hakkında önceden hiçbir bilgisi yoktu. Bu engellere rağmen cihaz yine de sesleri %90 oranında birbirinden 5 metre uzakta konumlandırabildi. Ortalama olarak sistemin üç saniyelik sesi işlemesi 1,82 saniye sürüyor; bu da video konferansları biraz hantal hale getirebilir.
İlerleyen aşamalarda araştırmacılar, gürültü önleyici kulaklık ile mikrofonları kullanarak bu susturma ve ayırma tekniklerini fiziksel alanda, gerçek zamanlı olarak tüm odaya uygulayabilmek istiyor.
Derleyen: Damla Şayan