- Apple’ın sanal asistanı Siri, yakında “dudak okuma” gibi özel bir yeteneğe sahip olabilir.
- Şirketin patent başvurusu, hareket verilerinin bir kelime veya cümleyle eşleşip eşleşmediğini belirleyen bir sistemi tanımlıyor.
- Apple’ın bu teknolojiyi gerçekleştirmek için muhtemelen bir makine öğrenimi modeli geliştirmesi gerekecek.
Ortaya çıkan yeni bir Apple patenti, şirketin tescilli bir dudak okuma programının nasıl olacağı konusunda aktif olarak çalıştığını gösteriyor. Patent başvurusu ilk olarak bu yılın ocak ayında yapıldı. Bu başvuru, hareket verilerinin bir kelime veya cümleyle eşleşip eşleşmediğini belirleyen bir sistemi tanımlıyor. Dosyada, özellikle “Hey Siri”, “go to” veya “next song” gibi basit sesli komutların, kullanıcıların ağız hareketlerini analiz eden bir algoritma sayesinde nasıl geliştirilebileceği ele alınıyor.
Patent, ilk olarak Apple Insider tarafından belirtildiği üzere Siri gibi ses tanıma sistemlerinde bariz sorunlar yaşandığını açıklıyor. Sesler, arka plan gürültüsüyle bozulabilir. Dahası insanların seslerini sürekli olarak izleyen diğer sensörler, çok fazla pil ve işlem gücü tüketir. Böyle bir sistemin, cihazın kamerasını kullanması gerekmez. Bunun yerine ses tanıma yazılımı, telefonun hareket sensörlerinden birini kullanarak ağzı, boynu ya da başı kaydeder. Ardından bu hareketlerden herhangi birinin insan konuşmasına işaret edip etmediğini belirler.
Apple’ın patentinde belirttiği gibi bu sensörler, bir ivmeölçer ya da jiroskop olabilir. Bunların, istenmeyen uyaranlarla bozulma olasılığının bir mikrofona göre çok daha düşük olduğu söyleniyor. Bu teknolojinin sadece bir telefonda kullanılması gerekli görünmüyor. Patentte bu tür hareket algılama teknolojisinin AirPods’a, hatta bu verileri kullanıcının iPhone’una gönderecek “akıllı gözlüklere” nasıl entegre edilebileceğine dair belirsiz bir referans yer alıyor. Belgeye göre cihazlar ince yüz kaslarını, titreşimleri veya baş hareketlerini algılayabilir. Apple’ın akıllı gözlük hedefi, yıllar önce sonlandırılmış olsa da şirketin Vision Pro kulaklığı bu alanda dikkate değer bir başka aday olabilir.
Apple’ın bu teknolojiyi gerçekleştirmek için muhtemelen bir makine öğrenimi modeli geliştirmesi gerekecek. Patent, örnek veri kümeleri üzerinde eğitilmesi gereken bir “ilk dil modelinden” bahsediyor.
Derleyen: Nazlı Koyuncu