Hangisi Daha Akıllı?

Ses tanıma teknolojileri yeni araçlar sayesinde bir standart haline gelebilir.

Gelin şimdi ses tanıma teknolojilerini kullanan servislerden; Baidu, Siri, Google Now, Microsoft Cortana, Hound, Wit.ai ve Amazon Alexa’nın son durumuna birlikte bakıp bir karşılaştırma yapalım.

İnsanlar dakika ortalama 150 kelime konuşabilir ve 40 kelime yazabilirler. Bilgisayar ve akıllı telefonlar sayesinde bu çok daha hızlı hale gelebilir. Bu hızın günlük hayatımıza getireceği değişimi hayal etmek zor değil…

Söyleneni anlayan uygulamaların kalitesi, her geçen gün artıyor. Gürültülü ortamlarda %15’e düşen anlama kapasitesi, daha sessiz ortamlarda %99’a kadar yükseliyor.

Ses tanıma teknolojilerini günümüzde ortalama %70’lik bir doğru anlama kapasitesine sahip. Bu oran ise her geçen gün artıyor.

Sizin için ses tanıma teknolojilerini kullanan servislerin son durumunu derledim.

 

 

Baidu

Çin’in Google’ı olarak tanımlanan ve ülkenin en büyük arama motoru olma özelliğini taşıyan Baidu servislerinin kullanım oranı ülke çapına %96 olarak açıklandı. Baidu sesle anlamla teknolojilerini binlerce saatlik bir çalışmayla ortaya çıkan ve Silikon Vadisinde geliştirilen Deep Speach 2 altyapısından alıyor.

Uygulama hem İngilizce hem de Mandarin alfabesini destekliyor. Çin’de Google ürünlerinin yasaklı olduğunu hatırlatmakta fayda var.

 

Siri

Bazen doğru cevapları bulmakta zorlansa da, Apple’ın Siri uygulaması en sık kullanılan uygulamalardan biri. Siri, %95 oranında doğru cevap verme kapasitesine sahip olmakla birlikte, 2014 yılından beri derin öğrenme ve derin analiz yaparak bu oranı yükseltmeye çalışıyor.

 

Google Now

Google’ın sesli arama sistemi %92 oranında doğru sonuçlar veriyor. Google bu uygulamayı web servislerinde ve android tabanlı cihazlarda kullanıyor. Şirket 2019 yılında web’de yapılan aramaların %50’sinin konuşarak yapılacağını öngörüyor. Google bunu söylüyorsa süre daha da kısalabilir.

 

 

Microsoft Cortana

Cortana Microsoft’un standart telefon asistanı olarak ortaya çıktı ve daha sonra Windows 10 işletim sisteminde yerleşik olarak kullanıldı. Mesaj yazma, takvim düzenleme, arama yapma gibi temel sesli komutlara cevap veren uygulama, gün itibari ile %90 doğruluk oranıyla çalışıyor.

İlk tohumları Windows 95’de atılan bu sesli komut uygulaması hatırlarsanız o yıllarda %100’lük bir hata payıyla çalışıyordu 🙂

 

Hound

Hound uygulaması Silikon Vadisindeki SoundHound firmasının en önemli ürünü. Bu dijital asistan sözlü sorulara ve matematik hesaplamalarına %95 oranında doğru cevaplar verebiliyor. Uygulama Shazam uygulamasına benzer bir altyapı kullanıyor.

 

 

Wit.ai

Silikon Vadisi Startup’larından biri olan ve 18 aylık bir geçmişe sahip Wit.ai, son yatırım turunda 3 Milyon dolarlık bir yatırıma ulaşmış ve bu sayede Facebook tarafından 2015 yılı başında satın alınmıştı. Uygulamanın şu anki hali rakipleri kadar gelecek vaad etmese bile ,Facebook desteği ile yapılacak geliştirmelerin özellikle Facebook Messenger uygulamasında kullanılması bekleniyor.

 

Amazon Alexa

Amazon Echo herhangi bir arayüz birimine ihtiyaç duymadan sizin için müzik listeleri çalabilir, ışıkları yakabilir, yemek tariflerini okuyabilir. Bu ürün ses tanıma algoritması olarak Amazon Alexa uygulamasını kullanıyor. Beklenenin aksine “şu ana kadar bir gelişme kaydetmemesine rağmen” Alexa uygulamasının yakında bölgesel dilleri anlayabilecek bir yapıya kavuşacağı söyleniyor. Alexa’nın sizi daha iyi anlayabilmesi için her zaman mikrofonunuza yakın durmanızın bir zorunluluk olması dezavantaj olsa bile, yeni geliştirmeler sayesinde bu uygulama piyasada hak ettiği değeri bulacağı söyleniyor.

 

 

Fayda görmeniz dileğiyle…

 

 

Bir Cevap Yazın

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir