從鍵盤打字到觸控屏,再到現(xiàn)在的語音交互和手勢交互, 人工智能技術(shù) 的發(fā)展,正在促使人機(jī)交互方式向更加多元化方向變革。而今天,國內(nèi)知名互聯(lián)網(wǎng)公司搜狗又推出了一種人機(jī)交互新技術(shù)唇語識(shí)別,這也是業(yè)內(nèi)首個(gè)公開演示的唇語識(shí)別系統(tǒng),通過機(jī)器視覺識(shí)別,不
從鍵盤打字到觸控屏,再到現(xiàn)在的語音交互和手勢交互, 人工智能技術(shù) 的發(fā)展,正在促使人機(jī)交互方式向更加多元化方向變革。而今天,國內(nèi)知名互聯(lián)網(wǎng)公司搜狗又推出了一種人機(jī)交互新技術(shù)——唇語識(shí)別,這也是業(yè)內(nèi)**公開演示的唇語識(shí)別系統(tǒng),通過機(jī)器視覺識(shí)別,不用聽聲音,僅靠識(shí)別說話人唇部動(dòng)作,就能解讀說話者所說的內(nèi)容。
與語音識(shí)別不同,唇語識(shí)別是一項(xiàng)基于機(jī)器視覺與自然語言處理于一體的技術(shù),因此在研發(fā)難度上比語音識(shí)別大得多。據(jù)
石家莊網(wǎng)絡(luò)優(yōu)化獲悉,搜狗首創(chuàng)了復(fù)雜端到端深度神經(jīng)網(wǎng)絡(luò)技術(shù)進(jìn)行中文唇語序列建模,通過數(shù)千小時(shí)的真實(shí)唇語數(shù)據(jù)訓(xùn)練,另外得益于搜狗在自然語言處理方面的強(qiáng)大優(yōu)勢,*終取得了業(yè)界領(lǐng)先的唇語識(shí)別效果。在非特定人開放口語測試集上,搜狗唇語識(shí)別系統(tǒng)已經(jīng)達(dá)到60%以上的準(zhǔn)確率,超過google發(fā)布的英文唇語系統(tǒng)50%以上的準(zhǔn)確率,在垂直場景如車載、 智能家居 等場景下甚至已經(jīng)達(dá)到90%的準(zhǔn)確率。在剛結(jié)束不久的烏鎮(zhèn)世界互聯(lián)網(wǎng)大會(huì)上,搜狗唇語識(shí)別技術(shù)亮相,在業(yè)內(nèi)大多數(shù)唇語識(shí)別技術(shù)實(shí)用性尚待考證的環(huán)境下,成功完成了業(yè)內(nèi)**中文唇語識(shí)別系統(tǒng)的公開演示,引起廣泛關(guān)注。
當(dāng)國內(nèi)大部分企業(yè)都扎堆聚集在智能語音、圖像識(shí)別等領(lǐng)域時(shí),搜狗唇語識(shí)別技術(shù)的推出無疑將引領(lǐng)整個(gè)行業(yè)進(jìn)入一個(gè)全新的發(fā)展方向。作為人機(jī)交互的形式之一,未來唇語識(shí)別技術(shù)可以輔助語音交互及圖像識(shí)別,在日常生活、安防、公益等各個(gè)領(lǐng)域?qū)崿F(xiàn)廣泛應(yīng)用。比如在車載場景下,周圍噪音過大時(shí)會(huì)對(duì)語音指令產(chǎn)生干擾,通過唇語識(shí)別技術(shù)則可以規(guī)避干擾,保證人車交互的準(zhǔn)確性和穩(wěn)定性,日常不便發(fā)聲的公共場所也可以保證說話內(nèi)容的私密性;在安防領(lǐng)域,由于目前多數(shù)監(jiān)控只有攝像頭沒有麥克風(fēng),往往只能看清嘴型卻不知道在說什么,給案情分析帶來很多難題,而唇語識(shí)別技術(shù)可以幫助公安人員獲取重要的講話信息,為公共安全提供有效支持。除此之外,唇語識(shí)別技術(shù)還能發(fā)揮巨大的公益價(jià)值,幫助先天性聽障人群或老年人,讓他們更好地理解和表達(dá)自己。
石家莊網(wǎng)站建設(shè)消息作為一家技術(shù)驅(qū)動(dòng)型的企業(yè),近年來搜狗一直致力于自然語言的研究,目前在語音識(shí)別、語義理解、機(jī)器翻譯等方面均取得了行業(yè)領(lǐng)先的成果并實(shí)現(xiàn)產(chǎn)品落地,此次推出唇語識(shí)別技術(shù),不僅會(huì)推動(dòng)整個(gè)AI行業(yè)的技術(shù)革新,也意味著搜狗在AI領(lǐng)域的技術(shù)實(shí)力達(dá)到了更高的發(fā)展水平。
時(shí)至今日, 人工智能 的發(fā)展速度已經(jīng)完全超出了我們的想象,那些電影里的炫酷黑科技正在一步步成為現(xiàn)實(shí)出現(xiàn)在我們的生活中。隨著AI技術(shù)的發(fā)展,相信在不遠(yuǎn)的將來,唇語識(shí)別也能像語音識(shí)別、圖像識(shí)別一樣成為我們生活中隨處可見的一部分。