應(yīng)用

技術(shù)

物聯(lián)網(wǎng)世界 >> 物聯(lián)網(wǎng)新聞 >> 物聯(lián)網(wǎng)熱點(diǎn)新聞
企業(yè)注冊(cè)個(gè)人注冊(cè)登錄

讓機(jī)器更懂“你” 語(yǔ)音交互讓人機(jī)共生前景明朗

2018-01-16 16:07 中國(guó)智能制造網(wǎng)

導(dǎo)讀:在計(jì)算機(jī)幾十年的發(fā)展過(guò)程中,人機(jī)交互也就是人和機(jī)器之間的信息交換的技術(shù),我們可以不夸張的說(shuō),也是一項(xiàng)引領(lǐng)性的技術(shù)。而人工智能和大數(shù)據(jù)的進(jìn)步使人機(jī)交互成為現(xiàn)實(shí)、可用。

  在計(jì)算機(jī)幾十年的發(fā)展過(guò)程中,人機(jī)交互也就是人和機(jī)器之間的信息交換的技術(shù),我們可以不夸張的說(shuō),也是一項(xiàng)引領(lǐng)性的技術(shù)。而人工智能和大數(shù)據(jù)的進(jìn)步使人機(jī)交互成為現(xiàn)實(shí)、可用。

636516264797060437772.png

  人機(jī)交互的目的是為了讓機(jī)器更懂“你”,讓用戶更加自如。人機(jī)之間的自然交互一直是人工智能領(lǐng)域的一個(gè)美好愿景,而語(yǔ)音是人機(jī)交互中最重要的手段之一。

  今天我們說(shuō)的語(yǔ)音識(shí)別、人臉識(shí)別還有一些生物識(shí)別比如指紋、虹膜等等,這些東西其實(shí)都屬于人機(jī)交互的技術(shù)。當(dāng)然它后面可能還有人工智能的支撐,可是不會(huì)所有的東西都只通過(guò)語(yǔ)音,或者是人臉識(shí)別,它可能是人機(jī)交互的一部分入口,但是它絕對(duì)不是全部的入口。

  自然交互中,我們還很期待一些很科幻的場(chǎng)景,比如我們?cè)诤芏嗫苹闷袝?huì)有這樣的,像手勢(shì)、姿態(tài)的交互和識(shí)別。實(shí)際上手勢(shì)識(shí)別或者姿態(tài)的識(shí)別,在人機(jī)交互是一個(gè)很難的命題,像一些具體的任務(wù)上,比如空中打字,也就是我抬手,現(xiàn)在很多人有盲打的能力,實(shí)際上你一抬手就在敲你想打的字,你已經(jīng)有了這個(gè)習(xí)慣。

  目前,中國(guó)正在向“2030年成為世界領(lǐng)先的人工智能創(chuàng)新中心”這個(gè)目標(biāo)大步邁進(jìn),四個(gè)新成立的國(guó)家人工智能開(kāi)放創(chuàng)新平臺(tái)更是相當(dāng)引人注目,Al將在今后以人類(lèi)輔助性伙伴的形式參與到人類(lèi)各項(xiàng)實(shí)際應(yīng)用之中。

  隨著接口技術(shù)的變化,交互模式也發(fā)生了變化,計(jì)算機(jī)從實(shí)驗(yàn)室、機(jī)房已經(jīng)走到了我們的辦公室、家庭,甚至今天已經(jīng)都走到了我們的手上,計(jì)算機(jī)的臺(tái)數(shù)也發(fā)生了極大的數(shù)量級(jí)變化。

  目前,在一些特定的情境里,語(yǔ)音交互已經(jīng)成為主要的方式了。語(yǔ)音時(shí)代的最大意義在于,真正做到了解放雙手。尤其在汽車(chē)?yán)?、家里這樣的場(chǎng)景,意義非凡。解放了雙手之后,人類(lèi)與世界的交互,才第一次實(shí)現(xiàn)了隨時(shí)隨地,隨心所欲。

  簡(jiǎn)單地說(shuō),世界是由懶人創(chuàng)造的,人機(jī)交互的演進(jìn)也可以認(rèn)為是人們?cè)絹?lái)越懶的演進(jìn)過(guò)程。俗話說(shuō)得好,“能動(dòng)口的絕不動(dòng)手”,就是這個(gè)道理。語(yǔ)音最大的優(yōu)勢(shì)是,它是人類(lèi)最自然的交互方式。

  國(guó)家政策層面,也在大力推動(dòng)智能語(yǔ)音的發(fā)展。去年12月14日,科技部印發(fā)《促進(jìn)新一代人工智能產(chǎn)業(yè)發(fā)展三年行動(dòng)計(jì)劃(2018—2020年)》,明確對(duì)智能語(yǔ)音的發(fā)展做出展望,“到2020年,實(shí)現(xiàn)多場(chǎng)景下中文語(yǔ)音識(shí)別平均準(zhǔn)確率達(dá)到96%,5米遠(yuǎn)場(chǎng)識(shí)別率超過(guò)92%,用戶對(duì)話意圖識(shí)別準(zhǔn)確率超過(guò)90%?!?/p>

  當(dāng)然,語(yǔ)音交互目前還存在很多問(wèn)題。比如由于空間距離、背景噪音、其他人聲干擾、回聲、混響等多重復(fù)雜因素,進(jìn)而導(dǎo)致的識(shí)別距離近、識(shí)別率低等明顯痛點(diǎn)。再比如單是中國(guó)語(yǔ)系、方言和口音就相當(dāng)多,加上中文的多語(yǔ)義性,所以不同地區(qū)的人使用語(yǔ)音控制識(shí)別率差異較大。同時(shí),在語(yǔ)義識(shí)別上,也存在上下文的關(guān)聯(lián)帶來(lái)識(shí)別的學(xué)習(xí)難、定位難和建立模型難等問(wèn)題。

  未來(lái),隨著計(jì)算超速手機(jī)滲入到我們生活更多方面,智能技術(shù)的進(jìn)步,也將為人機(jī)共生的美好前景提供支撐的技術(shù)。