證券日?qǐng)?bào)APP

掃一掃
下載客戶端

AI浪潮推動(dòng)超千億聲紋市場(chǎng)落地:個(gè)人ID時(shí)代來(lái)臨

2020-08-07 02:32  來(lái)源:21世紀(jì)經(jīng)濟(jì)報(bào)道

    聲紋識(shí)別技術(shù)能夠在金融場(chǎng)景落地,與行業(yè)的積極擁抱并出臺(tái)相關(guān)標(biāo)準(zhǔn)有關(guān)——2018年中國(guó)人民銀行發(fā)布聲紋識(shí)別相關(guān)行業(yè)標(biāo)準(zhǔn),2019年聲紋識(shí)別系統(tǒng)成為唯一一個(gè)入選金融科技產(chǎn)品認(rèn)證目錄的生物識(shí)別技術(shù)。

    繼指紋、面部、虹膜之后,聲紋作為象征我們個(gè)人ID的一部分,也陸續(xù)開(kāi)啟了商用大潮。

    近日,中國(guó)工商銀行開(kāi)始把聲紋識(shí)別技術(shù)應(yīng)用于信用卡反欺詐場(chǎng)景,在其位于北京、湖北、四川、山西的四家分行正式上線,在同業(yè)中率先開(kāi)啟了風(fēng)險(xiǎn)管控的新模式。

    聲紋識(shí)別從單純技術(shù)本身來(lái)說(shuō),在20世紀(jì)便有了相關(guān)研究和落地的探索,近年來(lái),部分比較成熟的方案開(kāi)始被境內(nèi)外一些銀行系統(tǒng)采用,那是聲紋識(shí)別技術(shù)應(yīng)用落地的初級(jí)階段。

    真正走向成熟,核心還是依托于21世紀(jì)AI技術(shù)取得的突破。尤其是年初數(shù)月的疫情背景下,市場(chǎng)對(duì)這種非接觸且高準(zhǔn)確度的技術(shù)應(yīng)用需求突然放大甚至與日俱增。

    據(jù)前瞻產(chǎn)業(yè)研究院分析,當(dāng)下全球生物識(shí)別產(chǎn)業(yè)規(guī)模龐大,僅語(yǔ)音生物識(shí)別(即聲紋識(shí)別)這一細(xì)分方向的市場(chǎng)規(guī)模2020年有望超過(guò)1400億元人民幣(約200億美元),占整個(gè)生物識(shí)別市場(chǎng)的22.4%。

    聲揚(yáng)科技CTO陳東鵬向21世紀(jì)經(jīng)濟(jì)報(bào)道記者表示,未來(lái)隨著5G、大數(shù)據(jù)、云計(jì)算等新技術(shù)發(fā)展愈發(fā)成熟、語(yǔ)音的入口更普及,可利用的語(yǔ)音數(shù)據(jù)會(huì)越來(lái)越多。聲紋識(shí)別技術(shù)有望在金融、公安、智能硬件、IoT等領(lǐng)域中發(fā)揮越來(lái)越重要的作用。

    逐層技術(shù)演進(jìn)

    提到聲紋,很容易被理解為容易被模仿的聲線,其實(shí)二者不能等同。

    有行業(yè)人士向記者分析道,聲紋很難被偽裝,因?yàn)槠渥R(shí)別的內(nèi)容主要包括聲帶振動(dòng)頻率、聲道等特征組成的語(yǔ)音模型,能被偽裝的只在于口頭禪等行為特征。

    “每個(gè)人說(shuō)話時(shí)的音調(diào)、音色等習(xí)慣幾乎獨(dú)一無(wú)二,這些信息通過(guò)電聲學(xué)儀器測(cè)量并分析,就構(gòu)成了不同的聲波頻譜,所以用聲紋來(lái)認(rèn)證身份具有唯一性和穩(wěn)定性。”他續(xù)稱。

    清華大學(xué)人工智能研究院聽(tīng)覺(jué)智能研究中心發(fā)布的一份聲紋識(shí)別技術(shù)白皮書(shū)顯示,目前市場(chǎng)上主流的生物識(shí)別方案包括掌紋、虹膜、視網(wǎng)膜、人臉、聲紋等。從易仿冒程度來(lái)看,虹膜和視網(wǎng)膜是極難的,聲紋被評(píng)定為難,其余則均為一般。

    基于這些背景,關(guān)于聲紋的研究其實(shí)早已有之,只是隨著底層技術(shù)的迭代,應(yīng)用過(guò)程能夠更加無(wú)感,同時(shí)達(dá)到較高準(zhǔn)確度。

    陳東鵬向21世紀(jì)經(jīng)濟(jì)報(bào)道記者分析道,早期的聲紋識(shí)別技術(shù),為了節(jié)省時(shí)間并提升用戶體驗(yàn),會(huì)要求用戶念一段固定的文本,此后每次驗(yàn)證都是朗讀同一段文本。

    這被稱為固定文本的認(rèn)證方式。“但會(huì)造成兩個(gè)問(wèn)題,第一是用戶體驗(yàn)不好,每次都被要求生硬地念一段文本,無(wú)法做到與用戶在自然交流中無(wú)感地完成身份認(rèn)證;第二是容易被錄音攻擊,因?yàn)槊看卫首x的都是同一段內(nèi)容,犯罪分子有可能通過(guò)提前偷錄他人的聲音,然后通過(guò)錄音回放攻擊系統(tǒng)。”他進(jìn)一步表示,這導(dǎo)致初期的技術(shù)落地會(huì)存在較大風(fēng)險(xiǎn)。

    大約在2000年開(kāi)始,聲紋識(shí)別技術(shù)進(jìn)入相對(duì)成熟期,在此期間誕生了一批老牌語(yǔ)音廠商,科大訊飛就在其中。

    前述行業(yè)人士向記者指出,這一階段的聲紋識(shí)別技術(shù)要點(diǎn)在于,將錄入的聲音壓縮成固定的矢量進(jìn)行匹配,準(zhǔn)確率已經(jīng)能夠達(dá)到約95%的水平,不足之處在于容易因外部干擾而影響結(jié)果,因此還沒(méi)到適合商用的標(biāo)準(zhǔn)。

    從2015年開(kāi)始,隨著AI技術(shù)的深化,不少以該項(xiàng)技術(shù)為背景的創(chuàng)業(yè)公司專門(mén)投身聲紋識(shí)別領(lǐng)域,不僅如此,在這兩年來(lái),BAT等巨頭也相繼在這一領(lǐng)域入局。

    “如今聲紋識(shí)別技術(shù)的進(jìn)步,得益于深度學(xué)習(xí)技術(shù)的成熟,以及傳感器、麥克風(fēng)、通信信道(如5G、4GVoLTE高清通話)等技術(shù)的進(jìn)步。”陳東鵬介紹道,目前聲揚(yáng)科技的聲紋識(shí)別技術(shù)可以保證在高噪聲環(huán)境下聲紋識(shí)別的魯棒性、在很短時(shí)間內(nèi)完成語(yǔ)音認(rèn)證,也無(wú)需設(shè)置固定交流內(nèi)容。

    應(yīng)用場(chǎng)景擴(kuò)圍

    雖然當(dāng)前已經(jīng)可以在較好體驗(yàn)的情況下落地商用,但聲紋識(shí)別技術(shù)還有更長(zhǎng)遠(yuǎn)的路要走。

    業(yè)內(nèi)認(rèn)為,當(dāng)前階段的聲紋識(shí)別技術(shù)已經(jīng)能夠滿足部分行業(yè)特定場(chǎng)景的應(yīng)用需求,當(dāng)然從商用門(mén)檻的成熟,到未來(lái)體驗(yàn)的成熟,依然有很大提升空間。

    對(duì)諸多生物識(shí)別技術(shù)來(lái)說(shuō)都是如此。即便是目前已經(jīng)十分普及到手機(jī)端的屏下指紋識(shí)別技術(shù),歷經(jīng)多年商用迭代,也依然可以在識(shí)別時(shí)間、精準(zhǔn)度、模組大小等方面繼續(xù)優(yōu)化。

    陳東鵬向記者坦言,聲紋識(shí)別技術(shù)的下一步挑戰(zhàn)主要包括兩方面:遠(yuǎn)場(chǎng)識(shí)別、跨信道識(shí)別的優(yōu)化。

    “雖然聲揚(yáng)科技已經(jīng)可以做到兩米左右這種遠(yuǎn)場(chǎng)的識(shí)別,但我們的目標(biāo)是做到像‘人耳’一樣,可以距離很遠(yuǎn)就通過(guò)聲音識(shí)別人的身份。”他進(jìn)一步解釋。

    而所謂跨信道識(shí)別,是指早期僅能通過(guò)手機(jī)或者電腦麥克風(fēng)采集信號(hào),但未來(lái)可以進(jìn)一步擴(kuò)大到更多設(shè)備中。陳東鵬續(xù)稱,“現(xiàn)在還是會(huì)受信道的影響,隨著通訊技術(shù)進(jìn)步、數(shù)據(jù)積累、訓(xùn)練模型魯棒性更高,相信這個(gè)問(wèn)題能得到更好解決。”

    此次能夠在金融場(chǎng)景落地,也與行業(yè)的積極擁抱并出臺(tái)相關(guān)標(biāo)準(zhǔn)有關(guān)。

    2014年公安部便首次針對(duì)聲紋識(shí)別的應(yīng)用技術(shù)要求和安全等級(jí)制定標(biāo)準(zhǔn),在2019年確定了關(guān)于聲紋數(shù)據(jù)庫(kù)建設(shè)、信息采集指引的細(xì)化內(nèi)容。

    在金融行業(yè),2018年中國(guó)人民銀行發(fā)布聲紋識(shí)別相關(guān)行業(yè)標(biāo)準(zhǔn),2019年聲紋識(shí)別系統(tǒng)還成為唯一一個(gè)入選金融科技產(chǎn)品認(rèn)證目錄的生物識(shí)別技術(shù),為今天的探索落地奠定了基礎(chǔ)。

    前文提到的銀行信用卡反欺詐場(chǎng)景,其應(yīng)用主要是通過(guò)電話銀行,在線上辦理信用卡申請(qǐng)、啟卡、盡調(diào)等環(huán)節(jié)時(shí),遠(yuǎn)程在線建立個(gè)人聲紋ID檔案并為后續(xù)身份識(shí)別、欺詐風(fēng)險(xiǎn)判斷提供依據(jù)。

    可想而知,疫情期間對(duì)于無(wú)接觸的需求突然大增,聲紋識(shí)別技術(shù)也迎來(lái)更多落地機(jī)會(huì)。陳東鵬介紹,比如門(mén)禁、電梯、回訪平臺(tái)等,都可以用到聲紋技術(shù)。“我們?cè)谝咔槠陂g做了幾款相關(guān)的產(chǎn)品,比如聲紋門(mén)禁、遠(yuǎn)程健康回訪系統(tǒng),這個(gè)系統(tǒng)也最先被南山粵海街道辦采用。”

    “聲紋的一大優(yōu)勢(shì),是它蘊(yùn)含在人們交流所需的語(yǔ)音當(dāng)中,這些語(yǔ)音包含著極為豐富的個(gè)人信息,如性別、年齡、地域、環(huán)境、情緒、職業(yè)、偏好等,聲紋揭示的身份信息,是將這些個(gè)人化的信息聚集在一起的中心點(diǎn),這將是很多行業(yè)提供‘以用戶為中心’服務(wù)所必須掌握的。”他如此總結(jié)道。

-證券日?qǐng)?bào)網(wǎng)
  • 24小時(shí)排行 一周排行
  • 深度策劃

洞察半年報(bào)新動(dòng)能

產(chǎn)因城強(qiáng),城因產(chǎn)興。工業(yè)化與城市化是經(jīng)濟(jì)社會(huì)……[詳情]

版權(quán)所有證券日?qǐng)?bào)網(wǎng)

互聯(lián)網(wǎng)新聞信息服務(wù)許可證 10120180014增值電信業(yè)務(wù)經(jīng)營(yíng)許可證B2-20181903

京公網(wǎng)安備 11010202007567號(hào)京ICP備17054264號(hào)

證券日?qǐng)?bào)網(wǎng)所載文章、數(shù)據(jù)僅供參考,使用前務(wù)請(qǐng)仔細(xì)閱讀法律申明,風(fēng)險(xiǎn)自負(fù)。

證券日?qǐng)?bào)社電話:010-83251700網(wǎng)站電話:010-83251800

網(wǎng)站傳真:010-83251801電子郵件:xmtzx@zqrb.net

證券日?qǐng)?bào)APP

掃一掃,即可下載

官方微信

掃一掃,加關(guān)注

官方微博

掃一掃,加關(guān)注