證券日報APP

掃一掃
下載客戶端

您所在的位置: 網(wǎng)站首頁 > 公司產(chǎn)業(yè) > 上市公司 > 正文

海天瑞聲賀琳: 做人工智能產(chǎn)業(yè)的“基石”

2021-08-13 05:23  來源:上海證券報

    當(dāng)不方便聽語音時,點下“轉(zhuǎn)文字”便能直接獲得語音信息的文字翻譯;當(dāng)開車時,對著手機(jī)直接說出目的地便能直接獲取導(dǎo)航路線;當(dāng)進(jìn)入寫字樓時,對著智能安檢攝像頭刷臉即可通過……

    隨著技術(shù)的不斷迭代,人類已悄然邁入智能時代,機(jī)器能夠像人一樣,會聽、會看、會說、會動、會思考及會學(xué)習(xí),更讓人類生活變得豐富多彩起來。智能時代,人們通過智能語音系統(tǒng)、計算機(jī)視覺系統(tǒng)、自然語言處理系統(tǒng)發(fā)送簡訊、操縱汽車、遙控設(shè)備,這一切主要歸功于智能語音、計算機(jī)視覺、自然語言等相關(guān)人工智能領(lǐng)域的應(yīng)用發(fā)展。

    “而我們所做的事情,則是作為人工智能產(chǎn)業(yè)的‘基石’,為產(chǎn)業(yè)鏈的技術(shù)層和應(yīng)用層源源不斷地提供對其至關(guān)重要的AI訓(xùn)練數(shù)據(jù),用戶看不到我們,卻在時時刻刻體驗著我們的基石作用。”海天瑞聲董事長賀琳說。據(jù)悉,該公司產(chǎn)品和服務(wù)已獲得騰訊、阿里、百度、字節(jié)跳動、微軟、三星、亞馬遜、科大訊飛、商湯科技、海康威視等國內(nèi)外優(yōu)質(zhì)客戶的認(rèn)可。

    8月13日,海天瑞聲登陸科創(chuàng)板,公司將借助資本的力量強(qiáng)化雙翼,飛向更廣闊的智能天地。

    訓(xùn)練數(shù)據(jù)“大王”

    海天瑞聲成立于2005年,是一家專注于為AI算法模型訓(xùn)練提供數(shù)據(jù)產(chǎn)品及解決方案的服務(wù)商。16年來,公司持續(xù)投入重金做研發(fā),目前主營業(yè)務(wù)包括訓(xùn)練數(shù)據(jù)定制服務(wù)、訓(xùn)練數(shù)據(jù)產(chǎn)品及訓(xùn)練數(shù)據(jù)相關(guān)的應(yīng)用服務(wù)三大板塊,業(yè)務(wù)領(lǐng)域涵蓋了智能語音、計算機(jī)視覺、自然語音等AI核心領(lǐng)域,構(gòu)筑起堅實的技術(shù)壁壘,持續(xù)為客戶提供高質(zhì)量的訓(xùn)練數(shù)據(jù)產(chǎn)品及服務(wù),始終努力推動著AI技術(shù)在全球各行業(yè)落地的進(jìn)程。

    隨著智能客服、智能家居、智能手機(jī)助手等應(yīng)用產(chǎn)品的廣泛普及,琳瑯滿目的人工智能應(yīng)用熱潮背后,是迅猛發(fā)展的人工智能技術(shù)。而在技術(shù)背后,扮演至關(guān)重要角色的則是大規(guī)模的專業(yè)訓(xùn)練數(shù)據(jù)集。數(shù)據(jù)資源的規(guī)模和質(zhì)量,在很大程度上決定了各種人工智能技術(shù)及應(yīng)用的廣度和深度,從而影響著AI應(yīng)用/產(chǎn)品的落地及用戶的體驗。

    “數(shù)據(jù)已經(jīng)成為一種生產(chǎn)要素,前提是要把人類世界的信息轉(zhuǎn)化為計算機(jī)可以識別的方式。”賀琳介紹說,人工智能行業(yè)發(fā)展涵蓋了三大核心要素——算法、算力及數(shù)據(jù)。如果把發(fā)展成熟的人工智能行業(yè)比作菜肴,那么數(shù)據(jù)就是食料,算法是煎、炒、烹、炸、燉等各種烹飪方法,算力則是燃?xì)庠?、菜刀、鍋、勺等烹飪工具。要想做出一道色香味俱全的菜肴,三者缺一不可?/p>

    賀琳所帶領(lǐng)的海天瑞聲正是我國領(lǐng)先的人工智能訓(xùn)練數(shù)據(jù)專業(yè)提供商。公司自成立以來,始終致力于為AI產(chǎn)業(yè)鏈上的各類機(jī)構(gòu)提供算法模型開發(fā)訓(xùn)練所需的專業(yè)數(shù)據(jù)集。

    根據(jù)招股書顯示,目前海天瑞聲所提供的訓(xùn)練數(shù)據(jù)覆蓋智能語音(語音識別、語音合成等)、計算機(jī)視覺、自然語言等多個核心領(lǐng)域,全面服務(wù)于人機(jī)交互、智能駕駛、智慧城市等多種創(chuàng)新應(yīng)用場景。

    智能語音稱雄天下

    據(jù)介紹,海天瑞聲在智能語音方面可謂獨步天下。公司建立了成熟的發(fā)音詞典構(gòu)建流程、積累了深厚的語音語言學(xué)基礎(chǔ)研究成果。截至目前,公司的產(chǎn)品/服務(wù)已覆蓋全球160余個語種/方言,并已積累下超過100個語種/方言的發(fā)音詞典,累計詞條數(shù)超過1000萬條,可構(gòu)建高質(zhì)量的智能語音訓(xùn)練數(shù)據(jù)集群。

    “我們的許多客戶都是全球性的大型科技公司和頭部人工智能企業(yè),他們的產(chǎn)品需要推廣到世界各個角落,所以產(chǎn)品中的語種/語言功能也需要能夠匹配其所布局的地方區(qū)域。”賀琳介紹說,每一種語言的研究、開發(fā)都需要花費大量的時間及成本,不同語言涉及的音素集、發(fā)音規(guī)則等設(shè)定,都需要專業(yè)的語言學(xué)家聯(lián)合AI工程師一起來共同研究完成。

    除了豐富的語言能力,公司依托自主開發(fā)的一體化數(shù)據(jù)處理平臺,高質(zhì)、高效地采集與處理大規(guī)模訓(xùn)練數(shù)據(jù)。一體化數(shù)據(jù)處理平臺需要解決三方面的問題:一是如何構(gòu)建底層算法結(jié)構(gòu),使人機(jī)結(jié)合處理數(shù)據(jù)的能力發(fā)揮到最優(yōu),最大程度提高數(shù)據(jù)處理效率;二是如何通過對平臺和工具的反復(fù)打磨,使數(shù)據(jù)生產(chǎn)流轉(zhuǎn)效率最大化,令訓(xùn)練數(shù)據(jù)的開發(fā)可以真正達(dá)到規(guī)?;蝗侨绾巫畲蟪潭缺U蠑?shù)據(jù)安全。海天瑞聲通過多年的深耕和持續(xù)的研發(fā)投入,擁有了功能強(qiáng)大的一體化處理平臺,實現(xiàn)了訓(xùn)練數(shù)據(jù)安全、合規(guī)生產(chǎn)的規(guī)?;?。

    上述羅列的“特技”,正是海天瑞聲區(qū)別于業(yè)內(nèi)其他數(shù)據(jù)服務(wù)商的本質(zhì)特征,也是在經(jīng)年累月的努力下為自己打造的深厚壁壘。公司也成為目前國內(nèi)極少數(shù)有能力提供包括希伯來語、烏爾都語、緬甸語等語種數(shù)據(jù)服務(wù)的供應(yīng)商,也是全球擁有自主知識產(chǎn)權(quán)訓(xùn)練數(shù)據(jù)集最多的企業(yè)之一。

    據(jù)賀琳介紹,公司目前在以每年大概十余種語言/方言的速度不斷擴(kuò)充著公司的專業(yè)數(shù)據(jù)庫,同時不斷迭代一體化數(shù)據(jù)處理平臺,加入各類新的處理功能。多年積累的核心技術(shù)和專業(yè)服務(wù)能力,使得公司能夠更大規(guī)模、更有效率、更加精準(zhǔn)地生產(chǎn)訓(xùn)練數(shù)據(jù),在提升自身產(chǎn)出效率的同時也有效提高了訓(xùn)練數(shù)據(jù)對于客戶算法模型的改善、優(yōu)化效果。

    數(shù)據(jù)是算法發(fā)展和演進(jìn)的“燃料”

    賀琳早年在中科院聲學(xué)研究所工作,彼時,她與身邊眾多研究人工智能的好友們都遭遇一個煩惱:基礎(chǔ)訓(xùn)練數(shù)據(jù)的缺乏。沒有訓(xùn)練數(shù)據(jù)作為支撐,AI技術(shù)及其應(yīng)用的研發(fā)工作就很難開展。當(dāng)時的他們會時常聚在一起來討論這個問題該怎么去解決。隨著算力的突破,數(shù)據(jù)的緊缺問題更加迫在眉睫。

    “當(dāng)時我認(rèn)為這是未來的一個方向,因為大家在工作中都會遇到這樣的瓶頸。一些企業(yè)的研究員更想專注于做算法,但又缺乏數(shù)據(jù)。”賀琳表示,所以海天瑞聲應(yīng)運而生。

    賀琳告訴記者:“數(shù)據(jù)是算法發(fā)展和演進(jìn)的‘燃料’,算法、算力、數(shù)據(jù)這三個要素一定要互相作用,才能使AI行業(yè)得以發(fā)展。近年來,國家從頂層設(shè)計層面也非常重視數(shù)據(jù)的發(fā)展,并制定了很多相關(guān)的政策,特別是今年,建設(shè)人工智能行業(yè)訓(xùn)練數(shù)據(jù)集、發(fā)展全數(shù)據(jù)產(chǎn)業(yè)鏈已被正式納入國家重點規(guī)劃,可以說數(shù)據(jù)資源的基礎(chǔ)性和戰(zhàn)略性的地位已經(jīng)凸顯。”

    事實上,除了提供訓(xùn)練數(shù)據(jù)產(chǎn)品外,一個專業(yè)高效的數(shù)據(jù)合作伙伴最重要的能力之一是幫助應(yīng)用商們較為準(zhǔn)確地預(yù)估投入產(chǎn)出比,找到與整體業(yè)務(wù)目標(biāo)契合的整體服務(wù)解決方案。經(jīng)過多年的業(yè)務(wù)實踐與發(fā)展,海天瑞聲目前與產(chǎn)業(yè)鏈上的各類機(jī)構(gòu)都建立了長期的戰(zhàn)略合作關(guān)系,產(chǎn)品和服務(wù)已獲得阿里巴巴、騰訊、百度、字節(jié)跳動、微軟、三星、亞馬遜、科大訊飛、商湯科技、云知聲、??低暤葒鴥?nèi)外優(yōu)質(zhì)客戶的認(rèn)可,建立了廣泛的行業(yè)知名度與影響力。

    未來,市場對訓(xùn)練數(shù)據(jù)的拓展性需求和前瞻性需求均將快速增長。隨著行業(yè)內(nèi)對訓(xùn)練數(shù)據(jù)需求類型的增加以及對服務(wù)標(biāo)準(zhǔn)要求的提高,這就要求包括海天瑞聲在內(nèi)的數(shù)據(jù)服務(wù)商能夠保持對行業(yè)發(fā)展趨勢的洞察能力,深刻理解客戶的應(yīng)用領(lǐng)域及業(yè)務(wù)場景,在設(shè)計方案過程中考慮到算法對樣本多樣性的需求,保證數(shù)據(jù)方案能滿足機(jī)器學(xué)習(xí)的需求且避免出現(xiàn)與模型的過擬合、欠擬合等諸多問題。

    “幫助客戶不在數(shù)據(jù)準(zhǔn)備階段走彎路,助推其加速模型訓(xùn)練、產(chǎn)品落地和迭代更新是海天瑞聲堅守的初衷。”賀琳說,隨著人工智能在全球的快速發(fā)展,對數(shù)據(jù)資源需求將持續(xù)增長。與此同時,不同類型、處于不同發(fā)展階段的企業(yè)及組織對數(shù)據(jù)的需求也逐步展現(xiàn)出差異化、多元化趨勢,因此對人工智能訓(xùn)練數(shù)據(jù)服務(wù)商的資質(zhì)、研發(fā)、產(chǎn)能、質(zhì)控、安全合規(guī)等方面都提出了更高的要求。

    用戶驅(qū)動、需求驅(qū)動、實戰(zhàn)驅(qū)動是推動海天瑞聲持續(xù)穩(wěn)步前進(jìn)的動能。行業(yè)的高速增長,政策的不斷加持,為海天瑞聲增添了更多的成長空間。而登陸科創(chuàng)板,則會獲得更充足的資本力量,助推公司海闊天空任飛翔。

-證券日報網(wǎng)
  • 24小時排行 一周排行
  • 深度策劃

洞察半年報新動能

產(chǎn)因城強(qiáng),城因產(chǎn)興。工業(yè)化與城市化是經(jīng)濟(jì)社會……[詳情]

版權(quán)所有證券日報網(wǎng)

互聯(lián)網(wǎng)新聞信息服務(wù)許可證 10120180014增值電信業(yè)務(wù)經(jīng)營許可證B2-20181903

京公網(wǎng)安備 11010202007567號京ICP備17054264號

證券日報網(wǎng)所載文章、數(shù)據(jù)僅供參考,使用前務(wù)請仔細(xì)閱讀法律申明,風(fēng)險自負(fù)。

證券日報社電話:010-83251700網(wǎng)站電話:010-83251800

網(wǎng)站傳真:010-83251801電子郵件:xmtzx@zqrb.net

證券日報APP

掃一掃,即可下載

官方微信

掃一掃,加關(guān)注

官方微博

掃一掃,加關(guān)注