證券日?qǐng)?bào)APP

掃一掃
下載客戶端

您所在的位置: 網(wǎng)站首頁 > 會(huì)議活動(dòng) > 正文

何寶宏:圍繞開源大模型的挑戰(zhàn)很多,其中重要一條是大模型開始反向影響對(duì)開源的經(jīng)典定義

2023-08-11 17:39  來源:證券日?qǐng)?bào)網(wǎng)

何.jpg    

       尊敬的鄔賀銓和王國法院士,很高興跟大家交流一下大模型最新發(fā)展。我本人讀研究生的時(shí)候就是學(xué)人工智能,后來因?yàn)椴惶谜夜ぷ鳎揖娃D(zhuǎn)型去做互聯(lián)網(wǎng)研究了,沒有想到幾十年之后,又回來去做回人工智能,但是今天的人工智能看起來是神經(jīng)網(wǎng)絡(luò)。

    我們也可以看到過去幾十年的時(shí)間,人工智能在多個(gè)領(lǐng)域取得了突破性的進(jìn)展,雖然它依然會(huì)犯錯(cuò),但是錯(cuò)誤率已經(jīng)低于人類的平均水平,也就是說比大多數(shù)人在這些方面的水平要高了。

    從技術(shù)角度來說,人工智能已經(jīng)發(fā)展了60多年了,60多年來技術(shù)路線是千奇百怪,今天似乎在大模型,預(yù)訓(xùn)練的大模型,意味著一個(gè)新的產(chǎn)業(yè)正在形成當(dāng)中。

    這幾年從通信基礎(chǔ)設(shè)施,搞算力的基礎(chǔ)設(shè)施開始,接下來未來幾年我們要搞智力的基礎(chǔ)設(shè)施,所以我們說智商原來是不在線的,現(xiàn)在看起來智商是要在線的,把智商放到網(wǎng)上去了,這個(gè)方向看起來已經(jīng)確立了。

    第三個(gè)是TOB還是TOC,通用還是專業(yè)的問題,以前討論很多是對(duì)標(biāo)ChatGPT通用場景的大模型,更多的是要解決基礎(chǔ)模型方面的工作,這是一個(gè)非常重要的事情。主要是大型科技公司有這種財(cái)力和數(shù)據(jù)實(shí)力去做這一方面的事情,可以認(rèn)為TOC是面向公眾,下面很多的方向轉(zhuǎn)向垂類的,一定要聚焦特定領(lǐng)域,面向企業(yè)TOB,主要是圍繞產(chǎn)品和解決方案來做。如何做垂類的模型,國內(nèi)外不一樣,在硅谷針對(duì)特定場景的微調(diào)做實(shí)驗(yàn),因?yàn)橥ㄓ么竽P瓦€沒有出來,不可能圍繞它做生態(tài),很多企業(yè)是全站式的,自上而下在做垂類的模型。這個(gè)生態(tài)在國內(nèi)還需要一些時(shí)間,可能要求的門檻稍微低一點(diǎn),這一類可以理解成私有的,或者專用的,其實(shí)就把云計(jì)算十年前的一些做法和一些口號(hào),還有一些套路,往人工智能和大模型一靠,就差不多了??梢院苊黠@,基礎(chǔ)大模型和通用大模型的優(yōu)點(diǎn)和不足,行業(yè)垂類大模型也有各自的優(yōu)勢和缺點(diǎn),下一步很可能是走向融合,走向混合。

    我們要做垂類行業(yè)大模型,為了數(shù)據(jù)的安全,這些數(shù)據(jù)不能拿出來,很多數(shù)據(jù)是非常敏感的,肯定大模型要做私有化的部署。過幾年的時(shí)間,我個(gè)人的判斷,就像今天的云肯定是一個(gè)混合云和混合AI的模式。

    還有討論今年的閉源大模型和開源大模型,ChatGPT出來是必然的,這個(gè)必然是有各種各樣的原因。所以接下來對(duì)這個(gè)行業(yè)來說,因?yàn)檫@個(gè)行業(yè)的特點(diǎn)是贏家通吃,剩下的企業(yè)只能抱團(tuán)取暖,必須抱一個(gè)開源社區(qū),大家一起把開源的事情做起來。我們可以認(rèn)為開源大模型正在剛剛興起,這個(gè)浪潮剛剛開始,誰能勝出還不知道。當(dāng)年移動(dòng)互聯(lián)網(wǎng)里面,蘋果手機(jī)出來之后,接下來是安卓生態(tài)的建設(shè),這一幕會(huì)重演,圍繞著開源社區(qū)的生態(tài),開源大模型面臨著很多的挑戰(zhàn),一個(gè)重要的是它反向影響對(duì)開源的定義。我們對(duì)開源的定義是在25年前出現(xiàn)的,當(dāng)年定義做的開源規(guī)則,針對(duì)的是軟件,針對(duì)的是代碼,今天人工智能這個(gè)開源針對(duì)的是模型,針對(duì)的是權(quán)重,里面很多數(shù)據(jù)集,大模型的開源和軟件的開源,和代碼的開源確實(shí)不太一樣,所以我們需要在人工智能這個(gè)時(shí)代重新定義開源,今天面對(duì)模型,加了很多的數(shù)據(jù),至少我看有三個(gè)方面的區(qū)別,加了很多科技倫理,所以這一塊有AIGC產(chǎn)生一些新的內(nèi)容,它是一個(gè)自循環(huán)了,會(huì)出現(xiàn)無數(shù)的問題。

    整體來看,國外做了很多的榜單,但是從學(xué)術(shù)到產(chǎn)業(yè)還需要做更多的工作,學(xué)術(shù)界和產(chǎn)業(yè)界關(guān)注不一樣,產(chǎn)業(yè)界主要關(guān)注性能,還有可靠性,穩(wěn)定性,場景適應(yīng)性怎么樣,維護(hù)性怎么樣,或者你的工程能力怎么樣,要用工程化和標(biāo)準(zhǔn)化去做這個(gè)工作,所以不能單單以學(xué)術(shù)界的榜單來判斷大模型做的好還是不好。

    目前面臨著很多一些新的風(fēng)險(xiǎn)和挑戰(zhàn),有技術(shù)、心理和社會(huì)方面的風(fēng)險(xiǎn),模型里面有大量的參數(shù)是垃圾,到ChatGPT4到了上萬億,大模型大量的參數(shù)是垃圾,問題是你不知道誰是垃圾,你知道公司有人在摸魚,可是你不知道誰在摸魚,肯定很多參數(shù)在摸魚,你需要做優(yōu)化,完全是可以做優(yōu)化。幾年前我們討論的深度學(xué)習(xí)的時(shí)候,做出的決定是一個(gè)黑箱,不能做出解決。深度學(xué)習(xí)到今天,大模型更不可解釋的,因?yàn)槌霈F(xiàn)了涌現(xiàn)的現(xiàn)象,突然開竅了,突然開悟了,為什么會(huì)開悟了,沒法解釋。但是用于現(xiàn)實(shí)和社會(huì),它必須是可解釋的,只有可解釋以后,才能跟我們的法律、道德倫理和社會(huì)的游戲規(guī)則匹配起來,還有算力資源的部署有關(guān)系,還有人工智能出現(xiàn)了謎之自信的問題,AI的幻覺,對(duì)某些知識(shí)非常自信,跟人一樣有時(shí)候也是謎之自信。

    在文字方面,人也犯錯(cuò),所以不要那么苛求,繼續(xù)努力。在圖片方面也相對(duì)比較成熟了,美術(shù)方面很不錯(cuò),還有人聲合成,對(duì)生成音樂和聲音相對(duì)比較成熟了,模仿一個(gè)人的聲音時(shí)間并不長,現(xiàn)在很多UP主就是用數(shù)字化+人工智能訓(xùn)練出來,還有一些視頻的,還有編程已經(jīng)達(dá)到了初級(jí)程序員的水平,編程就是文字對(duì)文字的翻譯。還有在科學(xué)領(lǐng)域,科學(xué)院用的儀器和儀表,也需要人工智能來輔助,還有生物學(xué)和材料學(xué)等廣泛的使用。

    還有編程,今天的編程是在訓(xùn)練程序,不是在編寫程序。算法要完整,數(shù)據(jù)只要有結(jié)構(gòu),算法,框架+數(shù)據(jù),對(duì)算法細(xì)節(jié)的重要性沒有那么重要了,不僅數(shù)據(jù)要有結(jié)構(gòu),還要整個(gè)輸出。所以從編程序變成了訓(xùn)練程序。

    前幾年的移動(dòng)優(yōu)先和云優(yōu)先,我們要優(yōu)先考慮人工智能對(duì)我們的影響。我就講這些。謝謝!

-證券日?qǐng)?bào)網(wǎng)
  • 24小時(shí)排行 一周排行
  • 深度策劃

洞察半年報(bào)新動(dòng)能

產(chǎn)因城強(qiáng),城因產(chǎn)興。工業(yè)化與城市化是經(jīng)濟(jì)社會(huì)……[詳情]

版權(quán)所有證券日?qǐng)?bào)網(wǎng)

互聯(lián)網(wǎng)新聞信息服務(wù)許可證 10120180014增值電信業(yè)務(wù)經(jīng)營許可證B2-20181903

京公網(wǎng)安備 11010202007567號(hào)京ICP備17054264號(hào)

證券日?qǐng)?bào)網(wǎng)所載文章、數(shù)據(jù)僅供參考,使用前務(wù)請(qǐng)仔細(xì)閱讀法律申明,風(fēng)險(xiǎn)自負(fù)。

證券日?qǐng)?bào)社電話:010-83251700網(wǎng)站電話:010-83251800

網(wǎng)站傳真:010-83251801電子郵件:xmtzx@zqrb.net

證券日?qǐng)?bào)APP

掃一掃,即可下載

官方微信

掃一掃,加關(guān)注

官方微博

掃一掃,加關(guān)注