尊敬的鄔賀銓和王國法院士,很高興跟大家交流一下大模型最新發(fā)展。我本人讀研究生的時候就是學(xué)人工智能,后來因為不太好找工作,我就轉(zhuǎn)型去做互聯(lián)網(wǎng)研究了,沒有想到幾十年之后,又回來去做回人工智能,但是今天的人工智能看起來是神經(jīng)網(wǎng)絡(luò)。
我們也可以看到過去幾十年的時間,人工智能在多個領(lǐng)域取得了突破性的進展,雖然它依然會犯錯,但是錯誤率已經(jīng)低于人類的平均水平,也就是說比大多數(shù)人在這些方面的水平要高了。
從技術(shù)角度來說,人工智能已經(jīng)發(fā)展了60多年了,60多年來技術(shù)路線是千奇百怪,今天似乎在大模型,預(yù)訓(xùn)練的大模型,意味著一個新的產(chǎn)業(yè)正在形成當(dāng)中。
這幾年從通信基礎(chǔ)設(shè)施,搞算力的基礎(chǔ)設(shè)施開始,接下來未來幾年我們要搞智力的基礎(chǔ)設(shè)施,所以我們說智商原來是不在線的,現(xiàn)在看起來智商是要在線的,把智商放到網(wǎng)上去了,這個方向看起來已經(jīng)確立了。
第三個是TOB還是TOC,通用還是專業(yè)的問題,以前討論很多是對標(biāo)ChatGPT通用場景的大模型,更多的是要解決基礎(chǔ)模型方面的工作,這是一個非常重要的事情。主要是大型科技公司有這種財力和數(shù)據(jù)實力去做這一方面的事情,可以認(rèn)為TOC是面向公眾,下面很多的方向轉(zhuǎn)向垂類的,一定要聚焦特定領(lǐng)域,面向企業(yè)TOB,主要是圍繞產(chǎn)品和解決方案來做。如何做垂類的模型,國內(nèi)外不一樣,在硅谷針對特定場景的微調(diào)做實驗,因為通用大模型還沒有出來,不可能圍繞它做生態(tài),很多企業(yè)是全站式的,自上而下在做垂類的模型。這個生態(tài)在國內(nèi)還需要一些時間,可能要求的門檻稍微低一點,這一類可以理解成私有的,或者專用的,其實就把云計算十年前的一些做法和一些口號,還有一些套路,往人工智能和大模型一靠,就差不多了。可以很明顯,基礎(chǔ)大模型和通用大模型的優(yōu)點和不足,行業(yè)垂類大模型也有各自的優(yōu)勢和缺點,下一步很可能是走向融合,走向混合。
我們要做垂類行業(yè)大模型,為了數(shù)據(jù)的安全,這些數(shù)據(jù)不能拿出來,很多數(shù)據(jù)是非常敏感的,肯定大模型要做私有化的部署。過幾年的時間,我個人的判斷,就像今天的云肯定是一個混合云和混合AI的模式。
還有討論今年的閉源大模型和開源大模型,ChatGPT出來是必然的,這個必然是有各種各樣的原因。所以接下來對這個行業(yè)來說,因為這個行業(yè)的特點是贏家通吃,剩下的企業(yè)只能抱團取暖,必須抱一個開源社區(qū),大家一起把開源的事情做起來。我們可以認(rèn)為開源大模型正在剛剛興起,這個浪潮剛剛開始,誰能勝出還不知道。當(dāng)年移動互聯(lián)網(wǎng)里面,蘋果手機出來之后,接下來是安卓生態(tài)的建設(shè),這一幕會重演,圍繞著開源社區(qū)的生態(tài),開源大模型面臨著很多的挑戰(zhàn),一個重要的是它反向影響對開源的定義。我們對開源的定義是在25年前出現(xiàn)的,當(dāng)年定義做的開源規(guī)則,針對的是軟件,針對的是代碼,今天人工智能這個開源針對的是模型,針對的是權(quán)重,里面很多數(shù)據(jù)集,大模型的開源和軟件的開源,和代碼的開源確實不太一樣,所以我們需要在人工智能這個時代重新定義開源,今天面對模型,加了很多的數(shù)據(jù),至少我看有三個方面的區(qū)別,加了很多科技倫理,所以這一塊有AIGC產(chǎn)生一些新的內(nèi)容,它是一個自循環(huán)了,會出現(xiàn)無數(shù)的問題。
整體來看,國外做了很多的榜單,但是從學(xué)術(shù)到產(chǎn)業(yè)還需要做更多的工作,學(xué)術(shù)界和產(chǎn)業(yè)界關(guān)注不一樣,產(chǎn)業(yè)界主要關(guān)注性能,還有可靠性,穩(wěn)定性,場景適應(yīng)性怎么樣,維護性怎么樣,或者你的工程能力怎么樣,要用工程化和標(biāo)準(zhǔn)化去做這個工作,所以不能單單以學(xué)術(shù)界的榜單來判斷大模型做的好還是不好。
目前面臨著很多一些新的風(fēng)險和挑戰(zhàn),有技術(shù)、心理和社會方面的風(fēng)險,模型里面有大量的參數(shù)是垃圾,到ChatGPT4到了上萬億,大模型大量的參數(shù)是垃圾,問題是你不知道誰是垃圾,你知道公司有人在摸魚,可是你不知道誰在摸魚,肯定很多參數(shù)在摸魚,你需要做優(yōu)化,完全是可以做優(yōu)化。幾年前我們討論的深度學(xué)習(xí)的時候,做出的決定是一個黑箱,不能做出解決。深度學(xué)習(xí)到今天,大模型更不可解釋的,因為出現(xiàn)了涌現(xiàn)的現(xiàn)象,突然開竅了,突然開悟了,為什么會開悟了,沒法解釋。但是用于現(xiàn)實和社會,它必須是可解釋的,只有可解釋以后,才能跟我們的法律、道德倫理和社會的游戲規(guī)則匹配起來,還有算力資源的部署有關(guān)系,還有人工智能出現(xiàn)了謎之自信的問題,AI的幻覺,對某些知識非常自信,跟人一樣有時候也是謎之自信。
在文字方面,人也犯錯,所以不要那么苛求,繼續(xù)努力。在圖片方面也相對比較成熟了,美術(shù)方面很不錯,還有人聲合成,對生成音樂和聲音相對比較成熟了,模仿一個人的聲音時間并不長,現(xiàn)在很多UP主就是用數(shù)字化+人工智能訓(xùn)練出來,還有一些視頻的,還有編程已經(jīng)達到了初級程序員的水平,編程就是文字對文字的翻譯。還有在科學(xué)領(lǐng)域,科學(xué)院用的儀器和儀表,也需要人工智能來輔助,還有生物學(xué)和材料學(xué)等廣泛的使用。
還有編程,今天的編程是在訓(xùn)練程序,不是在編寫程序。算法要完整,數(shù)據(jù)只要有結(jié)構(gòu),算法,框架+數(shù)據(jù),對算法細(xì)節(jié)的重要性沒有那么重要了,不僅數(shù)據(jù)要有結(jié)構(gòu),還要整個輸出。所以從編程序變成了訓(xùn)練程序。
前幾年的移動優(yōu)先和云優(yōu)先,我們要優(yōu)先考慮人工智能對我們的影響。我就講這些。謝謝!
11:47 | 加強與投資者互動交流 奧特維舉辦2... |
11:45 | 全國首單版權(quán)ABN落地 成都銀行持... |
11:40 | 轉(zhuǎn)讓價16億元 國城礦業(yè)擬出售宇邦... |
11:38 | 電科芯片:電科投資首次增持8萬股... |
11:37 | 川儀股份2024年三季度擬派發(fā)現(xiàn)金紅... |
11:35 | 廣汽傳祺“三年煥新”首年開好局 2... |
11:32 | 興業(yè)銀錫擬23.88億元收購宇邦礦業(yè)8... |
11:31 | 周末重磅!深交所最新發(fā)布! |
11:04 | 重藥控股控股股東2%股權(quán)劃轉(zhuǎn)至通用... |
10:58 | 世界顯示產(chǎn)業(yè)創(chuàng)新發(fā)展大會智能投影... |
10:49 | 敷爾佳:分紅預(yù)案獲股東大會通過 |
10:27 | 博騰股份與白帆生物達成戰(zhàn)略合作 ... |
版權(quán)所有證券日報網(wǎng)
互聯(lián)網(wǎng)新聞信息服務(wù)許可證 10120180014增值電信業(yè)務(wù)經(jīng)營許可證B2-20181903
京公網(wǎng)安備 11010202007567號京ICP備17054264號
證券日報網(wǎng)所載文章、數(shù)據(jù)僅供參考,使用前務(wù)請仔細(xì)閱讀法律申明,風(fēng)險自負(fù)。
證券日報社電話:010-83251700網(wǎng)站電話:010-83251800 網(wǎng)站傳真:010-83251801電子郵件:xmtzx@zqrb.net
掃一掃,即可下載
掃一掃,加關(guān)注
掃一掃,加關(guān)注