何寶宏：圍繞開源大模型的挑戰(zhàn)很多，其中重要一條是大模型開始反向影響對開源的經(jīng)典定義

2023-08-11 17:39 來源：證券日報網(wǎng)

何.jpg

尊敬的鄔賀銓和王國法院士，很高興跟大家交流一下大模型最新發(fā)展。我本人讀研究生的時候就是學(xué)人工智能，后來因為不太好找工作，我就轉(zhuǎn)型去做互聯(lián)網(wǎng)研究了，沒有想到幾十年之后，又回來去做回人工智能，但是今天的人工智能看起來是神經(jīng)網(wǎng)絡(luò)。

我們也可以看到過去幾十年的時間，人工智能在多個領(lǐng)域取得了突破性的進展，雖然它依然會犯錯，但是錯誤率已經(jīng)低于人類的平均水平，也就是說比大多數(shù)人在這些方面的水平要高了。

從技術(shù)角度來說，人工智能已經(jīng)發(fā)展了60多年了，60多年來技術(shù)路線是千奇百怪，今天似乎在大模型，預(yù)訓(xùn)練的大模型，意味著一個新的產(chǎn)業(yè)正在形成當(dāng)中。

這幾年從通信基礎(chǔ)設(shè)施，搞算力的基礎(chǔ)設(shè)施開始，接下來未來幾年我們要搞智力的基礎(chǔ)設(shè)施，所以我們說智商原來是不在線的，現(xiàn)在看起來智商是要在線的，把智商放到網(wǎng)上去了，這個方向看起來已經(jīng)確立了。

第三個是TOB還是TOC，通用還是專業(yè)的問題，以前討論很多是對標(biāo)ChatGPT通用場景的大模型，更多的是要解決基礎(chǔ)模型方面的工作，這是一個非常重要的事情。主要是大型科技公司有這種財力和數(shù)據(jù)實力去做這一方面的事情，可以認(rèn)為TOC是面向公眾，下面很多的方向轉(zhuǎn)向垂類的，一定要聚焦特定領(lǐng)域，面向企業(yè)TOB，主要是圍繞產(chǎn)品和解決方案來做。如何做垂類的模型，國內(nèi)外不一樣，在硅谷針對特定場景的微調(diào)做實驗，因為通用大模型還沒有出來，不可能圍繞它做生態(tài)，很多企業(yè)是全站式的，自上而下在做垂類的模型。這個生態(tài)在國內(nèi)還需要一些時間，可能要求的門檻稍微低一點，這一類可以理解成私有的，或者專用的，其實就把云計算十年前的一些做法和一些口號，還有一些套路，往人工智能和大模型一靠，就差不多了。可以很明顯，基礎(chǔ)大模型和通用大模型的優(yōu)點和不足，行業(yè)垂類大模型也有各自的優(yōu)勢和缺點，下一步很可能是走向融合，走向混合。

我們要做垂類行業(yè)大模型，為了數(shù)據(jù)的安全，這些數(shù)據(jù)不能拿出來，很多數(shù)據(jù)是非常敏感的，肯定大模型要做私有化的部署。過幾年的時間，我個人的判斷，就像今天的云肯定是一個混合云和混合AI的模式。

還有討論今年的閉源大模型和開源大模型，ChatGPT出來是必然的，這個必然是有各種各樣的原因。所以接下來對這個行業(yè)來說，因為這個行業(yè)的特點是贏家通吃，剩下的企業(yè)只能抱團取暖，必須抱一個開源社區(qū)，大家一起把開源的事情做起來。我們可以認(rèn)為開源大模型正在剛剛興起，這個浪潮剛剛開始，誰能勝出還不知道。當(dāng)年移動互聯(lián)網(wǎng)里面，蘋果手機出來之后，接下來是安卓生態(tài)的建設(shè)，這一幕會重演，圍繞著開源社區(qū)的生態(tài)，開源大模型面臨著很多的挑戰(zhàn)，一個重要的是它反向影響對開源的定義。我們對開源的定義是在25年前出現(xiàn)的，當(dāng)年定義做的開源規(guī)則，針對的是軟件，針對的是代碼，今天人工智能這個開源針對的是模型，針對的是權(quán)重，里面很多數(shù)據(jù)集，大模型的開源和軟件的開源，和代碼的開源確實不太一樣，所以我們需要在人工智能這個時代重新定義開源，今天面對模型，加了很多的數(shù)據(jù)，至少我看有三個方面的區(qū)別，加了很多科技倫理，所以這一塊有AIGC產(chǎn)生一些新的內(nèi)容，它是一個自循環(huán)了，會出現(xiàn)無數(shù)的問題。

整體來看，國外做了很多的榜單，但是從學(xué)術(shù)到產(chǎn)業(yè)還需要做更多的工作，學(xué)術(shù)界和產(chǎn)業(yè)界關(guān)注不一樣，產(chǎn)業(yè)界主要關(guān)注性能，還有可靠性，穩(wěn)定性，場景適應(yīng)性怎么樣，維護性怎么樣，或者你的工程能力怎么樣，要用工程化和標(biāo)準(zhǔn)化去做這個工作，所以不能單單以學(xué)術(shù)界的榜單來判斷大模型做的好還是不好。

目前面臨著很多一些新的風(fēng)險和挑戰(zhàn)，有技術(shù)、心理和社會方面的風(fēng)險，模型里面有大量的參數(shù)是垃圾，到ChatGPT4到了上萬億，大模型大量的參數(shù)是垃圾，問題是你不知道誰是垃圾，你知道公司有人在摸魚，可是你不知道誰在摸魚，肯定很多參數(shù)在摸魚，你需要做優(yōu)化，完全是可以做優(yōu)化。幾年前我們討論的深度學(xué)習(xí)的時候，做出的決定是一個黑箱，不能做出解決。深度學(xué)習(xí)到今天，大模型更不可解釋的，因為出現(xiàn)了涌現(xiàn)的現(xiàn)象，突然開竅了，突然開悟了，為什么會開悟了，沒法解釋。但是用于現(xiàn)實和社會，它必須是可解釋的，只有可解釋以后，才能跟我們的法律、道德倫理和社會的游戲規(guī)則匹配起來，還有算力資源的部署有關(guān)系，還有人工智能出現(xiàn)了謎之自信的問題，AI的幻覺，對某些知識非常自信，跟人一樣有時候也是謎之自信。

在文字方面，人也犯錯，所以不要那么苛求，繼續(xù)努力。在圖片方面也相對比較成熟了，美術(shù)方面很不錯，還有人聲合成，對生成音樂和聲音相對比較成熟了，模仿一個人的聲音時間并不長，現(xiàn)在很多UP主就是用數(shù)字化+人工智能訓(xùn)練出來，還有一些視頻的，還有編程已經(jīng)達到了初級程序員的水平，編程就是文字對文字的翻譯。還有在科學(xué)領(lǐng)域，科學(xué)院用的儀器和儀表，也需要人工智能來輔助，還有生物學(xué)和材料學(xué)等廣泛的使用。

還有編程，今天的編程是在訓(xùn)練程序，不是在編寫程序。算法要完整，數(shù)據(jù)只要有結(jié)構(gòu)，算法，框架+數(shù)據(jù)，對算法細(xì)節(jié)的重要性沒有那么重要了，不僅數(shù)據(jù)要有結(jié)構(gòu)，還要整個輸出。所以從編程序變成了訓(xùn)練程序。

前幾年的移動優(yōu)先和云優(yōu)先，我們要優(yōu)先考慮人工智能對我們的影響。我就講這些。謝謝！

相關(guān)資訊

吳學(xué)義：大膽擁抱數(shù)字經(jīng)濟、數(shù)智經(jīng)濟和人工智能時代浪潮，大模型...2023-08-11 17:40

-證券日報網(wǎng)

熱點新聞

經(jīng)濟大省勇挑大梁推動科技創(chuàng)新和產(chǎn)業(yè)創(chuàng)新深度融合

港股IPO機制迎改革 A股公司發(fā)行H股門檻或降低

特別代表人訴訟或再增兩起立體化追責(zé)嚴(yán)懲“首惡”“幫兇”

年內(nèi)最后一期LPR維持前值不變后續(xù)調(diào)降仍有空間

24小時排行一周排行

深度策劃

萬億市場可期東北冰雪經(jīng)濟發(fā)展迎來新舉措

隨著東北等地各大滑雪場陸續(xù)開板……[詳情]

市場快訊

11:47	加強與投資者互動交流奧特維舉辦2...
11:45	全國首單版權(quán)ABN落地成都銀行持...
11:40	轉(zhuǎn)讓價16億元國城礦業(yè)擬出售宇邦...
11:38	電科芯片：電科投資首次增持8萬股...
11:37	川儀股份2024年三季度擬派發(fā)現(xiàn)金紅...
11:35	廣汽傳祺“三年煥新”首年開好局 2...
11:32	興業(yè)銀錫擬23.88億元收購宇邦礦業(yè)8...
11:31	周末重磅！深交所最新發(fā)布！
11:04	重藥控股控股股東2%股權(quán)劃轉(zhuǎn)至通用...
10:58	世界顯示產(chǎn)業(yè)創(chuàng)新發(fā)展大會智能投影...
10:49	敷爾佳：分紅預(yù)案獲股東大會通過
10:27	博騰股份與白帆生物達成戰(zhàn)略合作 ...