當前位置:主頁 > 聚焦 > 正文
    【環(huán)球時快訊】周楓談大語言模型:三項根本性新能力最為關鍵
    來源:藍鯨財經作者:洞察網2023-04-23 16:33:13

    近日,網易有道CEO周楓在個人公眾號發(fā)文,探討大語言模型技術帶來的三項根本性新能力。他指出,在大模型帶來的新能力中,涌現能力、作為基座模型支持多元應用的能力和支持對話作為統(tǒng)一入口的能力最為關鍵,可能給業(yè)界和產品帶來長期影響,值得重點關注。

    以下為內容全文:


    (相關資料圖)

    基于大語言模型技術的ChatGPT推出已經有4個月了,更多同類產品還在快速出現。比如,前天谷歌更新了Bard,將輔助編程能力支持的語言數量擴展到20種。

    然而,對大模型技術的重要性也出現了質疑,前段時間,吳軍老師就評價ChatGPT不算新技術革命,帶不來什么新的機會,他認為大模型仍然存在很多限制,不像大家追捧的那樣有吸引力。這篇文章發(fā)布后,網上也出現了多篇反駁文章。我不太關注這些爭論,但我認為有一個問題沒有被充分討論,那就是大模型帶來的新能力中,哪些是最為關鍵的,最有可能帶來長期影響的。

    我認為,與之前眾多的自然語言處理技術相比,大語言模型至少具有三項根本性新能力,這些新能力在學術界已經被廣泛討論,甚至被視為常識,但是在產業(yè)界和產品團隊中卻缺乏足夠的關注。實際上,這些大模型技術的特點已經改變了我們對業(yè)務和產品規(guī)劃的思考方式,也會改變很多產品的經濟模型。因此,產品經理和業(yè)務負責人需要更多地關注和深入思考這些新能力的應用場景。

    能力一:涌現能力(emergent abilities)

    涌現能力指的是在小型模型中并不存在,但在大模型中“突然出現”的能力,其中包括常識推理、問答、翻譯、數學、摘要等(詳見下圖)。如果僅依靠小型模型的能力做線性外推,往往無法預測出涌現能力的出現和其強度。OpenAI的首席技術官Ilya Sutskever在接受采訪時反復強調,盡管表面上看來,語言模型只是在預測下一個詞元(token),但當模型足夠大,transformer技術的建模能力足夠強時,基于內部表示的推理能力就會出現。因此,模型會呈現出與規(guī)模較小時完全不同的行為,涌現全新的能力。

    涌現能力之所以重要,不僅因為它們是大模型出現后才有的新能力,而且由大模型涌現出來的多數是非常重要的能力。例如,常識推理能力一直是AI領域的重大難題,而大模型的出現使得常識推理取得了重大進展。此外,大模型還有機會進一步獲得更多能力。例如,一旦“推理”能力涌現,“思維鏈提示”(Chain of Thought Prompting)策略就可以用來解決多步推理的難題。因此,涌現能力的出現,是大模型帶來的一項根本性變化。

    能力二:作為基座模型支持多元應用的能力

    在2021年,斯坦福大學等多所高校的研究人員提出了基座模型(foundation model)的概念,這更清晰地描述了之前學界所稱的預訓練模型的作用。這是一種全新的AI技術范式,借助于海量無標注數據的訓練,獲得可以適用于大量下游任務的大模型(單模態(tài)或者多模態(tài))。這樣,多個應用可以只依賴于一個或少數幾個大模型進行統(tǒng)一建設。

    上圖展示了基座模型的結構,基座模型集中化了多模態(tài)數據,并且可以適配多元化的下游任務。

    大語言模型是這個新模式的典型例子,使用統(tǒng)一的大模型可以極大地提高研發(fā)效率,相比于分散的模型開發(fā)方式,這是一項本質上的進步。大型模型不僅可以縮短每個具體應用的開發(fā)周期,減少所需人力投入,也可以基于大模型的推理、常識和寫作能力,獲得更好的應用效果。因此,大模型可以成為AI應用開發(fā)的大一統(tǒng)基座模型,這是一個一舉多得、全新的范式,值得大力推廣。

    能力三:支持對話作為統(tǒng)一入口的能力

    讓大語言模型真正火爆的契機,是基于對話聊天的ChatGPT。事實上,業(yè)界很早就發(fā)現了用戶對于對話交互的特殊偏好,陸奇在微軟期間2016年就推進“對話即平臺(conversation as a platform)”的戰(zhàn)略。此外,蘋果Siri、亞馬遜Echo等基于語音對話的產品也非常受歡迎,反映出互聯(lián)網用戶對于聊天和對話這種交互模式的偏好。雖然之前的聊天機器人存在各種問題,但大型語言模型的出現再次讓聊天機器人這種交互模式可以重新想像。用戶愈發(fā)期待像鋼鐵俠中“賈維斯”一樣的人工智能,無所不能、無所不知。這引發(fā)我們對于智能體(Agent)類型應用前景的思考,Auto-GPT、微軟Jarvis等項目已經出現并受到關注,相信未來會涌現出很多類似的以對話形態(tài)讓助手完成各種具體工作的項目。

    圖為微軟最新項目Jarvis的工作流程,Jarvis將通過任務規(guī)劃、模型選擇、任務執(zhí)行、生成響應四個步驟,結合HuggingFace上的眾多模型,完成多模態(tài)的復雜AI任務。

    隨著大型語言模型技術越來越受歡迎,我們可以期待它帶來更多的驚喜,特別是考慮到上面討論的這些大型模型帶來的關鍵新能力,周明等人所預測的語言智能黃金十年(2020-2030)很可能會成為現實,這正是一個令人興奮的時代。

    [責任編輯:linlin]

    標簽:

    相關文章

    評論排行
    熱門話題
    最近更新
    久久亚洲AV成人无码软件| 亚洲免费人成在线视频观看| 久久丫精品国产亚洲av不卡| 亚洲av综合avav中文| 亚洲成a人片在线观看无码专区| 亚洲精品视频免费观看| 亚洲Av无码乱码在线观看性色| 国产精品亚洲五月天高清| 色偷偷亚洲第一综合| 国产亚洲综合久久| 亚洲国产精品自在拍在线播放 | 亚洲网站在线免费观看| 中文字幕亚洲免费无线观看日本| 久久精品亚洲一区二区三区浴池 | 亚洲精品无码成人片久久不卡| 亚洲人成无码网站在线观看| 亚洲乱妇熟女爽到高潮的片| 亚洲国产精品久久久久秋霞小| 爱爱帝国亚洲一区二区三区| 亚洲国产成人精品无码久久久久久综合| 最新亚洲人成网站在线观看| 亚洲国产成人精品无码久久久久久综合 | 国产精品久久久亚洲| 久久亚洲精品成人| 亚洲一区二区三区夜色| 亚洲黄色在线观看视频| 亚洲一区二区三区亚瑟| 亚洲愉拍一区二区三区| 精品亚洲av无码一区二区柚蜜| 亚洲成片观看四虎永久| 77777亚洲午夜久久多人| 亚洲大尺度无码专区尤物| 777亚洲精品乱码久久久久久 | 精品国产日韩久久亚洲| 日韩欧美亚洲中文乱码| 国产精品亚洲美女久久久| 久久亚洲综合色一区二区三区 | 亚洲蜜芽在线精品一区| 国产AV旡码专区亚洲AV苍井空| 色欲色欲天天天www亚洲伊| 国产日产亚洲系列最新|