跨越鴻溝！全球最大AI巨量模型正式開源

發(fā)布人：中國科學報時間：2021-10-31 來源：工程師

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對面交流
  海量資料庫查詢

作者｜張雙虎

“貧窮限制了我們的想象力?！眲④婏L趣地說，“以前我們沒有相應資源、也不具備相關(guān)技術(shù)，不知道有更大的算力、更大的數(shù)據(jù)、更大的模型后能干什么。但今天我們有條件這么做，我認為這就是科技發(fā)展的趨勢，它能讓我們更快、更強?！?/span>

大模型的“浪潮”正奔涌向前。

10月26日，在“2021人工智能計算大會（AICC 2021）”上，浪潮人工智能研究院宣布：正式開放源1.0的API（應用程序編程接口），開放高質(zhì)量中文數(shù)據(jù)集，開源該大模型的訓練、推理及應用代碼，并和合作伙伴一起，推動面向多元AI芯片的模型移植開發(fā)。

距發(fā)布全球最大人工智能巨量模型——源1.0不到1個月時間，浪潮人工智能研究院就邁出了開源開放的步伐。如此緊鑼密鼓的行動，浪潮將推動大模型向何處去？

智慧之

“智慧時代即將到來。”在2021人工智能計算大會上，中國工程院院士王恩東說，“算力已經(jīng)成為智慧時代的決定性力量，面對指數(shù)級增長的戰(zhàn)略需求，計算產(chǎn)業(yè)正面臨多元化、巨量化、生態(tài)離散化交織的趨勢與挑戰(zhàn)。”

王恩東認為，當前多樣化的智能場景需要多元化的算力，巨量化的模型、數(shù)據(jù)和應用規(guī)模需要巨量的算力，算力已經(jīng)成為人工智能繼續(xù)發(fā)展的重中之重；另一方面，從芯片到算力的轉(zhuǎn)化依然存在巨大鴻溝，多元算力價值并未得到充分釋放。

目前，AI芯片架構(gòu)五花八門，指令集不同，無法兼容，而面向芯片的編程庫又跟芯片綁定，靈活性差。小公司只能做其中的一個環(huán)節(jié)，這造成生態(tài)的縱向不通；大公司希望構(gòu)建封閉的系統(tǒng)，這造成了生態(tài)的橫向不通。

“大模型已經(jīng)成為全球人工智能競爭的戰(zhàn)略制高點，成為應對新挑戰(zhàn)的必然選擇?！崩顺毙畔⒏笨偛脛④娬f，“但大模型對于算力、算法和數(shù)據(jù)的要求，對協(xié)同創(chuàng)新能力的要求非常高，從浪潮自身產(chǎn)業(yè)發(fā)展策略、競爭優(yōu)勢及能力儲備來說，我們很適合做這個（大模型）?！?/span>

浪潮人工智能研究院首席研究員吳韶華介紹說，源1.0有2457億的參數(shù)，訓練部署一個完整的模型副本需要304塊GPU。為保證精度、加速訓練性能，研究團隊在模型算法上開展了一系列創(chuàng)新，解決了大模型開發(fā)不穩(wěn)定這一業(yè)界難題，最后在2128塊GPU集群上取得了優(yōu)異的性能。

對比GPT-3完成訓練需要1萬塊GPU、1750億參數(shù)量和570GB訓練數(shù)據(jù)集，源1.0參數(shù)規(guī)模領(lǐng)先40%，訓練數(shù)據(jù)集規(guī)模領(lǐng)先近10倍。

為訓練源1.0，研究團隊清洗了近860TB的互聯(lián)網(wǎng)數(shù)據(jù)，開發(fā)出5TB的業(yè)界最大規(guī)模高質(zhì)量中文數(shù)據(jù)集。

精度方面，源1.0在中文權(quán)威的自然語言處理任務CLUE零樣本學習和小樣本學習榜單上均排名第一。同時，它也在中文問答任務，如WebQA上有大幅度的精度提升，成為當前領(lǐng)先的中文自然語言處理模型。

劉軍介紹說，開發(fā)AI服務器的系統(tǒng)需要處理超過1萬個零部件，其中有50多類專用芯片，包含30多個技術(shù)方向，有100多種傳輸協(xié)議需要優(yōu)化，同時涉及熱、電、材料、化學、流體力學等學科和一系列復雜的問題，其“技術(shù)難度和復雜程度已經(jīng)達到當前AI系統(tǒng)的巔峰”。而開發(fā)大模型的難度也很大，不但要在巨量數(shù)據(jù)、超大規(guī)模分布式訓練及巨量模型算法框架等方面保證可靠性，還要解決大模型計算和算力調(diào)度等多方面的難題。

“進入大模型時代，我們很多用戶和合作伙伴已無法自己去完成這樣一個大模型的研發(fā)、訓練和交互工作了?！眲④娬f，“從算力行業(yè)發(fā)展來說，我們一定要幫助用戶和合作伙伴，推動人工智能向生態(tài)化、產(chǎn)業(yè)化發(fā)展。”

匯涓成“流

在人工智能領(lǐng)域，免費、共享、開放和開源是幾個不同的概念。即使同為開源，開到什么程度，到代碼、數(shù)據(jù)集、API還是指令集的區(qū)別也很大。

研發(fā)源1.0之前，吳韶華團隊曾測試過包括GPT-3之類的開源模型。結(jié)果發(fā)現(xiàn)，使用這些模型會受到各種限制，有些進入門檻很高，有些所謂的開源實際上很難真正使用。

“浪潮‘源1.0’這次的開源非常徹底，從數(shù)據(jù)集、源代碼到API等，此外，浪潮人工智能研究院也會與伙伴一起，基于‘源1.0’的模型共同開展針對多元AI芯片的模型移植工作。”劉軍說，“我們不希望這種巨量模型成為人工智能研究的藩籬?！?/span>

目前，浪潮主要針對三類對象開放合作：一是大學或科研機構(gòu)的人工智能研究團隊，二是元腦生態(tài)合作伙伴，三是智能計算中心。這種開放在用戶層面是產(chǎn)學研用全覆蓋，在內(nèi)容上是從底層開始徹底的開源開放。浪潮希望源1.0 能成為具有通用性和普惠性的“算法基礎(chǔ)設施”，從而賦能千行百業(yè)，讓企業(yè)、科研機構(gòu)或個人能真正使用這一模型。

“源1.0已經(jīng)做出來了，將來還會推出源2.0、3.0……”吳韶華說，“我們將其開源，下一步我們會向多模態(tài)方向發(fā)展，進一步優(yōu)化算法、提高算力、提升參數(shù)數(shù)量。希望源2.0將來是和合作伙伴一起推出的，這樣可以更貼近應用場景、更快速實現(xiàn)落地，同時兼顧對前沿技術(shù)的探索?！?/span>

目前，大模型落地仍有諸多困難。一方面要考慮技術(shù)如何走出實驗室，另一方面真正有數(shù)據(jù)、有需求的行業(yè)可能又不具備算力、數(shù)據(jù)的承載能力。此外，應用場景的能源、人才是否適配都是難題，需要從國家、產(chǎn)業(yè)、企業(yè)和科研機構(gòu)多機構(gòu)、多角度協(xié)同推進。

去年12月，浪潮和國家信息中心聯(lián)合發(fā)布的《智能計算中心規(guī)劃建設指南》指出，要采用領(lǐng)先的人工智能計算架構(gòu)和最新的人工智能的理論，實現(xiàn)智能計算中心這個平臺的算力的生產(chǎn)、聚合、調(diào)度和示范，從而推動AI產(chǎn)業(yè)化、產(chǎn)業(yè)AI化和政府治理的智能化。

為更好服務新型基礎(chǔ)設施建設，提供智慧城市解決方案與產(chǎn)品服務，浪潮首先提出自己的智能化，從智能工廠、智能客服體系來提升服務水平。

與此同時，通過開源開放計劃，浪潮和合作伙伴一起研發(fā)，碰撞出火花，把一項實驗室技術(shù)打造成能普惠產(chǎn)業(yè)的算法算力平臺，促進人工智能生態(tài)化、產(chǎn)業(yè)化發(fā)展。

“就像你要在山頂建一座高塔，你不必從山腳爬到山頂，現(xiàn)在你已經(jīng)站在山頂了，只需要在山頂建塔即可?！眲④娬f，“這對整個產(chǎn)業(yè)的快速推進非常有利。實際上，浪潮已經(jīng)開發(fā)好平臺。一些非計算機類院校畢業(yè)生，只要會用模型的API，能去生成新任務就可以了。這也緩解了人工智能產(chǎn)業(yè)發(fā)展的人才需求缺口。同時，從用戶需求推動，也會促進大模型的發(fā)展?！?/span>

奔涌“浪潮

新舊技術(shù)的更迭遠超人們的想像。IBM的締造者托馬斯?沃森曾說，“全世界只需要5臺電腦就足夠了”。微軟聯(lián)合創(chuàng)始人比爾?蓋茨在一次演講中宣稱，“個人計算機的內(nèi)存640K足矣”。然而，現(xiàn)在一部手機的性能就能“秒殺”20年前最快的“超級計算機”。

“如果我們放寬視野，從更長的時間維度看，現(xiàn)在的大模型也許10年后就不值一提了?！眲④娬f，“未來大模型的發(fā)展，要從應用場景和用戶需求出發(fā)，進一步優(yōu)化算法、提高算力、增加數(shù)據(jù)量?！?nbsp;

吳韶華同樣認為，任何一項技術(shù)的發(fā)展，都要經(jīng)歷從興起、成熟再到落地的過程?！皬陌l(fā)展規(guī)律來看，大模型現(xiàn)在剛剛興起，大家正在圍繞模型體量及模型體量帶來的推動效應開展探索。當大模型探索走向成熟之后，才會涉及應用的具體問題，比如小型化運營、高性能、可部署等方面”。

“貧窮限制了我們的想象力?！眲④婏L趣地說，“以前我們沒有相應資源、也不具備相關(guān)技術(shù)，不知道有更大的算力、更大的數(shù)據(jù)、更大的模型能干什么后能干什么。但今天我們有條件這么做，我認為這就是科技發(fā)展的趨勢，它能讓我們更快、更強?！?/span>

浪潮研發(fā)源1.0的初衷有兩個：一是探索人工智能的前沿方向，推動智能算法創(chuàng)新；二是建設算力基礎(chǔ)設施，并落地應用、推動產(chǎn)業(yè)落地。由此可見，這個開放共享的“源”不僅是個大模型，也是創(chuàng)新之源、智慧之源。

“道旅遼遠，山川悠長?！边@是源1.0在人工智能計算大會上創(chuàng)作的一句意境悠遠的詩，似乎也在勉勵人們：從源出發(fā)，不捐細流、不畏險阻，終會形成澎湃“浪潮”，席卷人工智能的海灘。

編輯 | 趙路
排版 | 郭剛

*博客內(nèi)容為網(wǎng)友個人發(fā)布，僅代表博主個人觀點，如有侵權(quán)請聯(lián)系工作人員刪除。

国产肉体XXXX裸体137大胆,国产成人久久精品流白浆,国产乱子伦视频在线观看,无码中文字幕免费一区二区三区国产成人手机在线-午夜国产精品无套-swag国产精品-国产毛片久久国产

博客專欄

跨越鴻溝！全球最大AI巨量模型正式開源

相關(guān)推薦

技術(shù)專區(qū)

国产肉体XXXX裸体137大胆,国产成人久久精品流白浆,国产乱子伦视频在线观看,无码中文字幕免费一区二区三区 国产成人手机在线-午夜国产精品无套-swag国产精品-国产毛片久久国产

博客專欄

跨越鴻溝！全球最大AI巨量模型正式開源

相關(guān)推薦

技術(shù)專區(qū)

国产肉体XXXX裸体137大胆,国产成人久久精品流白浆,国产乱子伦视频在线观看,无码中文字幕免费一区二区三区国产成人手机在线-午夜国产精品无套-swag国产精品-国产毛片久久国产

跨越鴻溝！全球最大AI巨量模型正式開源