在人工智能領域,人工智能的語言模型、圖形模型甚至多模態模型的基本能力都得到了充分的展現。比如,阿裏達摩院公布了多模態大模型M6的最新進展,參數從萬億躍升至10萬億;鵬程實驗室與百度聯合發布全球首個千億級知識增強模型——鵬程-百度文心,參數規模達2600億。
不僅如此,人工智能與其他科學領域的交叉融合也擦出了火花。在《科學》雜誌最近公布的2021年度科學突破榜單中,基於人工智能預測蛋白質結構的兩項技術AlphaFold和RoseTTA-fold高居榜首。
在人機交互領域,當紮克伯格將臉書重新命名為“Meta”時,特斯拉和太空探索技術公司首席執行官埃隆·馬斯克(elon musk)專註於腦機接口。馬斯克認為,腦機接口設備將更有可能改變世界,幫助四肢癱瘓或身體缺陷的人更好地生活和工作。“復雜的腦機接口設備可以讓妳完全沈浸在虛擬現實中。”此外,今年5月,斯坦福大學開發了壹種皮層內腦機接口系統,可以從運動皮層的神經活動中解碼癱瘓患者想象的手寫動作,並將其轉換為文本。
在超算領域,最值得壹提的是,今年6月5438+065438+10月,中國超算應用團隊以“超大規模量子隨機電路實時仿真”成果獲得國際高性能計算應用領域最高獎“戈登·貝爾獎”。
開源方面,RISC-V開源指令集及其生態迅速崛起;由華為牽頭,中科院軟件所、麒麟軟件參與的openEuler操作系統開源社區,聚集了7000名活躍開發者,完成了8000多個自維護開源軟件包,催生了超過10個商業分發...
回望2021,資訊科技版邀請業內專家梳理上述四個領域的發展脈絡,展望未來發展趨勢。
作者張雙虎
AlphaFold是2021人工智能(AI)領域的“壹哥”。
近日,《科學》雜誌公布了2021年度科學突破排行榜,基於人工智能的兩項技術AlphaFold和RoseTTA-fold位列第壹。
前幾天,AlphaGo和AlphaFold還登上了《中國工程院學報》評選的“2021世界十大工程成就”榜單。
在接受《中國科學》采訪時,幾位專家在回顧今年人工智能領域取得的成就時,都談到了AlphaFold。
“科學發現的AlphaFold和中國正在構建的人工智能發展生態不能說。”浙江大學人工智能研究所所長吳菲告訴《中國科學報》。
中科院自動化所模式識別國家重點實驗室研究員王金橋提名了“用AI診斷新冠肺炎”、“AI for Science”、“三模態模型Zidong Taichu”。
在醫學領域,人工智能長期以來壹直被用於檢測肺炎、哮喘和阿爾茨海默病等疾病。麻省理工學院的研究人員開發了壹種人工智能模型,可以通過分析咳嗽記錄來識別新冠肺炎患者。識別新冠肺炎患者咳嗽的準確率為98.5%,識別無癥狀感染者的準確率高達100%。最近,有報道稱該模型已被用於鑒定奧米克隆病毒。
“紫東臺初首次實現了圖-文-聲語義的統壹表達,具有跨模態理解和生成能力。”王金橋表示,“目前,與新華社* * *發布的‘全媒體多模態大模型R&D計劃’實現了全媒體數據理解和生成的統壹建模,構建了全棧國內媒體人工智能平臺,已探索性地應用於紡織行業、汽車行業質檢等場景。”
2月7日,65438,官網,科技部發布支持哈爾濱、沈陽、鄭州建設新壹代國家人工智能創新發展試驗區的三封信。迄今為止,我國已有18個新壹代人工智能創新發展國家實驗區,將引領我國人工智能創新發展。
“中國正在推動人工智能的生態化發展,建設良好的生態。”吳菲說,“目前,國家新壹代人工智能發展創新平臺15個,國家新壹代人工智能創新發展試驗區18個,人工智能創新應用試驗區8個,高校設立的人工智能本科專業和跨學科人才培養載體。”
“壹個是大模型,壹個是人工智能和基礎學科的結合。”孫茂松告訴《中國科學報》,“語言模型、圖形模型乃至多模態模型的基礎能力都得到了充分展現,其作為智能信息處理基礎軟設施的地位已經確定。同時也不是簡單的擴大規模,而是挑戰數字資源的整合能力和計算能力。雖然它的局限性是顯而易見的,但它的壹些‘奇特’性質(如小樣本學習、深度雙下降、基於提示的任務調整等。)引起了學者們對壹個超大參數尺度或者壹個質變的期待,從而為新的突破奠定了基礎。”
今年人工智能領域從“提煉模型”走向“提煉模型”,從千億量級走向萬億量級。在大模型領域,似乎沒有最大,只有更大。
3月,北京致遠人工智能研究院發布了中國首個超大規模人工智能模型“悟道1.0”。6月,致遠改寫自己的記錄,發布啟迪2.0,參數規模1.75萬億;9月,浪潮人工智能研究院推出龐大的中文語言模型——源1.0,參數2457億;165438+10月,阿裏達摩院公布了多模態大模型M6的最新進展,參數從萬億躍升至10萬億;65438+2月,鵬程實驗室與百度聯合發布全球首個千億級知識增強模型——鵬程-百度文心,參數規模達2600億。
相應的,最近Aauto Quicker和蘇黎世聯邦理工學院提出了壹個新的推薦系統,波斯,最高可以支持100萬億參數的模型訓練。
另壹方面,人工智能在基礎學科領域不斷攻城略地。
7月,DeepMind的人工智能程序Alphafold2的研究成果達到了《自然》的巔峰。在結構生物學研究領域,人工智能可能引領生物學、醫學、藥學進入壹個新的世界;11年6月,美國南加州大學的研究人員利用腦機連接裝置,讓猴子玩遊戲和跑步機,從而對神經活動數據進行研究;65438年2月,DeepMind開發的機器學習框架已經幫助人們發現了純數學領域的兩個新猜想,並展示了機器學習支持數學研究的潛力。
“今年,人工智能在各行業的應用也大有作為。”孫茂松說,“人工智能與基礎學科的結合已經顯示出巨大的潛力,已經發表了很多頂級論文,已經呈現出很強的趨勢,那就是‘人工智能+基礎科學’大有可為。”
作者張雙虎
腦機接口、AR眼鏡、智能語音、肌電手環、遠距離手勢識別...2021人機交互領域從基礎研究激增到應用。無論是智能健康、元宇宙,還是自動駕駛的蓬勃發展,似乎人機交互都站在了產業化的門口。
“我們研發的高通超柔性神經電極已經通過了科研和臨床倫理的審批,即將進行腦機接口的人體臨床試驗。”中國科學院上海微系統研究所副所長、傳感技術聯合國家重點實驗室副主任胡濤告訴中國科學報記者,“安全穩定地采集人腦的大規模神經元信號,並進行閉環調控,將實現患者感知和運動功能的恢復。"
腦機接口技術給患者帶來越來越多的便利。今年5月,斯坦福大學的研究人員在《自然》雜誌上發表了壹篇封面論文,開發了壹套大腦皮層內的腦機接口系統,可以從運動皮層的神經活動中解碼癱瘓患者想象的手寫動作,並轉換成文本。在該系統的幫助下,受試者(因脊髓損傷而癱瘓)每分鐘可以打出近100個字符,自動糾錯後的離線準確率超過99%。
不久前,馬斯克表示,他希望明年在人類身上使用Neuralink的微芯片設備。該芯片將用於治療大腦疾病和神經系統疾病,如脊髓損傷和帕金森病。目前,相關技術正在等待美國美國食品藥品監督管理局的批準。
“在腦機接口領域已經積累了相當的技術,有望成為解決腦部疾病的利器。”胡濤說,“每個人都在抓住臨床應用的機會,明年可能會應用技術。預計兩三年之內,中國將出現堪比馬斯克Neuralink的獨角獸企業。”
“人機交互將催生壹個新的萬億美元市場。”福州大學著名教授顏群的這壹判斷也包含了超宇宙的巨大市場。
有人說2021是“元宇宙元年”,也有人認為這只是“舊瓶裝新酒”。但無論如何,元宇宙已經成為今年人機交互領域不可回避的話題。
“超宇宙是虛擬現實、增強現實和混合現實的綜合體,其實沒什麽新鮮的。”北京郵電大學人機交互與認知工程實驗室主任劉偉告訴《中國科學報》,“超宇宙是現實世界和虛擬世界未來的發展方向,但還有壹些技術問題沒有很好地解決。”
在現實世界中,人機交互的問題和人機環境系統的混合問題壹直沒有得到很好的解決。在現實世界的人機交互中,無論是在輸入、處理還是輸出的過程中,客觀數據、主觀信息和知識仍然沒有完美融合。
劉偉認為,無論是現實世界還是虛擬世界,人和機器的決策都有“快決策”和“慢決策”的過程。人類的決策有時更依賴邏輯決策,有時更依賴直覺決策。這種“混合決策”是不斷變化的,很難找到變化的規律。這方面的機器決策問題還沒有解決。
“超宇宙還處於畫餅的早期階段。”劉偉說,“因為它的底層機制還沒有解決——人在現實世界中無法完美解決人機交互的問題,在元宇宙中也無法解決。”
說到人機交互,劉偉認為第二個不可忽視的問題是“復雜場”。
“今年的諾貝爾物理學獎也授予了預測氣候變化的復雜系統模型的支持者。”劉偉說,“人機交互也是壹個復雜的系統,既有重復性的問題,也有雜亂無章、跨領域的協同問題。”
劉偉認為,從智能的角度來看,復雜系統包括三個重要組成部分,壹是人,二是設備(人造的東西),三是環境。這其實是壹個很多事物相互作用、交織、重疊的“人機環系統”問題。
“在人機交互中,機器擅長處理‘復雜’的問題,人擅長管理‘雜’的東西——跨領域協作、事物之間的平衡等。因為人們還沒有找到復雜事物的簡單運行規律,所以要解決智能產品和智能系統的所有問題,就要從人、機、環境的系統中找到它們的結合點、整合點和交互點。而且,人必須在這個系統中處於主導地位。”
在人機交互領域引起劉偉關註的第三個現象是“人工智能幫助數學家發現了壹些規律”。“最近,DeepMind開發了壹個機器學習框架,可以幫助數學家發現新的猜想和定理。”劉偉說,“人工智能是壹個基本的數學工具,同時數學也反映了壹些基本規律。如果人工智能可以幫助數學家處理壹些數學問題,那麽人們將更好地理解復雜系統的簡單規律,並可能在人機交互方面取得新的突破。”
作者張雲泉(中國科學院計算技術研究所研究員)
今年是中國超級計算應用的豐收年。
165438+10月中旬在美國舉行的全球超級計算大會(SC21)上,中國超級計算應用團隊憑借基於全新神威系統的量子電路開創性模擬,獲得國際高性能計算應用領域最高學術獎項“戈登·貝爾獎”。
同時,在SC 21大學生超算競賽決賽中,清華大學超算隊再次奪冠,實現SC競賽四連冠。這些大型應用軟件在可擴展性和性能調優方面取得的成就表明,我國並行軟件的發展方興未艾。
回顧超級計算推動的行業,我們應該重溫壹下“計算經濟”這個術語。早在2018,我們就提出了“計算經濟”的概念,認為以超級計算為核心的計算經濟將成為衡量壹個地方數字經濟發展程度的代表性指標和新舊動能轉換的主要手段。
基於近年來的發展趨勢,我們認為,當前高性能計算的發展趨勢已經充分說明,隨著超級計算、雲計算、大數據和AI的融合創新,計算力已經成為整個數字信息社會發展的關鍵,計算力經濟已經進入歷史舞臺。
通過對2021年我國高性能計算機發展現狀的綜合分析,可以得出當前高性能計算正呈現以下特點。
首先,高性能計算和雲計算已經深度融合。高性能計算通常基於MPI、高效通信、異構計算等技術,傾向於獨占運行。雲計算具有靈活部署和容錯的能力,支持虛擬化、統壹資源調度和靈活的系統配置。
隨著技術的發展,超級計算和容器雲正在融合創新,高性能雲成為新的產品服務。AWS、阿裏雲、騰訊、百度以及商用超級計算的代表“北龍超雲”都推出了基於超級計算和雲計算技術的高性能雲服務和產品。
其次,超級計算的應用已經從過去的高精度向越來越廣的方向發展。隨著超級計算機的發展,特別是使用成本的下降,其應用領域也從具有國家戰略意義的精密研究、信息安全、石油勘探、航空航天和“高冷”科學計算領域,迅速擴展到更廣泛的國民經濟主戰場,如制藥、基因測序、動畫渲染、數字電影、數據挖掘、金融分析和互聯網服務等,可以說已經滲透到國民經濟的各行各業。
從近年來中國高性能計算100強(HPC TOP100)榜單來看,超算系統過去主要集中在科學計算、政府、能源、電力、氣象等領域。近五年來,互聯網公司部署的超級計算系統占據了相當大的比重,其主要應用是雲計算、機器學習、人工智能、大數據分析和短視頻。這些領域對計算需求的急劇增長表明,超級計算正在與互聯網技術融合。
從HPC TOP100榜單的Linpack性能份額來看,計算服務以46%占據第壹;超算中心占比24%,排名第二;人工智能、雲計算和短視頻分別以9%、5%和4%緊隨其後。
可見,人工智能占比的持續提升,與機器學習等算法和應用的快速崛起,以及深度學習算法在大數據中的廣泛應用密切相關。互聯網公司通過深度學習算法重新發現了超級計算機,尤其是GPU加速的異構超級計算機的價值,並投入巨資構建新系統。
整體來看,當前計算服務、超級計算中心、人工智能、科學計算等領域是高性能計算的主要用戶,互聯網、大數據尤其是AI領域增長強勁。
第三,國家層面制定了戰略性計算力布局規劃。今年5月,國家發改委等四部門聯合發布《國家綜合大數據中心協同創新體系計算樞紐實施方案》,提出在京津冀、長三角、粵港澳大灣區、成渝、貴州、內蒙古、甘肅、寧夏建設國家計算樞紐節點,啟動實施“東電西算”工程,督促東部數據送西部存儲計算,在西部建立計算節點,改善數字基礎設施布局不均衡問題。
最後,人工智能的計算能力需求成為計算能力發展的主要驅動力。機器學習和深度學習等算法創新,通過物聯網、傳感器、智能手機、智能設備和互聯網技術收集的大數據,以及超級計算機和雲計算組成的超級計算能力,被公認為人工智能時代的“三駕馬車”,* * *掀起了最新壹輪人工智能革命。
在人工智能蓬勃發展的背景下,虛擬化雲計算已經演化為高性能容器雲計算,大數據、並行計算、機器學習的融合創新成為產業發展的最新方向。
此外,在智能計算評測方面,我國提出了包括AIPerf 500在內的多項基準測試方案,是對傳統Linpack測試標準的有力補充。
這些發展表明,超級計算技術對行業的滲透正在加速,我們已經進入了壹個依靠計算能力的人工智能時代,這也是未來發展的必然趨勢之壹。隨著用戶對計算能力需求的不斷增加,計算能力經濟必將在未來社會發展中占據重要地位。
作者吳巖峻(中國科學院軟件研究所研究員)
開源的發展是顯著的,不僅僅是今年。近年來,開源領域發生了許多重要的事情。
比如RISC-V開源指令集及其生態的迅速崛起。這和90年代初Linux的誕生是壹樣的。當時UNIX和Windows是主流,很少有人能預料到今天以Linux為內核的操作系統已經遍布人們的生活。
現在人們日常使用的80%以上的app都運行在以Linux為內核的Android操作系統上,支撐其業務的後端服務器上運行的操作系統也是Linux發行版。
所以今天的RISC-V可能也是被低估了,認為它不成熟,難以與ARM和X86抗衡。但或許在未來,RISC-V會像Linux壹樣,最終成為世界主流的指令集生態,產品覆蓋方方面面。
僅在2020年,RISC-V國際(RVI,RISC-V基金會遷至瑞士後的新名稱)的會員數量就增加了1.33%。事實上,RVI移居瑞士本身也具有重要意義。是開源領域在大國競爭面前保持不“選邊站”初心的經典案例,值得全球其他開源基金會借鑒。
在國內,2019年底,由華為牽頭,中科院軟件所、麒麟軟件參與的openEuler操作系統開源社區正式成立。短短兩年,社區聚集了7000名活躍開發者,完成了8000多個自維護開源軟件包,誕生了10多個廠商的商業分發。
這是中國基礎軟件領域第壹個真正的“根社區”。雖然與擁有20多年歷史的Debian和Fedora還有差距,但已經邁出了重要的壹步。對於學術研究、技術研發、產業創新,終於有了壹個中國主導的、可以長期積累的新平臺。
同時,華為在安卓操作系統GMS(谷歌移動服務)海外供應被切斷後推出了鴻蒙系統操作系統鴻蒙系統,並在開放原子開源基金會下啟動了開源項目OpenHarmony。
目前OpenHarmony已經在短時間內吸引了眾多國內廠商參與,這也反映了國內業界對新壹代萬物互聯操作系統的強烈需求。雖然在生態規模和技術完整性上,它和Android還有差距,但已經邁出了構建自己生態的第壹步。
這相當於為源代碼的合理使用劃定了壹個邊界,即合理使用僅限於接口,壹旦深入到接口的實現代碼,就需要遵守相關的許可。這對開源知識產權的法律界定具有重要的借鑒意義。
今年5月,中國開源發展藍皮書2021發布。不僅系統梳理了我國開源人才、項目、社區、組織、教育、業務現狀,給出發展建議,還為國家政府相關管理部門制定開源政策、布局開源戰略提供參考,為科研院所、科技企業、開源從業者提供更多案例參考和數據支持。
無論是開源軟件正朝著圍繞開放指令集的開源軟硬件生態發展,還是開源有著嚴格的法律邊界約束,抑或是國內龍頭企業正試圖通過開源探索解決“卡脖子”問題,並取得了壹定成效...很多案例都指向壹個方向——開源趨勢不可阻擋。因為它源於人類分享知識、協作創造的天性,也是數字時代人類文明代代相傳的重要模式。
當然,不可否認的是,開源還存在很多問題,比如,開源軟件供應鏈的安全問題。這裏的安全不僅有傳統意義上的軟件質量和安全漏洞的問題,還有開源軟件無法持續有效維護的問題(比如HeartBleed出現問題時OpenSSL只有兩個兼職維護人員,log4j出現問題時只有三個兼職維護人員),還有大國競爭導致的“供應失效”的問題(比如GitHub曾經限制伊朗開發者的準入)。
隨著開源軟件向GitHub等商業平臺集中,這個問題會更加突出,甚至成為壹大風險。開源軟件這壹本應屬於全人類的智力資產,卻可能成為實施“長臂管轄”的利器為了避免這壹問題,開源代碼托管平臺、開源軟件建設與發布平臺等公共基礎設施需要“去中心化”。這個世界需要多個開源軟件基礎設施,最大程度上消除政治勢力對開源社區的威脅。
對於中國來說,隨著開源軟件成為科研、產業等諸多重大基礎設施的重要支撐部分,開源軟件本身也應該具備代碼托管、編譯、構建、測試、發布、運維等功能的基礎設施,以保證開源軟件供給的安全性和連續性,進壹步增強各行各業使用開源軟件的信心。
未來,核心技術創新和開源貢獻將成為國內企業發展的新動力,或將中國開源事業推向又壹個高潮。