隨著人工智能的快速發展,大模型技術已成為當今人工智能領域的熱門話題。2022年底以來,認知大模型掀起通用人工智能的全新熱潮,其歷史意義被認為“不亞于PC和互聯網的誕生”。2024年12月底,深度求索公司先后發布DeepSeek V3和DeepSeekR1大模型,并快速“出圈”,提升了我國在全球人工智能領域的影響力,引發國內外廣泛關注,在全球范圍掀起又一輪大模型發展浪潮。鑒于此,梳理大模型技術的進展和產業發展現狀,剖析其面臨的困難挑戰以及未來發展趨勢,并找到針對性的對策,有助于我們全面深入地掌握大模型這一前沿領域,加快推動我國大模型技術與產業的發展邁上新臺階。
大模型技術及產業發展現狀
2017年,Google提出Transformer架構,成為大模型領域主流算法基礎。次年,OpenAI發布GPT-1、Google推出BERT,預訓練大模型由此成為自然語言處理主流。此后,AI大模型技術不斷突破。2020年起,OpenAI陸續推出GPT-3、GPT-3.5、GPT-4,AI能力多輪提升。至2024年,全球大模型井噴式發展。OpenAI發布的文生視頻Sora模型,推動大模型技術向語音、視覺等多模態及學科交叉方向拓展;隨后推出的GPT-4o能夠實時處理多類型信息,顯著提升了人機對話響應速度;發布的o1-Preview大模型則大幅提高了復雜推理能力。同年末,又推出了o1pro、o3等新一代推理大模型,向通用人工智能進一步邁進。在國內,眾多公司以及高校和科研機構均加大投入,發布眾多通用大模型,形成了“百花齊放”的景象。例如,百度的“文心一言”、阿里的“通義千問”、字節跳動的“豆包”以及科大訊飛的“訊飛星火”,特別是深度求索公司發布的DeepSeekV3和DeepSeekR1大模型,通過打破傳統的“算力競賽”規則并完全開源,成為國內的一個里程碑事件。
在產業應用方面,國外微軟、谷歌等大廠積極探索企業級服務商業化路徑,加快產業落地。微軟先后把ChatGPT/GPT-4能力融入Bing搜索引擎、Office全家桶、Azure云服務和Teams程序等,推出Microsoft 365Co-pilot,顯著提升Office生產力與交互體驗。OpenAI借助插件接入互聯網,能調用各類APP、解決復雜任務,甚至被美國國防部、NASA等政府機構用于情報分析、軍事戰略規劃等領域。隨著我國新基建、新經濟推進,眾多團隊加速大模型場景創新應用。如在教育領域,大模型賦能智慧課堂、個性化學習等,助力教育公平與教學質量提升;在醫療領域,大模型全方位提升“醫、教、研、管”各環節診療水平。此外,在金融、工業、政府、科研、電商、文旅、司法等其他領域,大模型也得到廣泛應用,為各行業發展注入新的動力。通過融合Deep-Seek等深度搜索技術的優勢,國內團隊也在不斷探索如何進一步提升大模型在特定應用場景下的信息檢索與處理能力,以滿足更加復雜多樣的用戶需求。
面臨的困難和挑戰
盡管大模型技術及其產業生態已取得階段性顯著成果,但其發展之路仍布滿復雜且亟待解決的難題與挑戰。
國產大模型的創新升級在較大程度上依賴于國外的先進算力。當前國產算力軟件系統的生態還不成熟,每一次大模型算法創新,都需要額外投入數月的時間來進行大量的國產適配移植和效率優化工作。此外,國產大模型訓練高度依賴進口算力,除個別模型外,多數可下載的大模型均基于英偉達卡訓練。考慮到未來我國獲取英偉達先進制程算力資源的渠道可能會進一步受限,若不能盡快解決國產自主可控人工智能產業生態薄弱、適配困難等問題,我們或將面臨“在他國基石上構筑高樓”的困境。
國產大模型在落地應用生態方面缺乏成熟有效的工具鏈體系支持。盡管國家已出臺多項政策措施,鼓勵和支持基于國產硬件開展大模型的落地應用,但大模型在實際行業應用中需要語言、語音及多模態等多個大模型的組合創新,同時還需要針對行業/私域知識和特定場景任務進行定制優化,這迫切需要成熟、高效且易用的工具鏈體系來支撐。然而,當前國產落地工具鏈體系的缺失和不足,正嚴重制約大模型在行業中的廣泛、快速應用,以及創新創業生態的構建和發展。
人工智能生成的虛假信息泛濫正在威脅網絡信息安全。在技術機理上,現行人工智能系統主要依托深度神經網絡架構進行統計建模,這種數據驅動范式導致模型存在知識記憶模糊、幻覺等問題。以OpenAI發布的GPT-4.5為例,雖將幻覺發生率較GPT-4o降低40%,但在SimpleQA基準測試中仍高達37.1%。隨著具備長思維鏈的推理模型用戶增多,由于推理模型在生成內容邏輯自洽性、結構嚴謹性方面的優勢,幻覺數據會變得更具迷惑性和欺騙性。普通民眾對AI技術了解不足,極易將算法輸出的幻覺數據誤判為真實可信信息。更嚴峻的是,這些帶算法偏差的虛假信息會被迭代訓練的新一代AI系統重新學習,并通過搜索引擎等渠道指數級擴散,最終形成“數據污染—算法吸收—再污染”的惡性循環。
通用大模型技術的發展趨勢及應對策略
當前大模型性能的上限天花板在不斷地被抬高,大模型訓練和推理的成本也實現了成倍的降低,預示著大模型的賦能價值和產業規模都有了更大的發展空間。面對上述困難和挑戰,我們需時刻保持敬畏之心,緊跟大模型發展趨勢,盡快實現我國大模型核心技術突破,全方位推動大模型落地。
一是加大并保持對通用大模型底座“主戰場”的持續投入。我國通用人工智能戰略的實施,可以圍繞以下幾個核心目標展開。其一,確保以中英文為代表的通用底座大模型能力持續追趕并努力對標國際最高水平;其二,在示范行業應用的效果和落地價值形成趕超優勢;其三,加大多語種大模型的研發力度,積極在海外布局大模型推廣,為世界提供多樣化的選擇。對此,可以采取以下措施:建立全國性的計算資源共享及調度平臺,統籌調配算力資源,并加快制定算力資源的合理分配、獲取、使用和監管政策。支持開展創新算法及核心技術研究,探索大模型高效并行訓練技術,以及邏輯和知識推理、指令學習、人類意圖對齊等調優方法。深入研究基于增量預訓練的行業大模型訓練技術、多源異構行業知識檢索等關鍵技術,并結合教育、醫療、金融、司法等應用場景,設計適合特定垂直領域的算法架構。
二是加快構建國產算力平臺上的自主可控大模型及產業生態。近期,DeepSeek的推出引發了國際社會對我國人工智能發展的高度關注,未來可能會面臨對人工智能芯片、存儲、計算架構等技術要素的更嚴格限制,國產自主可控比以往任何時候都更加迫切。為此,我們要鼓勵基于自主可控國產算力平臺的大模型研發和應用,加速基于國產算力的大模型算法創新。鼓勵國有企業尤其是央企優先采購基于國產算力平臺研發的全棧自主可控大模型。加快推進面向教育、醫療、工業、科研等領域的國家人工智能行業應用基地建設,推動國產大模型在各基地落地應用,持續形成迭代“數據飛輪”。鼓勵依托自主可控算力底座建立的大模型開發者生態發展和開源社區建設,通過專項支持加快形成國產大模型生態體系和工具鏈,加速我國自主可控人工智能產業生態發展。支持全國產化大模型“線上”開放平臺建設,推動國產化大模型能力和工具開放共享,降低中小企業國產化開發門檻。
三是構建預防大模型幻覺數據泛濫的專項治理體系?;糜X數據不僅影響AI行業的深度應用,更危及互聯網和數字經濟時代的社會安全。為此,應建立針對不同可信度和危害程度的數據標簽體系,搭建分層分類的數據信息可信等級認證與溯源體系,為公眾提供安全可靠的信息和知識來源。定期清理幻覺數據,及時澄清重大事件真相,降低輿情風險和社會危害。推動國家級高質量訓練數據的開放和共享,為AI模型訓練提供優質的數據集和知識檢索增強信源。重點攻克深度推理模型的長思維鏈幻覺治理難題,確保思考推理過程及結果的可信可溯源,特別是在教育、醫療、安全等高敏感行業,研發專業思維鏈融合和行業知識數據增強等技術。同時,組織研發AIGC幻覺治理與數據安全防護技術及平臺,突破幻覺自動分析、AIGC深度鑒偽、虛假信息檢測、有害內容識別以及互聯網傳播溯源等關鍵技術。此外,構建公眾可用的AIGC幻覺信息檢測工具與服務平臺。
四是加快出臺更加客觀、公正、可信的評測方法。目前業界大模型缺乏有公信力、標準化的科學方法評測體系,構建和制定全面、科學、權威的大模型質量評測體系,規范評測亂象,對牽引和推動行業應用更良性發展具有重要意義。因此,要加快構建涵蓋文本生成、語言理解、知識問答、邏輯推理等多維能力的認知大模型測評體系。聯合國家級權威機構和行業龍頭企業等組織,共同發布具有公信力的行業大模型評測標準和應用指南,指導各行業甄別和選型大模型??茖W認識大模型能力的邊界,以更少的算力、更高的效率打造專屬模型和專屬應用。支持大模型朝通專結合的方向發展,強化云邊端一體化+軟硬件一體化,用更小的算力作出相對更優的效果。
五是堅持源頭核心技術系統性創新,在戰略性、前瞻性的基礎研究領域做好布局。重點布局大模型的寬基礎研究,力求在大模型能力涌現機理、可信訓練推理、強化學習技術、自主學習技術等方面形成突破。加強腦科學與類腦智能、量子計算等領域與人工智能關鍵研究的協同攻關,形成交叉學科的突破性研究。促進通用人工智能和各科學領域的交叉融合,打造AI for Science的科研新范式,研究基于科學數據的AI建模和科學知識提取技術,助力科研人員更高效地進行科學研究和探索。在生命科學、化學、制藥、物理、材料等多個科研領域,引入人工智能通識課,培養一批具備專業科研能力和高水平通用人工智能理解能力的人才,為可能涌現的交叉學科重大突破作儲備。
六是加速通用人工智能技術相關的法律法規制定與審議。全世界都在呼吁人工智能技術的設計、開發、應用要以維護人類安全、隱私、利益為初衷,但現行法律法規在面對人工智能技術引發的倫理等問題時,往往難以對法律責任進行合理評判。大模型的可信度、可解釋性是未來發展的重要方向,為此可以從當前人工智能技術應用過程中的人工智能事故責任中劃分出倫理問題、人工智能后臺數據泄露問題、人工智能技術濫用問題、大數據平臺的漏洞問題和著作權保護等細分問題,并著手制定相應的法律法規。鼓勵企業和研究機構開展數據隱私保護技術的研發和應用,提高數據的安全性和隱私性。鼓勵企業創新內容安全審核算法,以更優的人工智能初步篩查構建高效、準確的審核流程體系。
(作者系語音及語言信息處理國家工程研究中心主任、科大訊飛股份有限公司董事長)
