把握規(guī)律搶抓人工智能發(fā)展機遇
- 作者:韋一茜
- 來源:當代先鋒網
- 發(fā)布時間:2025-03-06 16:52:22
黨的十八大以來,以習近平同志為核心的黨中央把發(fā)展人工智能提升到戰(zhàn)略高度。早在2018年,中共中央政治局第九次集體學習時,習近平總書記強調,我國經濟已由高速增長階段轉向高質量發(fā)展階段,正處在轉變發(fā)展方式、優(yōu)化經濟結構、轉換增長動力的攻關期,迫切需要新一代人工智能等重大創(chuàng)新添薪續(xù)力。這一重要論斷為我國發(fā)展人工智能提供了行動指南和根本遵循。
近年來,全國各省、自治區(qū)、直轄市紛紛搶抓人工智能特別是大模型發(fā)展機遇,結合自身優(yōu)勢謀篇布局。對貴州來說,發(fā)展人工智能大模型,是貫通算力、賦能、產業(yè)三個關鍵的“牛鼻子”工作,必須抓住機遇、全力推進,這已經不是選答題,而是必答題。
人工智能概念1956年在達特茅斯會議上被提出,經歷三個發(fā)展階段?!皩<蚁到y(tǒng)”階段,深藍機器人1997年在圍棋大賽中戰(zhàn)勝人類頂級高手?!靶∧P汀彪A段,2009年,華裔科學家李飛飛推動圖像識別技術發(fā)展,首次讓機器視覺識別圖像超越了人類?!按竽P汀彪A段,通過海量數據預訓練超大規(guī)模參數的大模型,模型參數規(guī)模從千億級發(fā)展到萬億級乃至十萬億級,從專用走向通用,其中標志性的事件就是ChatGPT的出現。
大模型發(fā)展的特點:通用大模型、行業(yè)大模型并重發(fā)展
通用大模型L0。是指可以在多個領域和任務上通用的大模型,主要依托巨量參數的深度學習算法,利用大算力在大規(guī)模無標注數據上進行訓練,形成“舉一反三”的強大泛化處理能力,相當于Al完成了“通識教育”,其特點是通識能力強、行業(yè)能力不足。包括近期火熱的DeepSeek,以及華為“盤古”、百度“文心一言”、阿里“通義千問”、騰訊“混元”、字節(jié)“豆包”等,都是通用大模型。在DeepSeek出現前,通用大模型一般都需要巨額資金和頂尖人才的持續(xù)投入。
行業(yè)大模型L1。是基于通用基礎大模型,結合垂直行業(yè)數據針對特定行業(yè)或領域的大模型。通常使用行業(yè)相關的數據,針對通用基礎大模型進行預訓練或微調,提高在該領域的性能和準確度,相當于培養(yǎng)AI成為“行業(yè)專家”。
目前,全國已備案的行業(yè)大模型數量超過400個,如中國石油集團油氣領域昆侖大模型、國家石油天然氣管網集團管網大模型、南方電網集團面向電力行業(yè)的大瓦特模型、中國工商銀行金融行業(yè)大模型、360AI全科醫(yī)生大模型等。行業(yè)大模型建設投入相對較小,有實際項目案例可借鑒,商業(yè)模式比較清晰,應當作為貴州的重點發(fā)展方向。
在白云區(qū)吉利發(fā)動機生產企業(yè)生產車間,自動運輸機器人在運輸組裝汽車發(fā)動機零部件(圖片來源:貴州圖片庫)
人工智能大模型三大核心要素:算力、語料、算法
算力是人工智能大模型發(fā)展的“心臟”。就像工業(yè)時代的電力,未來可能直接決定一個國家和地區(qū)的經濟社會發(fā)展能力。當前全球人工智能芯片市場,英偉達市場份額達到90%,微軟、谷歌、亞馬遜、Meta等巨頭也在加速布局。國內芯片廠商主要有華為、百度、寒武紀等,2023年自主研發(fā)芯片已經占據國內市場35%的份額,比2022年增長一倍還多,在全球市場的競爭力逐步增強。目前貴州總算力規(guī)模超過63Eflops,其中智算占比超90%,國產化部分超90%,區(qū)域集聚度超90%,2025年總算力規(guī)模預計將飛躍至150Eflops。目前,算力發(fā)展存在三方面挑戰(zhàn):一是智算產業(yè)本身的成熟度和生態(tài)建設需要時間;二是國產芯片從單位算力等角度看,成本和價格處于劣勢;三是一定程度存在無序競爭。貴州需要持之以恒把發(fā)展智算產業(yè)、培育智算生態(tài)作為戰(zhàn)略方向抓下去,堅定不移打造“貴州算力”品牌。
語料是人工智能大模型發(fā)展的“血液”??晒┐竽P陀柧毻评硎褂玫募庸ぬ幚磉^的數據稱為語料。所謂“讀萬卷書、行萬里路”,語料是構建和訓練大模型的基礎資源,其質量直接影響大模型的性能。目前,我省從企業(yè)數據看,相當部分的企業(yè)沒有生產管理流程的線上數據,或只有零散數據但未進行數據歸集。從公共數據看,醫(yī)療、教育、供水、供電、燃氣等具有極大價值的公共數據分散各處,數據統(tǒng)籌匯集難、交易流通難等問題依然存在。從政務數據看,有的單位對數據下場仍然“不敢、不愿、不會”。需要從數據源頭推動,引導鼓勵企業(yè)加快數字化轉型,細化統(tǒng)一行業(yè)數據采集標準,堅持授權運營模式,推動公共數據“應開放盡開放”,牽引帶動社會數據匯聚。
算法是人工智能大模型發(fā)展的“大腦”。常見的深度學習算法有Transformer、卷積神經網絡(CNN)、循環(huán)神經網絡(RNN)等,同時在行業(yè)大模型構建中,由軟件解決方案服務商根據行業(yè)甚至場景的不同特點和需求,對通用算法和建模進行調優(yōu),使之更加輕量化、專業(yè)化、個性化,突破通用算法在行業(yè)具體應用上的一些瓶頸。貴州軟件產業(yè)規(guī)模小、經營主體少,好的軟件解決方案服務商更是稀缺,需要突出補鏈強鏈,加速培育數字產業(yè)生態(tài)。
機器人正在對變電站設備進行巡檢(圖片來源:貴州圖片庫)
行業(yè)大模型四大特征:聚焦解決行業(yè)難題
行業(yè)或企業(yè)本身的數字化是行業(yè)大模型發(fā)展的前提基礎。數字化—網絡化—智能化是逐步積累、逐項遞進的過程,沒有數字化、網絡化的基礎,不可能飛躍到智能化。大模型是智能化階段的典型特征,大模型的質量,直接取決于數據集的質量,取決于各行業(yè)、各企業(yè)主體本身數字化的水平。對網絡化、數字化本身基礎比較差的,需要逐步推動改造升級,否則發(fā)展大模型是空談;對基礎比較好的,要重點支持構建高質量數據集,優(yōu)先開展行業(yè)大模型應用。
“小切口、大場景”是行業(yè)大模型發(fā)展的關鍵。發(fā)展行業(yè)大模型一定要突出需求導向,從“小切口”入手,滿足具體的需求,解決具體的問題。例如,貴州電網基于“大瓦特”大模型,從電力系統(tǒng)的無人機巡檢缺陷圖片識別切入,通過提升算力、優(yōu)化算法不斷提升識別準確率、縮短識別時間,目前每分鐘能夠處理100張圖片,準確識別20類缺陷,效率是過去的10倍。
“嵌入式”“伴隨式”是行業(yè)大模型發(fā)揮作用的主要方式。“嵌入式”是指將大模型以特定方式集成到其他系統(tǒng)或產品中,“伴隨式”是指大模型以一種類似于陪伴或助手的角色與用戶任務執(zhí)行相伴隨。絕大多數行業(yè)大模型均采用這兩種模式,而不是另起爐灶,單獨建設一套系統(tǒng)平臺。例如,貴州旅游數智互聯(lián)平臺通過大模型嵌入,實現自動生成旅游宣傳視頻,大大降低了成本、提升了效率。
軟件解決方案服務商是行業(yè)大模型發(fā)展的重要抓手。好的大模型應用需要業(yè)主方和軟件解決方案服務商雙方通力配合完成。從業(yè)主方角度,要規(guī)劃并把握好大模型建設的定位、目標和預算等,幫助軟件解決方案服務商深度梳理自身的業(yè)務流程和需求、痛點。從軟件解決方案服務商角度,要承接大模型的具體建設開發(fā),負責數據的歸集治理形成高質量數據集,通過專業(yè)服務、場景定制化開發(fā)等,確保落地的模型滿足實際的應用場景。例如,貴州能源集團與華為基于文家壩煤礦建設礦山大模型,為瓦斯?jié)舛葧r序預測、瓦斯突出異常分析等模型開發(fā)設計提供了行業(yè)經驗。
下一步,貴州將深入貫徹落實《貴州省推動人工智能高質量發(fā)展行動方案(2025—2027年)》《貴州省促進行業(yè)大模型發(fā)展行動方案》部署,搶抓機遇、擁抱創(chuàng)新、發(fā)揮優(yōu)勢、練強內功,堅持算力、數據、應用、產業(yè)聯(lián)動,全力打造全國數據產業(yè)集聚區(qū),建設全國算力高地、數據高地,推動治理數字化轉型、生活數字化轉型、產業(yè)數字化轉型。
在貴陽市婦幼保健院南明分院,諾亞物流機器人正在進行藥品的配送(圖片來源:貴州圖片庫)
(朱宗堯,貴州省大數據發(fā)展管理局黨組書記、局長,省政府副秘書長(兼))
策劃制作 韋一茜
編輯 徐吉歐 秦文競 王瑤
二審 張瑩 楊春凌 王塬鈞
三審 陳翔
-
【高質量發(fā)展調研行】從籃球熱到稻花香,來看“村BA”后花園的豐收故事
水車不斷轉動,蟬鳴伴隨著濃郁的稻香宣告著秋天谷物的豐收。臺江縣臺盤鄉(xiāng)陽芳村,因緊鄰“村BA”發(fā)源地臺盤村,其依山傍水、景色宜人的環(huán)境特點,被譽為“村BA”的后花園。
-
促進實現更加充分更高質量就業(yè)|貴州建設省內外服務“一張網”
今年以來,貴州堅持就業(yè)優(yōu)先戰(zhàn)略,實施“六六就業(yè)穩(wěn)崗計劃”,強化省外省內就業(yè)服務“一張網”建設。
-
貴州省首個集中供熱項目取得關鍵突破!主廠區(qū)建設正式啟動
開陽熱電聯(lián)產及配套項目是貴州省興建的第一個集中供熱項目,是為開陽工業(yè)園配套建設的省重點工程項目。