8月14日,國新辦舉行“高質量完成‘十四五’規劃”系列主題新聞發布會,國家數據局有關負責人介紹“十四五”時期數字中國建設發展成就。
國家數據局今年將推出數據產權等10余項制度,并計劃部署一批數據產業集聚區建設試點,年底前將數據流通節點城市擴至50個左右,加速釋放數據要素價值。
同時,上海、天津等地正在試點“數據語料作價入股”新模式,7大標注基地支撐高質量數據集建設,服務人工智能、低空經濟等領域數據應用。
今年將推出數據產權等10多項制度
國家數據局局長劉烈宏指出,“十四五”時期,我國數字基礎設施實現長足發展,數字基礎設施在規模、技術等方面處于世界領先地位。截至2025年6月底,5G基站總數與2020年相比增長了5倍達到455萬個,千兆寬帶用戶增長了34倍達2.26億戶,算力總規模位于全球第二,有力帶動了經濟社會發展。
劉烈宏指出,經過多年持續攻堅,數字領域突破了一批關鍵核心技術。集成電路加快布局,形成覆蓋設計、制造、封裝測試、材料和裝備的完整產業鏈。國產操作系統加速崛起,以鴻蒙系統為例,鴻蒙生態設備總量突破11.9億臺,為手機、汽車、家電等1200多類產品裝上了“智能中樞”。
數據要素價值加快釋放。國家數據局體系化推進數據要素市場化配置改革,打出了一套政策“組合拳”,推動海量數據優勢不斷轉化為國家競爭新優勢。
監測數據顯示,今年上半年,主要數據交易機構新上架數據產品達到3328個,同比增長70%。國家數據局副局長沈竹林表示,今年上半年,上架的高質量數據集產品同比增長2.8倍,這些優質的數據供給帶動提高各行業用數水平,解決了很多痛點問題。比如,某個地方的農商行,充分運用社保等多源數據推出了“社保e貸”普惠金融產品,幫助中小微企業解決貸款融資難題,不良貸款率降到0.28%,自助辦貸最快可以在5分鐘之內完成。
劉烈宏表示,去年推出了公共數據資源開發利用等21項政策,今年還將推出數據產權等10多項制度。
計劃部署一批數據產業集聚區建設試點
近年來,數字產業越來越受到社會各界的關注,培育數據產業成為壯大數字經濟、發展新質生產力的重要環節。劉烈宏指出,產業帶動方面,數字基礎設施投資形成龐大市場需求,帶動集成電路、通信網絡設備、計算機、服務器和終端產品等信息通信技術產業鏈上下游發展,培育了先進的、完整的產業體系。
數據產業規模快速增長。我國數據產業處于快速發展階段,市場空間大,已成為數字經濟發展的新增長點。據國家數據發展研究院研究,2024年,全國數據企業數量超過40萬家,數據產業規模達5.86萬億元,較“十三五”末增長117%,預計未來幾年仍將保持較高的增長水平。
數據要素正加速賦能千行百業發展,農業領域,有的企業利用數據賦能智慧施肥,綜合提升產量5.5%;工業領域有的企業依托海量測井數據開發出行業大模型,鉆井決策效率提升了15倍;服務業領域,有的企業利用公路貨運行業數據實現司機與貨主分鐘級車貨匹配,提升單車運行效率30%以上。數字經濟的蓬勃發展帶動新增超100個新型職業,創造了新的就業機會。
從區域來看,長三角形成了多層次、全鏈條的數據產業生態,資源共享、創新聯動的集聚效應尤為突出,2024年,長三角數據產業規模占全國的22.6%,集聚數據企業超過了10萬家,是我國數據產業的重要增長極。從城市來看,北京、上海、廣州、深圳、杭州等城市,資源要素富集、技術創新活躍、應用場景豐富,吸引大量頭部企業和創新主體,產業生態化集聚趨勢較為明顯。
劉烈宏表示,今年,計劃部署一批數據產業集聚區建設試點,以此為抓手不斷優化產業布局,加快形成產業生態和規模優勢。
年底前數據流通節點城市將擴大到50個左右
數據是重要的生產要素和社會財富,開發利用好數據資源,可以更好地賦能經濟社會高質量發展。國家數據局副局長陳榮輝表示,從全國數據資源統計調查情況來看,2024年我國數據生產量達到41.06澤字節,這相當于1564萬個中國國家圖書館的數據資源總量。
應用場景不斷豐富,從行業看,基于氣象數據開發的產品和服務超過1.4萬個,支撐了近13萬個應用場景。醫保部門通過海量數據分析精準識別欺詐騙保的線索,有力保障了醫保基金的安全。從市場看,服裝企業利用消費數據,開展個性化的設計生產,從設計下單到生產到發貨,最快只需要3—7天,數據驅動的柔性供應鏈模式讓中國制造更具競爭力。
要實現釋放數據價值的目標,規模化流通是關鍵。國家數據局副局長夏冰指出,實現規模化流通的一個重要前提就是在不同行業、不同地域的主體之間建立共識,形成統一的標準和技術架構。
“十四五”期間,我們制定下發了《國家數據基礎設施建設指引》,制定了數據基礎設施參考架構、明確了“三統一”的互聯互通要求,提出了匿名化處理等9項重點技術規范。
夏冰指出,截至目前,我國已經建成包含北上廣深杭等25個城市在內的數據流通節點城市,布局了16個省(區、市)的數據基礎設施架構,并在7月底全面完成互聯互通。預計到今年底,我們的節點城市規模將擴大到50個左右,覆蓋80%的省(區、市),為數據規模化跨域流通奠定設施基礎。
多地試點“數據語料作價入股”等新模式
高質量、大規模數據是推動“人工智能+”深度落地的核心支撐。劉烈宏介紹,2024年初,我國日均Token的消耗量為1千億,截至今年6月底,日均Token消耗量已經突破30萬億,1年半時間增長了300多倍,這反映了我國人工智能應用規模的快速增長。
國家數據局持續推進高質量數據集建設工作。截至今年6月底,我國已經建設高質量數據集超過3.5萬個,總體量超過了400PB。人工智能模型的訓練也推動了數據交易需求的攀升,截至今年6月底,各地高質量數據集累計交易額近40億元,數據交易機構掛牌的高質量數據集總規模達到了246PB。以北京數交所為例,高質量數據集占交易總量的比例從去年的10%躍升到目前的近80%。
上海、天津、安徽等地正在試點“數據語料作價入股”等新模式,引導企業將高質量數據集折算為股權投入到相關企業。高質量數據集的發展需要數據標注產業的支撐,國家數據局已布局了成都、沈陽、合肥等7個數據標注基地,助力高質量數據集的建設。
劉烈宏表示,下一步,將通過體系化布局持續推進高質量數據集建設,加快打造具身智能、低空經濟、生物制造等重點領域數據高地。我們也將推動全社會強化數據要素價值認同,加快推進數據要素價值共創,培育“為優質數據買單”的市場共識。
排版:羅曉霞
校對:王蔚