中投網2024-05-11 12:11 來源:中投網
中投顧問重磅推出"產業大腦"系列產品,高效賦能產業投資及產業發展各種工作場景,歡迎試用體驗! | ||||
---|---|---|---|---|
產品 | 核心功能定位 | 登陸使用 | 試用申請 | |
產業投資大腦 | 新興產業投資機會的高效挖掘工具 | 登陸 > | 申請 > | |
產業招商大腦 | 大數據精準招商專業平臺 | 登陸 > | 申請 > | |
產業研究大腦 | 產業研究工作的一站式解決方案 | 登陸 > | 申請 > |
聯系電話: 400 008 0586; 0755-82571568
微信掃碼:
1.1.1 2024-2028年中國數據治理行業影響因素分析
一、有利因素
(一)國家政策支持
2023年2月27日中共中央、國務院印發《數字中國建設整體布局規劃》。《規劃》指出,要優化數字化發展環境,建設公平規范的數字治理生態。構建技術標準體系,編制數字化標準工作指南,加快制定修訂各行業數字化轉型、產業交叉融合發展等應用標準。提升治理水平,健全網絡綜合治理體系,提升全方位多維度綜合治理能力。
2023年8月21日,財政部印發《企業數據資源相關會計處理暫行規定》,自2024年1月1日起施行。《暫行規定》提到,“數據入表”將規范企業數據資源相關會計處理,強化相關會計信息披露,服務數字經濟治理體系建設。
2023年12月15日,國家數據局印發《“數據要素×”三年行動計劃(2024-2026年)》。《行動計劃》提出,要加強數據安全保障,落實數據安全法規制度,建立健全數據安全治理體系,完善數據分類分級保護制度,加強個人信息保護,提升數據安全保障水平。培育數據安全服務,鼓勵有實力的數據安全企業,發揮能力優勢,開展基于云端的安全服務,有效提升數據安全水平。
(二)數據治理與AI應用融合
數據規模的指數級增長給數據治理工作帶來巨大壓力,傳統人工方式做數據的清洗、分辨與調優使治理工作耗時冗長,帶來高昂的人力成本,且愈發難以滿足智能應用對數據在規模量與質量的高要求,傳統的人工數據治理工作已變得捉襟見肘。如今,人工智能和RPA等技術手段已被逐漸應用于數據治理的模型管理、質量管理、資產管理、元數據管理等模塊,最終實現數據系統的“自治與自我進化”。受數據平臺服務、數據治理服務和AI應用建設的需求推動影響,面向人工智能的數據治理市場規模將持續上升,從發展進程來看,中國數據治理與面向人工智能的數據治理市場規模增長均處于良性區間,共同鞏固相關治理產業生態圈的向好形勢。
(三)國家數據局成立推動數據治理行業發展
在數字化的大潮中,數據不僅是溝通世界的語言,也是推動未來發展的引擎。2023年10月25日,隨著國家數據局的成立,中國在全球數據治理舞臺上邁出了決定性的一步。國家數據局的成立不僅是國家對數據治理重要性的認可,更是對數據管理專業人才能力的高標準要求。在如今信息爆炸的時代,數據不僅要采集,更要合規地管理和智能地運用。隨著國家數據局的成立,未來我國數字經濟的藍圖日益清晰,數據管理與治理已成為企業和個人不可忽視的關鍵技能,數據管理與治理人員將掌握一系列關鍵技能,進一步符合目前數字化時代的治理要求。(四)基于區塊鏈實現數據治理
區塊鏈本質上是一種去中心化的分布式數據庫,在增加大數據價值實現過程的透明性方面具有天然的優勢,為解決當前數據治理的關鍵問題提供了可行性。
1、支持審計的數據存儲和處理
數據決策滲透在人們生產、生活的方方面面,由于涉及多方利益相關者,數據在存儲、處理和共享流通等過程中存在數據被篡改、數據偽造,以及不同來源數據的類型和標準規則差異等問題,這些問題都會影響決策數據質量。所以,數據使用者需要對決策數據進行審計。區塊鏈作為去中心化的分布式數據庫,可以實現支持審計的數據存儲和處理。此外,基于區塊鏈在不同利益主體之間構建去中心分布式數據庫系統,數據通過全網快速廣播至各個利益主體,也能夠保證數據共享流通的真實性和及時性。
2、支持驗證的分布式數據統計分析和機器學習
在醫學研究、公共安全和商業合作等一些應用領域,需要在大規模分布式數據集上執行統計分析和機器學習任務,但考慮法律法規等因素的限制,需要在不泄露隱私數據前提下進行分布式數據統計分析和機器學習。
基于區塊鏈實現可驗證的分布式數據集統計分析常包括數據提供者、多個計算節點、多個驗證節點和數據查詢者。其中,數據提供者提供加密數據,多個結算節點執行密文計算,由區塊鏈組成多個驗證節點并對計算節點的計算進行驗證。除此之外,分布式數據集統計分析需要考慮數據機密性、數據提供者和數據之間不可連接性、查詢結果機密性和計算結果的魯棒性等安全和隱私問題。為此通常采用洗牌和同態加密等技術進行保護。
基于區塊鏈實現可驗證的和公平的分布式機器學習,數據提供者將本地機器學習參數上傳和存儲至區塊鏈,由區塊鏈執行交叉驗證,將分布式機器學習過程的每一步都記錄在區塊鏈。同時,還可以結合零知識證明和密碼學承諾對惡意的參與方進行經濟懲罰,通過經濟激勵促進公平。除此以外,分布式機器學習需要考慮數據提供者本地參數的安全性,因為本地參數也可能會泄露數據或者機器學習模型。為此通常采用差分隱私、秘密共享和同態加密等技術對其進行保護。
二、不利因素
(一)國內數據安全面臨挑戰
1、數據販賣嚴重侵害個人隱私
目前,數據販賣已成為大數據產業的灰色地帶,個人信息倒賣黑市猖獗,對個人人身、財產、生命安全造成了極大危害。一是外部攻擊者利用爬蟲等技術竊取并倒賣個人數據;二是“內鬼”常成為非法數據交易鏈源頭;三是平臺之間實施暗箱操作,通過數據兜售進行數據商業變現。
2、數據跨境流動帶來國家安全隱患
在大國博弈持續加劇的今天,數據作為國家重要的生產要素和戰略資源,其日益頻繁的跨境流動帶來了潛在的國家安全隱患。一是流轉到境外的情報數據更易被外國政府獲取;二是我國戰略動作易被預測,陷入政策被動;三是我國以數據為驅動的新興技術領域競爭優勢將被削弱。
3、高價值特殊敏感數據泄露風險加劇
近些年,除電子商務、社交等領域的用戶數據發生大規模泄漏之外,政務、醫療及生物識別信息等高價值特殊敏感數據,逐漸成為了數據泄露的重災區。一是政務數據具有極高的社會和經濟價值,黑客將其作為攻擊目標可獲得更高的利益回報;二是健康醫療數據具有高度隱私性和稀缺性,成為攻擊者的關注重點;三是生物識別數據具有易采集和特征敏感性,成為攻擊者的主要目標。
4、重要數據安全面臨外來攻擊威脅加大
具有政治背景的境外黑客逐漸加大對我國關鍵信息基礎設施攻擊力度,試圖獲取我國機密重要數據。
5、新技術新應用催生新型數據安全風險
新技術新應用在極大促進生產力發展和人民生活便利同時,也帶來了安全方面的不確定性。
6、互聯網平臺企業濫采濫用個人信息并實施數據壟斷
當前,由于互聯網平臺企業的業務大都由數據驅動,商業推廣、精準營銷、產品迭代等均依賴對數據的海量收集和開發利用,數據成為了平臺企業發展和盈利的核心引擎。基于數據收集使用創新商業營收模式,實現利益最大化,成為了各個平臺企業追逐的商業目標,由此也引發了個人信息濫采濫用程度加重、數據壟斷亂象頻發的數據安全風險。
(二)數據治理面臨三大現實挑戰
數據作為數字時代基礎性戰略資源,是區別于以往工業時代、農業時代最重要的生產要素。國家在大數據產業發展方面出臺了相關規劃和工作部署,各部門各地方也做了大量有益探索并取得了顯著成效。伴隨產業發展,數據治理也被提上日程,由于數據具有虛擬屬性等特性,治理面臨三大挑戰:
一是產權難界定。產權對于數據流通、交易、再利用等全生命周期至關重要,而數據作為無形生產要素既具有虛擬屬性又涉及多主體,與傳統有形生產要素有明顯差別,其涉及的所有權、使用權等隨場景變化而動態變化,加大了產權構建的難度。
二是邊界難厘清。數據不同于傳統的物品,只有流通起來才能產生價值。實踐中數據需要通過流動匯聚發揮作用,其在發揮作用的過程中通常需要跨越行政部門的職能邊界,難以完全沿用傳統部門分業監管的職責劃分來管理。
三是權益難平衡。數據治理至少要涉及國家、企業、個體等不同主體,涉及安全、產業發展和隱私保護、跨境流動等多方面訴求。在實際數據流通中,各種權益隨場景變化并相互嵌套,往往你中有我、我中有你,處理不當可能造成顧此失彼。因此需明確戰略優先,統籌平衡,兼顧眼前與長遠。
(三)數據管理不完善
(四)企業數據治理缺乏有效抓手,數據治理工作很難推進
數據量的急劇膨脹通常會導致系統中的數據質量變差的問題,也因此會給數據存儲、處理和分析各環節的性能和使用效率帶來很大挑戰。此時,企業需要通過開展數據治理工作來提高數據質量。然而,在企業的實踐中,數據治理工作經常會半途而廢,其中最核心的原因在于,數據治理工作往往非常繁雜和耗時,當企業缺乏有效的抓手去開展數據治理工作時,將很難產生直接的成果和效益,到了后期也就無法繼續推進。
2022年,我國數據治理行業市場規模為133億元;2023年,我國數據治理行業市場規模約達到162億元。
我們預計,2024年我國數據治理行業市場規模將達到198億元,未來五年(2024-2028)年均復合增長率約為14.47%,2028年將達到340億元。
數據來源:中投產業研究院
產業投資與產業發展服務一體化解決方案專家。掃一掃立即關注。
多維度的產業研究和分析,把握未來發展機會。掃碼關注,獲取前沿行業報告。