梅宏院士:大數(shù)據(jù),發(fā)展現(xiàn)狀與未來趨勢
發(fā)布時(shí)間:2019-11-06 瀏覽: 次
十三屆全國人大常委會(huì)第十四次會(huì)議10月26日下午在北京人民大會(huì)堂閉幕。會(huì)后,十三屆全國人大常委會(huì)舉辦專題講座第十四講,題目為《大數(shù)據(jù):發(fā)展現(xiàn)狀與未來趨勢》。
中國科學(xué)院院士、中國人民解放軍軍事科學(xué)院副院長梅宏認(rèn)為,當(dāng)前大數(shù)據(jù)應(yīng)用尚處于初級階段,根據(jù)大數(shù)據(jù)分析預(yù)測未來、指導(dǎo)實(shí)踐的深層次應(yīng)用將成為發(fā)展重點(diǎn)。
他指出,預(yù)計(jì)到2020年,我國數(shù)據(jù)總量有望占全球數(shù)據(jù)總量的21%,但我國核心技術(shù)薄弱,建議以開源為基礎(chǔ)構(gòu)建自主可控的大數(shù)據(jù)產(chǎn)業(yè)生態(tài)。
大數(shù)據(jù)應(yīng)用三個(gè)層次
梅宏指出,按照數(shù)據(jù)開發(fā)應(yīng)用深入程度的不同,可將眾多的大數(shù)據(jù)應(yīng)用分為三個(gè)層次。
第一層,描述性分析應(yīng)用,是指從大數(shù)據(jù)中總結(jié)、抽取相關(guān)的信息和知識,幫助人們分析發(fā)生了什么,并呈現(xiàn)事物的發(fā)展歷程。
如美國的DOMO公司從其企業(yè)客戶的各個(gè)信息系統(tǒng)中抽取、整合數(shù)據(jù),再以統(tǒng)計(jì)圖表等可視化形式,將數(shù)據(jù)蘊(yùn)含的信息推送給不同崗位的業(yè)務(wù)人員和管理者,幫助其更好地了解企業(yè)現(xiàn)狀,進(jìn)而做出判斷和決策。
第二層,預(yù)測性分析應(yīng)用,是指從大數(shù)據(jù)中分析事物之間的關(guān)聯(lián)關(guān)系、發(fā)展模式等,并據(jù)此對事物發(fā)展的趨勢進(jìn)行預(yù)測。
如微軟公司紐約研究院研究員David Rothschild通過收集和分析賭博市場、好萊塢證券交易所、社交媒體用戶發(fā)布的帖子等大量公開數(shù)據(jù),建立預(yù)測模型,對多屆奧斯卡獎(jiǎng)項(xiàng)的歸屬進(jìn)行預(yù)測。2014和2015年,均準(zhǔn)確預(yù)測了奧斯卡共24個(gè)獎(jiǎng)項(xiàng)中的21個(gè),準(zhǔn)確率達(dá)87.5%。
第三層,指導(dǎo)性分析應(yīng)用,是指在前兩個(gè)層次的基礎(chǔ)上,分析不同決策將導(dǎo)致的后果,并對決策進(jìn)行指導(dǎo)和優(yōu)化。
如無人駕駛汽車分析高精度地圖數(shù)據(jù)和海量的激光雷達(dá)、攝像頭等傳感器的實(shí)時(shí)感知數(shù)據(jù),對車輛不同駕駛行為的后果進(jìn)行預(yù)判,并據(jù)此指導(dǎo)車輛的自動(dòng)駕駛。
自動(dòng)駕駛有效應(yīng)用面臨挑戰(zhàn)
梅宏認(rèn)為,當(dāng)前,在大數(shù)據(jù)應(yīng)用的實(shí)踐中,描述性、預(yù)測性分析應(yīng)用多,決策指導(dǎo)性等更深層次分析應(yīng)用偏少。
一般而言,人們做出決策的流程通常包括:認(rèn)知現(xiàn)狀、預(yù)測未來和選擇策略這三個(gè)基本步驟。這些步驟也對應(yīng)了上述大數(shù)據(jù)分析應(yīng)用的三個(gè)不同類型。
不同類型的應(yīng)用意味著人類和計(jì)算機(jī)在決策流程中不同的分工和協(xié)作。例如:第一層次的描述性分析中,計(jì)算機(jī)僅負(fù)責(zé)將與現(xiàn)狀相關(guān)的信息和知識展現(xiàn)給人類專家,而對未來態(tài)勢的判斷及對最優(yōu)策略的選擇仍然由人類專家完成。應(yīng)用層次越深,計(jì)算機(jī)承擔(dān)的任務(wù)越多、越復(fù)雜,效率提升也越大,價(jià)值也越大。
然而,隨著研究應(yīng)用的不斷深入,人們逐漸意識到前期在大數(shù)據(jù)分析應(yīng)用中大放異彩的深度神經(jīng)網(wǎng)絡(luò)尚存在基礎(chǔ)理論不完善、模型不具可解釋性、魯棒性較差等問題。
因此,雖然應(yīng)用層次最深的決策指導(dǎo)性應(yīng)用,當(dāng)前已在人機(jī)博弈等非關(guān)鍵性領(lǐng)域取得較好應(yīng)用效果,但是,在自動(dòng)駕駛、政府決策、軍事指揮、醫(yī)療健康等應(yīng)用價(jià)值更高,且與人類生命、財(cái)產(chǎn)、發(fā)展和安全緊密關(guān)聯(lián)的領(lǐng)域,要真正獲得有效應(yīng)用,仍面臨一系列待解決的重大基礎(chǔ)理論和核心技術(shù)挑戰(zhàn)。
梅宏指出,在此之前,人們還不敢、也不能放手將更多的任務(wù)交由計(jì)算機(jī)大數(shù)據(jù)分析系統(tǒng)來完成。這也意味著,雖然已有很多成功的大數(shù)據(jù)應(yīng)用案例,但還遠(yuǎn)未達(dá)到我們的預(yù)期,大數(shù)據(jù)應(yīng)用仍處于初級階段。
未來,隨著應(yīng)用領(lǐng)域的拓展、技術(shù)的提升、數(shù)據(jù)共享開放機(jī)制的完善,以及產(chǎn)業(yè)生態(tài)的成熟,具有更大潛在價(jià)值的預(yù)測性和指導(dǎo)性應(yīng)用將是發(fā)展的重點(diǎn)。
工業(yè)互聯(lián)網(wǎng)政府熱、企業(yè)冷
作為人口大國和制造大國,我國數(shù)據(jù)產(chǎn)生能力巨大,大數(shù)據(jù)資源極為豐富。
梅宏指出,預(yù)計(jì)到2020年,我國數(shù)據(jù)總量有望達(dá)到8000EB(1018),占全球數(shù)據(jù)總量的21%,將成為名列前茅的數(shù)據(jù)資源大國和全球數(shù)據(jù)中心。
然而,我們也必須清醒地認(rèn)識到我國在大數(shù)據(jù)方面仍存在一系列亟待補(bǔ)上的短板。
其中較為突出的是核心技術(shù)薄弱,基礎(chǔ)理論與核心技術(shù)的落后導(dǎo)致我國信息技術(shù)長期存在“空心化”和“低端化”問題,大數(shù)據(jù)時(shí)代需避免此問題在新一輪發(fā)展中再次出現(xiàn)。
近年來,我國在大數(shù)據(jù)應(yīng)用領(lǐng)域取得較大進(jìn)展,但是基礎(chǔ)理論、核心器件和算法、軟件等層面,較之美國等技術(shù)發(fā)達(dá)國家仍明顯落后。
在大數(shù)據(jù)管理、處理系統(tǒng)與工具方面,我國主要依賴國外開源社區(qū)的開源軟件,然而,由于我國對國際開源社區(qū)的影響力較弱,導(dǎo)致對大數(shù)據(jù)技術(shù)生態(tài)缺乏自主可控能力,成為制約我國大數(shù)據(jù)產(chǎn)業(yè)發(fā)展和國際化運(yùn)營的重大隱患。
梅宏建議采用“參與融入、蓄勢引領(lǐng)”的開源推進(jìn)策略,一方面鼓勵(lì)我國企業(yè)積極“參與融入”國際成熟的開源社區(qū),爭取話語權(quán);另一方面,也要在建設(shè)基于中文的開源社區(qū)方面加大投入,匯聚國內(nèi)軟硬件資源和開源人才,打造自主可控開源生態(tài),在學(xué)習(xí)實(shí)踐中逐漸成長壯大,伺機(jī)實(shí)現(xiàn)引領(lǐng)發(fā)展。
此外,融合應(yīng)用有待深化。梅宏指出我國大數(shù)據(jù)與實(shí)體經(jīng)濟(jì)融合不夠深入,主要問題表現(xiàn)在:基礎(chǔ)設(shè)施配置不到位,數(shù)據(jù)采集難度大;缺乏有效引導(dǎo)與支撐,實(shí)體經(jīng)濟(jì)數(shù)字化轉(zhuǎn)型緩慢;缺乏自主可控的數(shù)據(jù)互聯(lián)共享平臺等。
當(dāng)前,工業(yè)互聯(lián)網(wǎng)成為互聯(lián)網(wǎng)發(fā)展的新領(lǐng)域,然而仍存在不少問題:政府熱、企業(yè)冷,政府時(shí)有“項(xiàng)目式”、“運(yùn)動(dòng)式”推進(jìn),而企業(yè)由于沒看到直接、快捷的好處,接受度低;設(shè)備設(shè)施的數(shù)字化率和聯(lián)網(wǎng)率偏低;大多數(shù)大企業(yè)仍然傾向打造難以與外部系統(tǒng)交互數(shù)據(jù)的封閉系統(tǒng),而眾多中小企業(yè)數(shù)字化轉(zhuǎn)型的動(dòng)力和能力嚴(yán)重不足;國外廠商的設(shè)備在我國具有壟斷地位,這些企業(yè)紛紛推出相應(yīng)的工業(yè)互聯(lián)網(wǎng)平臺,搶占工業(yè)領(lǐng)域的大數(shù)據(jù)基礎(chǔ)服務(wù)市場。
梅宏建議大力發(fā)展行業(yè)大數(shù)據(jù)應(yīng)用。以制造業(yè)為例,麥肯錫研究報(bào)告稱:制造企業(yè)在利用大數(shù)據(jù)技術(shù)后,其生產(chǎn)成本能夠降低10%—15%。
而大數(shù)據(jù)技術(shù)對制造業(yè)的影響遠(yuǎn)非成本這一個(gè)方面。利用源于產(chǎn)品生命周期中市場、設(shè)計(jì)、制造、服務(wù)、再利用等各個(gè)環(huán)節(jié)數(shù)據(jù),制造業(yè)企業(yè)可以更加精細(xì)、個(gè)性化地了解客戶需求;建立更加精益化、柔性化、智能化的生產(chǎn)系統(tǒng);創(chuàng)造包括銷售產(chǎn)品、服務(wù)、價(jià)值等多樣的商業(yè)模式;并實(shí)現(xiàn)從應(yīng)激式到預(yù)防式的工業(yè)系統(tǒng)運(yùn)轉(zhuǎn)管理模式的轉(zhuǎn)變。