“智慧城市”大數(shù)據(jù)時空融合密碼
國家發(fā)改委和中央信息辦在智慧城市建設規(guī)劃中,將“時空基礎設施”建設的組織任務分配給(原)國家測繪地理信息局,很多城市啟動了“智慧城市時空大數(shù)據(jù)與云平臺”項目。
在《智慧城市時空大數(shù)據(jù)與云平臺建設技術大綱(2017版)》中,明確:“時空基礎設施作為智慧城市的重要組成,既是智慧城市不可或缺的、基礎性的信息資源,又是其他信息交換共享與協(xié)同應用的載體,為其他信息在三維空間和時間交織構成的四維環(huán)境中提供時空基礎,實現(xiàn)基于統(tǒng)一時空基礎下的規(guī)劃、布局、分析和決策。”
對以上目標,筆者完全認同。同時,筆者認為——在“信息資源提供”和成為“交換共享與協(xié)同應用的載體”兩者之中,后者更為重要,時空作為數(shù)據(jù)融合共享的載體是天然的。我們一起剝絲抽繭,討論一下時空大數(shù)據(jù)在智慧城市中的應用模式。
01.支撐時空決策,是時空大數(shù)據(jù)的存在價值
關于“大數(shù)據(jù)”的描述,筆者認同Teradata首席分析專家Bill Franks在《駕馭大數(shù)據(jù)》中表達的觀點:沒有一種數(shù)據(jù)叫做“大數(shù)據(jù)”,“大”和“數(shù)據(jù)”都不重要,使用數(shù)據(jù)的方法才重要。我們無需爭論哪些數(shù)據(jù)屬于大數(shù)據(jù)和時空大數(shù)據(jù),所有的數(shù)據(jù)都在時空中,也都是大數(shù)據(jù),只要用大數(shù)據(jù)的方法去使用。
收集和使用數(shù)據(jù)的方法取決于需要解決的問題,我們把工作任務分為兩類,一類是事務性任務,需要精確采集、記錄事實信息和處置過程,比如土地所有權發(fā)證、工程測量、辦理銀行存款、電子商務交易;一類是決策類任務,例如土地規(guī)劃、應急指揮、營銷策略制定等,需要收集多維度數(shù)據(jù)進行綜合分析。
大數(shù)據(jù)的應用目標是支持決策類任務,而非事務性工作。事務性工作是數(shù)據(jù)產(chǎn)生的源頭,其積累的數(shù)據(jù)成果,經(jīng)過抽取、融合后方可成為支撐大數(shù)據(jù)分析的輸入。大數(shù)據(jù)分析不必、也不能直接面向原始業(yè)務數(shù)據(jù)。
順便說一下大數(shù)據(jù)和云平臺的關系。云平臺的本質(zhì)是計算資源和存儲資源的虛擬化,是大數(shù)據(jù)實施的適宜支撐環(huán)境,但非必須。云平臺能力并不等同于大數(shù)據(jù)能力,兩者的關系類似于“結婚和買房”。
02.數(shù)據(jù)融合,是時空大數(shù)據(jù)的核心能力
智慧城市首先強調(diào)數(shù)據(jù)共享,各地紛紛成立“大數(shù)據(jù)局”匯集數(shù)據(jù),此舉就可以消除“信息孤島”了嗎?一位資深地方信息中心主任半開玩笑地說:以前是“煙囪式”的數(shù)據(jù)調(diào)用,現(xiàn)在將一堆煙囪捆在一起集中排放,污染更加嚴重。
數(shù)據(jù)如果無法融合,共享便失去意義。
數(shù)據(jù)融合有兩種,一種是以人為線索。比如,將一個人在公安、社保、工商、稅務等多個部門的數(shù)據(jù)打通,實現(xiàn)信息互通。這是辦公流程的優(yōu)化,事務性工作的效率提升,嚴格講不屬于大數(shù)據(jù)的范疇。在商業(yè)大數(shù)據(jù)領域,通過人的行為數(shù)據(jù)進行“客戶畫像”,制定個性化的營銷策略,應屬于大數(shù)據(jù)應用范疇。
另外一種融合,便是時空融合,目的是支撐城市管理者的時空決策,例如:土地規(guī)劃、產(chǎn)業(yè)布局規(guī)劃、交通治理、環(huán)境治理、應急指揮等等,基本邏輯是“何時、何地、何為”。時間和空間即是所有數(shù)據(jù)的共同特征,又是所有智能的基礎,基于時空的數(shù)據(jù)融合是必然途徑。
數(shù)據(jù)融合需要線索,在商業(yè)大數(shù)據(jù)中,圍繞著“人”為線索形成“客戶畫像”;在時空大數(shù)據(jù)中,需要定義“地理實體”進行數(shù)據(jù)融合,形成“地理畫像”。
03.基于“地理實體”的數(shù)據(jù)融合
在《智慧城市時空大數(shù)據(jù)與云平臺建設技術大綱(2017版)》中,明確要求建設“地理實體”數(shù)據(jù):以地形圖為基礎,對境界、政區(qū)、道路、水系、院落、建筑物、植被等內(nèi)容進行實體化,并賦予唯一編碼,作為與其它行業(yè)和專題數(shù)據(jù)進行關聯(lián)的基礎。
地理實體是占據(jù)一定空間的地物或者現(xiàn)象,地理實體定義及編碼的目標是“通過編碼交換空間信息”,交換的內(nèi)容是指附著在空間上的屬性信息,例如土地性質(zhì)、人口統(tǒng)計、經(jīng)濟指標等等。實施的關鍵是:建立編碼與空間范圍的對應關系并使之成為統(tǒng)一標準,例如全國統(tǒng)一的郵政編碼和行政區(qū)劃。
編碼是溝通效率最高、不易產(chǎn)生歧義且管理效率最高的手段,比如身份證號、樓棟號、學籍號、地類代碼等。用編碼代表空間范圍也是一種常用手段,如標準圖幅號、投影帶號、電話區(qū)號等。
用地理編碼作為數(shù)據(jù)的空間關聯(lián)線索,可以避免多尺度、多投影、多格式地圖數(shù)據(jù)整合所帶來的繁瑣工作。
但是,空間單元本質(zhì)上是業(yè)務管理單元,每個部門都有各自的單元劃分和編碼標準,并在業(yè)務運行和信息系統(tǒng)建設中貫徹執(zhí)行。郵政部門劃定郵政編碼、教育部門劃定學區(qū)、交通部門劃定道路分段、國土部門劃定地塊、城管部門劃定城管網(wǎng)格、公安部門劃定片警轄區(qū)……。
不同領域的空間業(yè)務單元劃分差異性很大,互不相容,不可能設計出一套適合所有行業(yè)的劃分規(guī)則;即使存在完美方案也難以推廣,會涉及業(yè)務規(guī)則調(diào)整和信息系統(tǒng)重建,統(tǒng)一的、唯一的編碼無從談起,將編碼作為數(shù)據(jù)關聯(lián)線索也就無法落實。
在“大數(shù)據(jù)局”模式下,各部門提交原始業(yè)務數(shù)據(jù),必會由數(shù)據(jù)規(guī)格多樣而帶來數(shù)據(jù)融合困境,“煙囪”依舊;而制定一個統(tǒng)一空間標準,強制推廣到各個部門,業(yè)務規(guī)則沖突必然導致障礙重重;只有在所有業(yè)務的底層,設計一個共同的融合架構,才可能從根本上解決數(shù)據(jù)融合的問題。
04.基于空間網(wǎng)格的地理實體定義和編碼方法
有沒有一種方法,既不改動各領域的業(yè)務單元劃分,又能夠?qū)崿F(xiàn)“通過編碼交換空間信息”的目標呢?
答案就是基于空間網(wǎng)格的地理實體定義和編碼方法。第一步,設計一套全域覆蓋的多級基礎空間網(wǎng)格,并賦予唯一編碼。設定最小網(wǎng)格尺寸,按四叉樹逐級向上合并生成上一級網(wǎng)格,網(wǎng)格編碼作為網(wǎng)格在計算機中的存儲形態(tài)。
第二步,用網(wǎng)格集合定義地理實體,網(wǎng)格集合編碼作為地理實體編碼。不同行業(yè),不同尺度的地理實體,選擇不同層次的網(wǎng)格集合來定義。例如:用1米網(wǎng)格記錄建筑物信息,用2米網(wǎng)格記錄土地利用現(xiàn)狀,用100米網(wǎng)格記錄人口數(shù)量,用1公里網(wǎng)格記錄空氣質(zhì)量,用5公里網(wǎng)格記錄氣象信息。
地理實體編碼由所覆蓋“基礎網(wǎng)格編碼”組合生成,最完整的編碼是把所有覆蓋網(wǎng)格的編碼連接在一起,也可進行編碼壓縮避免過長。這樣,解析編碼即可獲得地理對象的組成網(wǎng)格,進而獲得地理實體的覆蓋范圍。如下圖示意,可根據(jù)需要的空間精度選擇合適層次的網(wǎng)格,網(wǎng)格越小,編碼越長,也越接近原始精度。
事實上,在大數(shù)據(jù)應用中,并不需要原始精度的業(yè)務數(shù)據(jù),也不需要原始數(shù)據(jù)的完整內(nèi)容,而是根據(jù)應用分析和決策支持的需要進行抽取和簡化,而空間網(wǎng)格是空間簡化的適宜方式。如果需要原始數(shù)據(jù),通過網(wǎng)格索引調(diào)用即可。
由于編碼只與地理實體的覆蓋網(wǎng)格有關,而與業(yè)務內(nèi)容無關,此編碼可自動生成;同一領域的業(yè)務單元劃分在空間上不重疊,編碼的唯一性可以保證;當某一領域的空間業(yè)務單元調(diào)整時,數(shù)據(jù)共享融合系統(tǒng)無需改動。
如用戶的數(shù)據(jù)為GIS數(shù)據(jù),解析圖形即可獲得編碼;如用戶數(shù)據(jù)為表格數(shù)據(jù),解析其中地名地址信息即可生成編碼,只需提前生成標準的地名地址網(wǎng)格編碼;對于智能感知數(shù)據(jù),也可選擇合適的網(wǎng)格級別進行空間化標定。
通過一個輕量化的數(shù)據(jù)抽取工具,對接到不同行業(yè)的業(yè)務系統(tǒng)中,即可以自動生成形式為“地理實體編碼+屬性數(shù)據(jù)”交換數(shù)據(jù),由于所有地理實體基于相同的基礎空間網(wǎng)格生成,基礎網(wǎng)格是不同地理實體溝通的橋梁,各種空間分析可利用“編碼計算”完成,利用地理編碼進行多源異構數(shù)據(jù)的共享、交換、協(xié)同和融合得以實現(xiàn)。
05.基礎時空框架與時空網(wǎng)格數(shù)據(jù)倉庫
在李德仁院士的論文《從數(shù)字地圖到空間信息網(wǎng)格——空間信息多級網(wǎng)格理論思考》(2003)中,明確指出:“空間數(shù)據(jù)種類繁多、數(shù)據(jù)格式各異、存在多種比例尺、多種空間參考系和多種投影類型。這給需要使用空間數(shù)據(jù)的用戶帶來了很大的困難,不利于空間信息的共享。究其原因,主要在于GIS是面向空間數(shù)據(jù),特別是地圖數(shù)據(jù)的,而不是直接面向空間信息的。” 空間信息網(wǎng)格使空間應用直接面向空間信息,走出地圖的束縛。
智慧城市時空大數(shù)據(jù)平臺需要建立基礎空間網(wǎng)格,作為空間基礎設施;將連續(xù)的時間離散化,形成多尺度基礎時間網(wǎng)格,是以時間為線索進行數(shù)據(jù)檢索和融合的基礎框架;還需建立標準的地名地址網(wǎng)格對象,是地名地址空間范圍的網(wǎng)格表達,是基于基礎空間網(wǎng)格的公共網(wǎng)格集合。“基礎時空網(wǎng)格+地名地址網(wǎng)格對象”組成了智慧城市“基礎時空框架”,是大數(shù)據(jù)時空融合的底層支撐。
基礎時空框架與具體數(shù)據(jù)無關,網(wǎng)格劃分是靜態(tài)的,不會因城市擴張、行政區(qū)劃合并、撤消、分割等情況而改變,不同時間的信息網(wǎng)格具有空間可比性,可方便地進行時序分析。同時,各種量化的統(tǒng)計指標都基于共同的基礎時空框架,也便于不同行業(yè)的統(tǒng)計數(shù)據(jù)進行時空對比分析。
從不同行業(yè)數(shù)據(jù)庫中抽取出來的網(wǎng)格數(shù)據(jù)匯集到一起,形成了“時空網(wǎng)格數(shù)據(jù)倉庫”。數(shù)據(jù)倉庫是面向決策過程的、面向主題的、集成的、穩(wěn)定的、不同時間的時空網(wǎng)格數(shù)據(jù)集合,是實現(xiàn)時空決策分析的數(shù)據(jù)基礎和支撐環(huán)境。在數(shù)據(jù)倉庫之上,構建若干時空決策分析服務,形成支撐智慧城市時空大數(shù)據(jù)決策支持分析的完整架構。
在基礎時空框架的支撐下,時空大數(shù)據(jù)平臺可提供基于網(wǎng)格的公用基礎數(shù)據(jù)資源;各行業(yè)之間在框架內(nèi)基于網(wǎng)格交換信息;更重要的是,有共同基因的網(wǎng)格數(shù)據(jù)匯聚到一起后,智慧城市的各項時空決策得以高效務實地進行。
總結
智慧城市時空大數(shù)據(jù)與云平臺建設中,數(shù)據(jù)類型和數(shù)據(jù)范圍擴展以及運行環(huán)境的云平臺升級,僅完成了“基礎信息資源提供”的目標,而利用時空網(wǎng)格體系構建基礎時空框架和數(shù)據(jù)倉庫,突破數(shù)據(jù)融合瓶頸,才能成為“交換共享與協(xié)同應用的載體”,實現(xiàn)“基于統(tǒng)一時空基礎下的規(guī)劃、布局、分析和決策”,才能稱得上智慧城市的“時空基礎設施”。
責任編輯:電改觀察員
-
5大重點任務11個重點細分 河北加快構建省級能源大數(shù)據(jù)中心
-
能源互聯(lián)網(wǎng)注入數(shù)字經(jīng)濟新動能 電力大數(shù)據(jù)實現(xiàn)更多價值
-
中國首個100%利用清潔能源運營的大數(shù)據(jù)產(chǎn)業(yè)園投運
2020-07-21清潔能源,清潔能源消納,青海
-
探索大數(shù)據(jù) 區(qū)塊鏈實現(xiàn)與能源互聯(lián)網(wǎng)良好契合
2020-06-09區(qū)塊鏈,電力行業(yè),能源互聯(lián)網(wǎng) -
基于區(qū)塊鏈的含安全約束分布式電力交易方法
-
區(qū)塊鏈在能源交易與協(xié)同調(diào)度的應用前景:提升電力交易的自由度和實時響應效率
2019-11-04區(qū)塊鏈在能源交易與協(xié)同