新用戶(hù)登錄后自動(dòng)創(chuàng )建賬號
登錄近日,阿里數據經(jīng)濟研究中心(ADEC)以數據經(jīng)濟新型智庫平臺的角色,牽手清華大學(xué)公共管理學(xué)院舉辦了一場(chǎng)主題為“政府數據開(kāi)放的挑戰、困惑與探索”的沙龍。本文為本文為復旦大學(xué)移動(dòng)與數字治理實(shí)驗室主任鄭磊在沙龍的精彩發(fā)言。
我們實(shí)驗室最近選了七個(gè)開(kāi)放政府數據的城市和城區做了研究評估,今天先給大家匯報一下這個(gè)報告的發(fā)現,然后再講一下我們在各種研究和案例調研中發(fā)現的一些開(kāi)放數據中的難點(diǎn),然后提出一些可能的路徑和建議。
關(guān)于政府數據開(kāi)放的概念
開(kāi)放政府數據跟之前的信息公開(kāi)是相關(guān)的,但是這兩個(gè)也有重要的差別,現在我看到有些報道把政府信息公開(kāi)和數據開(kāi)放等混在一起,信息公開(kāi)是保障知情權,公開(kāi)的大多是一些文件、政策,也公開(kāi)了一些數據,主要是為了保障知情權,也就讓你知道的權利等,而數據開(kāi)放則是強調利用權,我們在評估數據開(kāi)放平臺的時(shí)候,這是一個(gè)重要的切入點(diǎn),如果你把數據上傳到平臺只是讓大家去查詢(xún),而無(wú)法利用,那就只是公開(kāi)而不是開(kāi)放。所以公開(kāi)和開(kāi)放是兩個(gè)概念,我們在調研當中發(fā)現有一些網(wǎng)站,他說(shuō)是數據開(kāi)放,但其實(shí)只屬于數據發(fā)布和信息公開(kāi),不是真正的開(kāi)放,因為沒(méi)法下載和利用這些數據。
下一張圖,縱軸上是信息層和數據層,數據層是底層的,對數據層進(jìn)行加工和解讀才成為信息,橫軸上從左到右是知情,有限利用和自由利用,傳統的“政府信息公開(kāi)”是在知情這個(gè)層次,過(guò)去提到過(guò)的“政府信息資源再利用“主要指的是有限利用,政府把信息給幾家比較信任的公司,只讓他們來(lái)開(kāi)發(fā)利用,這就是有限利用,不是平等的、開(kāi)放的自由下載和利用,其他的公司得不到這些數據就沒(méi)有辦法開(kāi)發(fā)利用。
數據開(kāi)放是要開(kāi)放到數據層,同時(shí)又能保障自由利用,大家有平等的使用的權利。雖然“政府信息公開(kāi)”有時(shí)也達到了數據層,但更多的是數據查詢(xún)服務(wù)和數據發(fā)布,并不能讓人下載利用這些數據。政府開(kāi)放數據的思路把數據層跟應用層分開(kāi),政府提供數據,但政府自己不再需要把數據開(kāi)發(fā)成應用,這時(shí)政府依然在提供公共服務(wù),但不再需要自己生產(chǎn)公共服務(wù),而是與市場(chǎng)實(shí)現合作共創(chuàng ),共同為社會(huì )創(chuàng )造價(jià)值。
舉一個(gè)例子,如果我們把數據當成底層資源,數據相當于大米,我把大米開(kāi)放給社會(huì )以后,社會(huì )是可以做成各種飯的,取決于他想吃什么飯,他善于做什么飯,以及社會(huì )需要什么飯。如果政府自己把米做成了蛋炒飯,就面臨三種情況:
別人想不想吃蛋炒飯?如果別人只想吃白米飯怎么辦?眾口難調怎么辦?
政府自己來(lái)開(kāi)發(fā)數據需要花財政的錢(qián),而開(kāi)放數據給市場(chǎng)來(lái)開(kāi)發(fā)花的是市場(chǎng)的錢(qián)。
政府能做得比市場(chǎng)好嗎?有那么多的人和時(shí)間來(lái)開(kāi)發(fā)一個(gè)個(gè)的應用嗎?
市場(chǎng)的需求越來(lái)越多元化,政府的投入總是有限的,能忙得過(guò)來(lái)嗎?結果就是政府自己做的很辛苦,但吃力不討好。其實(shí)政府只需開(kāi)發(fā)一些基本的應用作為公共產(chǎn)品,個(gè)性化的應用讓市場(chǎng)自己去開(kāi)發(fā)就可以了。
中國政府開(kāi)放數據現狀與問(wèn)題
我們對于開(kāi)放數據的研究,目前得到了三方面的資助,包括國家自然科學(xué)基金,世界銀行開(kāi)放數據能力評估與建設課題以及上海市開(kāi)放政府數據三年規劃課題。我們去年首先做文獻理論和框架構建,今年開(kāi)始做現狀評估。我們參考了國際上知名的針對各國的開(kāi)放數據評估報告,這些報告主要是針對國家層面的,而我國是地方層面現行探索,國家數據開(kāi)放平臺尚未推出,所以目前尚缺少對中國地方政府開(kāi)放數據現狀與問(wèn)題的研究。我們希望通過(guò)該研究建立一套適用于中國國情的地方政府開(kāi)放數據實(shí)踐評估框架,呈現和評估中國地方開(kāi)放數據實(shí)踐的現狀與問(wèn)題,然后為我國開(kāi)放政府數據實(shí)踐提供政策建議。
我們首先對國際上的十幾種開(kāi)放數據報告進(jìn)行梳理,然后探索建立適合中國的評估框架。我們決定首先針對供應端,也就是政府開(kāi)放數據平臺進(jìn)行評估,國際上的評估報告同時(shí)對供應端和需求端進(jìn)行評估,比如開(kāi)放數據500強,哪些公司利用政府開(kāi)放的數據,給他建立500強,這是對需求端的評估,但是中國開(kāi)放政府數據剛剛起步,還沒(méi)發(fā)展到這一步,目前的工作主要集中在數據的供應端,先要把數據開(kāi)放出來(lái),才談得上對應用端進(jìn)行評估,所以我們這次的評估報告主要針對供應端。
我們采用三個(gè)一級指標:平臺層、數據層和基礎層,下面有13個(gè)維度和53項指標。第一個(gè)是平臺層,然后是數據層,平臺建的再好,上面沒(méi)有干貨的數據也不行,這個(gè)是更關(guān)鍵的,在表面的平臺層和數據層之后,還有基礎層,更多是指體制機制的支撐,經(jīng)濟社會(huì )的基礎,而不是指技術(shù)上的基礎設施。我們這次報告采集的數據主要來(lái)自互聯(lián)網(wǎng)上公開(kāi)可見(jiàn)的數據和信息,不包括從政府內部得到的信息。我們選取了幾個(gè)比較有引領(lǐng)性的、有代表性的七個(gè)地方,北京、上海、武漢、無(wú)錫、湛江、寧波海曙、佛山南海。
首先看數據層,這七個(gè)地方平均公開(kāi)278個(gè)數據集。武漢號稱(chēng)最多,他是635,但是有一半是PDF格式的,可機讀比例僅54%,不能讓人直接利用,其實(shí)還是以信息公開(kāi)為主??蓹C讀數據開(kāi)放最多的是上海市,一共有398個(gè)數據集,各地平均可機讀率是84.1%。各地平均有86.25%是靜態(tài)數據,僅17.21%的數據按承諾得到了更新。僅無(wú)錫、海曙明確保障數據的永久免費;各地的開(kāi)放數據中,0%明確賦予并保障自由增值、解讀、分享數據的權利。
總的來(lái)說(shuō),現在開(kāi)放數據總量還是偏低,可機讀性差,大多為靜態(tài)數據,數據按承諾更新比例低,整體都未嚴格符合開(kāi)放授權。
然后看平臺層,各地方平臺包含三個(gè)模塊,一個(gè)是數據導引,一個(gè)是數據獲取,一個(gè)是互動(dòng)交流,這是雙向的,你需要什么數據或者提一些問(wèn)題。我們發(fā)現,只有無(wú)錫和湛江是無(wú)需注冊即可下載數據,開(kāi)放出來(lái)的數據既然已經(jīng)經(jīng)過(guò)了國家安全、商業(yè)機密和個(gè)人隱私的審核,開(kāi)放之后誰(shuí)來(lái)下載利用應該是自由便利的,不一定非要注冊跟蹤,當然政府也確實(shí)想知道開(kāi)放的數據產(chǎn)生了怎樣的效益,有利于下一步的開(kāi)放。
開(kāi)放數據本身不會(huì )直接產(chǎn)生價(jià)值,只有開(kāi)放出來(lái)的數據被社會(huì )利用了才真正有意義。各地都開(kāi)設了應用展示頻道,展示市場(chǎng)上基于開(kāi)放數據開(kāi)發(fā)出來(lái)的應用,這樣就形成一個(gè)循環(huán),政府開(kāi)放數據市場(chǎng)拿去用開(kāi)發(fā)成應用,然后政府的開(kāi)放數據網(wǎng)站上還成為一個(gè)展示這些應用的一站式的平臺,這樣首先政府一方面知道了誰(shuí)利用了我開(kāi)放的數據,更重要的是也讓公眾容易找到這些應用。展示應用數量最多的是上海,列出APP共 78個(gè),各地平均APP數量為20個(gè),但需要指出的是,這些展示出來(lái)的應用很多并不是市場(chǎng)開(kāi)發(fā)的,而是政府自己開(kāi)發(fā)的。
研究還發(fā)現僅寧波海曙一個(gè)地方公開(kāi)了用戶(hù)提出的數據請求,其他的地方只有政府后臺才能看見(jiàn)這些請求。對比國外的開(kāi)放數據平臺,用戶(hù)在提交數據需求后,還發(fā)起了附議的行動(dòng),其他有同樣需求的公眾可以點(diǎn)贊附和。報告還發(fā)現,僅佛山南海開(kāi)設了社交媒體帳號向公眾傳播開(kāi)放數據信息,僅上海一個(gè)地方實(shí)現了數據平臺的移動(dòng)端適配。這些數據都是截止到五月底的數據,我們希望每半年更新一次這個(gè)數據。在平臺層的總體現狀是普通交互便捷性差,缺乏高質(zhì)量數據應用展示,溝通交流缺乏便捷性、有效性和公開(kāi)性。
在基礎層,數據開(kāi)放已經(jīng)從特大型城市擴展到不同地域、不同規模的地方,但依然集中于沿海一二線(xiàn)地區,經(jīng)濟通常較為發(fā)達,政府信息化基礎相對較好、IT產(chǎn)業(yè)發(fā)展具備一定潛力的城市。針對開(kāi)放數據的專(zhuān)門(mén)政策和工作方案普遍缺位,管理體制和領(lǐng)導力支持尚不足以支撐工作推進(jìn)。從體制保障來(lái)看,僅南海、上海建立了專(zhuān)門(mén)針對數據統籌開(kāi)放的主管單位,特別是南海成立了數據統籌局。僅上海公開(kāi)發(fā)布了開(kāi)放數據的針對性政策和工作方案。僅上海、南海有公開(kāi)報道高層行政領(lǐng)導對開(kāi)放數據的支持。
總體來(lái)說(shuō),上海跟南海兩地整體數據開(kāi)放水平最高,武漢、寧波海曙相對偏低。
然而,如果把上海跟紐約在一起比,差距仍然很大。上海是31個(gè)部門(mén)開(kāi)放435個(gè)數據集,紐約是98個(gè)部門(mén)1831個(gè)數據集。當然,我們不能光看數據集的數字,還要看數據的價(jià)值。我還想重點(diǎn)指出的是在開(kāi)放數據集的同時(shí),還要開(kāi)放元數據,元數據開(kāi)放才會(huì )讓大家更多了解數據的背景,告訴我們數據什么時(shí)間采集,如何采集的,然后在利用的時(shí)候就能用得更好,也會(huì )發(fā)現原來(lái)有些開(kāi)放的數據集并不是自己想要的??梢钥吹郊~約市開(kāi)放的元數據字段有22項,而上海市是13項。再有是格式的多樣性,紐約是五星指標,說(shuō)明格式種類(lèi)很豐富,而上海是二星指標,因為其開(kāi)放的數據主要是EXCEL格式為主。這幾個(gè)關(guān)鍵指標其實(shí)代表了數據是否能被容易便利地利用。
政府數據開(kāi)放的六大難點(diǎn)
第一個(gè)難點(diǎn)是很多部門(mén)不知道數據在哪里?你問(wèn)他數據,他說(shuō)我沒(méi)有,有時(shí)是真沒(méi)有,一些政府部門(mén)確實(shí)沒(méi)有采集這樣的數據,但有時(shí)其實(shí)是他不知道他有,有些部門(mén)自己都沒(méi)有數據清單,不清楚自己手上到底有什么數據資源。
第二是難點(diǎn)是能不能開(kāi)放。這個(gè)是政策的角度,涉及到國家安全、商業(yè)機密、個(gè)人隱私的數據不能開(kāi)放,但我們的法律法規有些是模糊的,甚至是沖突的,這種情況下負責開(kāi)放數據的工作人員一般會(huì )偏向于保守,就是傾向于不開(kāi)放數據,這樣對他們自身更安全。
第三個(gè)難點(diǎn)是愿意不愿意開(kāi)放,這個(gè)就涉及到部門(mén)利益了,明明是可以開(kāi)放,但是也許是有一些顯性隱性的利益。我一開(kāi)放出去,我的部門(mén)利益就沒(méi)有了,所以就不愿意開(kāi)放。
第四個(gè)難點(diǎn)是數據好不好?即使前面幾條都解決了,但這些數據是有問(wèn)題的,不準確不及時(shí)或不全面,這樣開(kāi)放出去之后,不僅不會(huì )產(chǎn)生價(jià)值,還可能給社會(huì )造成損失。所以還需要提升數據質(zhì)量。
第五個(gè)難點(diǎn)是能力夠不夠,開(kāi)放數據能力建設對政府部門(mén)來(lái)說(shuō)是一個(gè)全新的挑戰和全新的工作,有沒(méi)有專(zhuān)門(mén)的部門(mén)負責這個(gè)工作?需要在管理層和技術(shù)層進(jìn)行能力培訓,需要交流經(jīng)驗。
第六個(gè)難點(diǎn)是動(dòng)力有沒(méi)有,就是多一事不如少一事的組織文化,有些政府部門(mén)會(huì )覺(jué)得多做多錯,少做少錯,不做不錯,不如先觀(guān)望一下。
關(guān)于政府數據開(kāi)放的建議:培育開(kāi)放數據生態(tài)圈
最主要的建議是開(kāi)放數據要整體性系統性的思考問(wèn)題,這是一個(gè)生態(tài)系統,這個(gè)生態(tài)系統中最大的兩個(gè)群體,一個(gè)是政府,是開(kāi)放數據的,另一個(gè)是市場(chǎng),是利用數據的,要培育、輔導和支持生態(tài)圈的形成,讓數據被開(kāi)發(fā)出來(lái),被利用起來(lái),對整個(gè)社會(huì )產(chǎn)生價(jià)值。這兩大群體又受到內外部環(huán)境的影響,即使一個(gè)地方的政府非常愿意開(kāi)放數據,但這個(gè)地方的經(jīng)濟社會(huì )信息化環(huán)境并不利于數據的開(kāi)發(fā)利用,用不起來(lái),無(wú)法產(chǎn)生真正的社會(huì )價(jià)值,那也無(wú)法產(chǎn)生效果。
政府作為開(kāi)放數據的提供者,需要考慮管理體制、組織架構方面的變革,需要同時(shí)在數據管理和開(kāi)放平臺建設兩方面下功夫?,F在國際上數據開(kāi)放的會(huì )議上,這兩年我聽(tīng)到的更多是在討論誰(shuí)來(lái)用數據?干什么用?利用者之間的差異如何?美國政府在最早推出政府數據開(kāi)放平臺后,就發(fā)現缺少對基礎用戶(hù)的支持,因為數據開(kāi)發(fā)能力不是每個(gè)普通老百姓都具備的,以前我們說(shuō)數字?zhù)櫆?,現在可能會(huì )形成數據鴻溝,中間誰(shuí)把這個(gè)鴻溝連上?數據開(kāi)發(fā)公司可以作為中間的橋梁,把數據開(kāi)發(fā)成應用,為社會(huì )上的普通公眾服務(wù),所以政府要把這些數據開(kāi)發(fā)公司視為合作伙伴。數據的利用者能力非常關(guān)鍵,機構用戶(hù)、增值開(kāi)發(fā)者、一手用戶(hù)、二手用戶(hù)等等是一個(gè)生態(tài)圈,各自發(fā)揮不同的作用,你把一個(gè)干掉了,可能另一個(gè)也消失了,所以我要有生態(tài)圈的意識,不要隨便的干預,除非他們觸碰到了底線(xiàn),但也不要隨便的去扶持誰(shuí),這樣可能會(huì )破壞生態(tài)圈的平衡。
開(kāi)放數據會(huì )產(chǎn)生一系列政治、經(jīng)濟和社會(huì )的效益,但也有損失與風(fēng)險,要看最后帶來(lái)的收益大于損失,還是反之。如下圖我們構建的系統動(dòng)力圖所示,未開(kāi)放的數據開(kāi)放出來(lái)之后,本身并沒(méi)有直接產(chǎn)生價(jià)值,必須要被利用,變成被利用的開(kāi)放數據之后,才會(huì )產(chǎn)生或者是收益或者是損失,這個(gè)價(jià)值反饋回來(lái)會(huì )影響到整個(gè)社會(huì )、經(jīng)濟、技術(shù)、創(chuàng )新等環(huán)境,這些環(huán)境越有利,就會(huì )越支撐政府開(kāi)放數據的機制建設,開(kāi)放平臺建設和數據管理,數據質(zhì)量和數量都上去以后,開(kāi)放的效果也會(huì )越好,形成一個(gè)正循環(huán)。反之,如果開(kāi)放數據造成的風(fēng)險高于收益,社會(huì )環(huán)境中都在反對這個(gè)事情,或者政府開(kāi)放出來(lái)的數據沒(méi)有什么價(jià)值,不是社會(huì )真正需要的,因而沒(méi)有人來(lái)利用數據,就都無(wú)法形成開(kāi)放數據的正循環(huán),所以要有一個(gè)生態(tài)圈的思維,要讓這個(gè)系統向正循環(huán)的方向走,而不是負循環(huán)或循環(huán)不下去??偨Y起來(lái),就是開(kāi)放數據這項工作是一個(gè)復雜的動(dòng)態(tài)的過(guò)程,涉及到多個(gè)利益相關(guān)方,存在多種因素的互動(dòng)關(guān)系和因果回路。但一切要以公眾需求為出發(fā)點(diǎn),以創(chuàng )造公眾價(jià)值為終極目標。