本期“走近科学”,我们采访了复旦大学的郑磊老师,他致力于公共政策尤其电子政务研究。
 
  随着大数据时代的来临,如大家所知,数据已经成为科学研究和技术创新的重要资源。正是在这一背景下,各方呼吁数据开放的声音越来越迫切和激烈。尤其是,对于沉积在政府部门的海量数据,一旦公开将带来毫无疑问的巨大收益,科学界和企业界早已是望穿秋水。但是,正如各界已经注意到的,“开放”本身是一件技术活,而且可能比科学研究或者技术创新更加复杂和艰难。这也正是我们本期采访郑磊老师的原因。
 
  政府数据开放是从政务信息公开延伸而来。“数据公开”虽然是“信息公开”的进一步发展,但两者仍有很大的区别。根本在于,信息公开的内容是“信息”,而数据公开的内容是“数据”。信息指“人眼可读”的“条目”,而数据则指“机器可读”的“数据组”。
 
  数据开放自美国总统奥巴马2009年第一任任期的第一天签署《透明与开放政府备忘录》后,迅速成为一种全球趋势。在美国的引领下,英国等欧美发达国家纷纷推动实施了数据开放,印度、肯尼亚等若干发展中国家也加入其中。我国的台湾地区、香港特别行政区等地先后跟进。北京、上海等内地省市也陆续探路。
 
  我们期望借助本文,能引发各界对此问题有更为广泛的讨论。

 

说明: C:\Documents and Settings\user\桌面\DSC_6412ab.jpg

郑磊,复旦大学国际关系与公共事务学院讲师。2009年获纽约州立大学公共管理与政策博士学位

 

政府数据开放与否已经影响经济的进一步发展

  世界科学:最近两年,“大数据”成为经济创新领域的一个热词,其中政府数据开放也是人们关心的一个议题,您认为中国的数据开放是否已经具备了条件?
 
  郑磊:我们认为政府数据开放的时机已经成熟。
 
  如大家所看到的,中国的社会信息化和政府信息化已经有十多年的时间了。前些年基础设施的建设支撑了行政、审批、监管、服务等工作。在这个阶段,硬件建设和软件开发应用是主要工作。但是在基础设施的硬件和软件都完善了之后,人们发现,这些年信息化过程中最大的收获既不是硬件也不是软件――硬件很快会更新换代,软件也会很快淘汰或升级。但留下的大量数据,倒是成了最大的收获。
 
  政府在政务信息化过程中,自然会产生大量的数据。但这些数据在政府的内部并没有被很好地应用,比如一些业务和服务,没有人从中发现或者试图从中总结出什么规律并进而支持决策。分散在各个部门的数据,横向链接整合起来,就成了大数据了。
 
  世界科学:政府采集的数据如您所说已经成为了“大数据”的一部分,这些政府数据与经济到底是怎样的关系?
 
  郑磊:关系非常之大。政务信息化产生大量数据之后,就面临了政府数据必须开放的问题。为什么呢,通过各国的统计数字,人们发现百分之六七十的数据掌握在政府手里。如果政府的数据不开放出来,全社会的大数据时代是到不来的。如果不能到来的话,最后的损失其实也是政府和社会的。因为经济的升级发展,有赖于数据驱动的创新,经济向好了,政府的财政收入也会上升。以后创新增值服务将更多基于数据,而不仅仅依靠石油煤炭等资源来发展。在经济2.0里面,数据将是很重要的创新创意来源。
 
  为什么数据必须开放出来而不是留在政府那里?因为企业会有非常大的利益驱动、商业价值的驱动,他们会竭尽全力对这些数据进行开发和增值利用,数据的价值会因此回报给整个社会,最终老百姓的生活工作都会受益。这就是为什么数据开放我们必须要做。如果不开放,很多经济发展都会被卡住。我给我们学校公共管理硕士的学生们上课讲到这些,他们说,我们原来以为我们做得不错了,硬件做得那么好,但是现在我们意识到,还是没有跟上新一波的产业升级。如果没有很好地开放政府数据,这新一波的企业创新的机会也就要丧失了。
 
  另外从数据的所有权来说,数据的采集过程中,动用的是公共财政。那么这些数据的产权理应属于全社会,而不是部门所有。以前的想法是,数据是我部门采集的就是我的。其实这些数据不光是部门的,还是政府的,更是社会的。所以从所有权的角度来说政府也应该开放数据,让数据回归社会,创造公共价值。
 

与其被动开放,不如主动挑战

  世界科学:我想大多数人可能都了解大数据带来的价值,因此也就能理解政府数据可以用于创新促进发展,但是,现在政府部门仍没有大范围地开放其数据,您觉得其中是不是有一些复杂的原因?
 
  郑磊:政府不愿意开放的理由,其中有一条是担心数据带来舆论危机。比如环保局,最早是担心如果空气质量数据很难看,会引起社会恐慌,产生负面影响。
 
  另外他们还担心数据开放之后被错误解读。比如AQI指数,我们现在看到的是指过去24小时空气质量的平均值,而不是当下值。如果开放之后,外面开发APP的人没有正确理解和解读,把当前的AQI值当作当下值进行程序开发。然后如果有人因此在社会上说环保局的数据不对,环保部门就很被动了。其实有人乱用了,政府可以出来指正和批评,引导大家去准确地解读。
 
  美国没有这方面的担忧,他们的DATA.GOV平台会尽力完善数据的质量,并且希望得到应用方的反馈,发现问题就修正。这也就是说政府数据一旦开放,不仅是政府的责任,也是社会企业共同的责任。
 
  世界科学:我们已经看到了一些政府数据开放,比如人们关心的PM2.5,您曾经专门调研过这方面的情况,可否给我们介绍一下其中详情?
 
  郑磊:中国现在的一些部门的数据开放,其实是由于民间倒逼。人们目前最为关心的PM2.5是最明显的一个案例。环保部门内其实早就知道美国有一个环境数据公开网站叫AIRNOW.ORG。在这个网站上有一张美国地图,点击到每个州每个市,当地的空气质量都有数据。这个网站已经有十多年了。所以环保系统内部也有希望公开空气质量数据的声音,也出现过讨论,但更多的人担心一旦数据公开就会引起社会恐慌。其实早在上海举办世博会时,作为“城市让生活更美好”的一个抓手,上海曾有半年时间在世博园区发布了实时空气数据。但是世博过后,就不再发布了。直到后来美国大使馆发布了,在公众的强烈要求下,才倒逼中国的环保部门也进行了数据公开。
 
  我们也去美国驻上海领事馆专门就此事进行了访问。领事馆说,我们开放这些数据,初衷是因为在中国的美国公民,担心自己的健康。在美国如果PM2.5达到一个值,小孩子就不能上户外体育课了。但是中国当时没有发布PM2.5数据,当时中国公开的是PM10数据,PM10是反映较大颗粒污染物的,而PM2.5是反映更小颗粒的。而且环保局发布的数据和公众个人对空气质量的感受有一定差距,数据的真实性受到质疑。因此在中国的美国公民就要求美国使馆说,既然美国本土的公民可以享受到AIRNOW的空气质量数据服务,驻华使馆也应该为他们提供这样的服务,也就是公共服务均等化的问题。然后美国大使馆就响应了这个诉求,在美国的大使馆内部装了个监测仪,向他们发布数据。结果他们公布的数据被中国公众通过社会化公众媒体比如微博所放大,因此就成了很大的社会热点话题。人们看中国环保部门的数据,说空气很好,再看大使馆的,说空气不好。对比自身的感觉,大家就对政府发布的数据乃至政府公信力产生了怀疑。
 

开放后的开发,是政府主导还是相信市场

  世界科学:如果政府数据全面开放了,它将怎样撬动经济创新,可否举一个简单的例子说明?
 
  郑磊:我们通过实名问卷,通过座谈会,发现市民对空气质量信息的需求并不仅仅是数据。当然首先是数据。但只有数据并不完全有用。还需要解读数据代表什么意思,以及其中的构成是什么,也就是还需要和数据相关的知识。要知道一般市民是看不懂专业数据的。第三是预防建议,也就是告诉人们应该怎么办。比如小孩可不可以上体育课、哮喘患者怎么办。第四是有没有真正的治理。不能每天都说情况很糟糕,却没有拿出一些措施来。现在我们的发布内容中这四种信息都有。第四部分比如说暂停了什么重污染工厂、限制了小汽车上路之类的,让老百姓有所安慰。这些都是在需求调研中发现的。
 
  这些增值服务,让老百姓对数据可解读可应用,就给了企业很大的机会。企业一旦通过产品和服务满足了公众的这些需求,新的经济增长点也就出现了。
 
  世界科学:这样的增值服务可否由政府部门自己来做?
 
  郑磊:现在政府在这个环节有个误读,认为政府把数据开放出来,就是政府自己根据这些数据做成APP、微信广播或者网页,但是外面不能下载原始数据。理由还是一样,担心原始数据公开后遭到误读。
 
  其实,背后更重要的是行业和部门利益的因素。
 
  这样做是有问题的。第一,数据本身是公众所有而不是政府部门的;第二,政府自己开发的APP,永远不会比企业开发的好,因为企业有营利动力;第三,政府有那么多财政资源不断开发APP吗?在市场上,一个APP就是一个公司,像现在流行的打车APP,一个APP就是一个公司,是一个巨大的团队。政府一个部门怎么能养得了那么多人做APP,而且是越来越多的APP?
 
  纽约是这么做的,纽约市政府把数据开放在一个网站上,他们还担心没有人来用,特别搞了一个竞赛,叫BigApp。获得一等奖的奖5万美金。也就是说,邀请你来用政府开放的数据,而且用得好还给你奖金。纽约的做法是真正发挥市场的作用,拿出奖金相当于作为种子基金,来推动你发展。而不是政府自己来包干开发数据。
 
  企业不光比政府更专注更能体会市场需求,而且企业有能力汇总各部门数据。我们现在的模式是一个部门申请一笔钱,开一个网页做一个应用。完全按照部门的条块来开放数据。这就造成了数据虽然开放了,但是是“数据孤岛”或“APP孤岛”的局面。比如上海公厕指南,是政府部门开发的,是很有用,但是只有公厕的信息,附近商场、快餐店、酒店内的厕所信息是没有的。而且老百姓需要下载很多的APP才能满足其服务生活所需,空气一个APP,公厕一个APP,路况一个APP,互相之间都不连通整合……其实只要各个政府部门都开放数据了,就有企业能做到整合的“一站式”服务,将相关数据做成一个多功能的APP。现在企业怎么做呢?有些公司派一个人盯着政府的网站,数据一旦更新,他就手工抓取。费事费力,而且由于受限于政府更新的速度,做出的应用也并不好。其实他们也很无奈。
 
  世界科学:您提到的政府数据免费开放,是美国的模式,据说欧洲一些国家采用的是比较保守诸如招标授权之类的措施?
 
  郑磊:虽然说数据采集是财政税收支持的所以数据归全民所有,但在开放的时候收费与否,欧洲有些国家和美国是持不同立场的。欧洲部分国家的模式确实是招标授权的模式,美国则是纯市场导向的。美国相信开放,它相信开放数据带来的社会收益会高过收费的直接收入,所以就完全不收费。欧洲部分国家呢,担心风险,所以是招标,给三四家企业来竞标。但是现在欧洲也开始采用美国的做法了,英国的数据开放甚至比美国做得更好。
 
  中国能否采用欧洲的方式呢?我们担心,一旦采用招标方式,在中国现有的国情背景下,有可能出现权力寻租,即一家公司通过利益输送,拿到政府数据后,再转卖给别人,有二次授权的问题。这种模式可能会造出新的数据利用商,靠政府提供的数据资源即可赢利。这当然是不利于数据利用发挥最大价值的,而且会影响公平公正。
 

开放需要决绝的勇气与严密的方案

  世界科学:数据开放就像泼水出去,一旦开放再收回就几乎是不可能之事。“开放后出了问题怎么办”这一问题现在有没有比较共识性的答案?
 
  郑磊:在开放过程中,什么数据可以开放什么不可以开放,可以参考《国家信息公开条例》。个人隐私、商业机密以及国家安全相关的不能开放。其他的能开放则尽量开放。当然,不断有人提“斯诺登事件”(编按:爱德华?斯诺登(Edward Snowden),曾是美国中央情报局技术分析员,后来供职于国防项目承包商Booz Allen Hamilton。2013年6月将美国国家安全局关于PRISM监听项目的秘密文档披露给了《卫报》和《华盛顿邮报》,之后遭到美国政府通缉,现临时避难于俄罗斯),极力宣传甚至夸大信息安全问题,其实大多与民生相关的数据并不涉及到安全问题。这些极力鼓吹安全的声音里面,我怀疑有厂商利益和部门利益,强调安全问题只是借口,根本原因是因为“数据就是利益”,开放数据就断了他们的财路了。
 
  对于安全问题,在我们专业有一种说法,如果把安全做到极致,那就不要信息化了,因为只要有网络就一定有漏洞,那回到信息化时代之前最安全,一切都是纸质的,不容易泄露。安全和应用之间,我们认为应用是目的,安全是保障。不能因为安全问题就一切都不开放不利用。
 
  政府数据开放过程中也会带来政府数据透明化的问题。政府数据的真实性、全面性和及时性都可能有问题。如果没有公开,这些问题可能就烂在肚子里了。一旦开放后企业应用出现了问题,谁来承担责任?一种说法是政府应该免责,因为数据开放在我,但如何应用在你,应用出错责任不在我。另外一种说法是,如果这样,政府就对数据质量无所谓了,反正跟我没关。
 
  其实数据有问题并不可怕,可怕的是有没有勇气开放。美国的做法是鼓励大家来用,发动大家来挑刺,并把问题反馈给政府。经过一段时间的挑刺改错,数据质量不断提升,就会是一个良性循环了。而因为怕丢脸所以不愿意拿出来,则始终是一个低劣的闭路循环。
 
  当然为了避免大的错误出现,我们可以先将政府数据归类。比如公共厕所数据,错了也不会酿成大错,可以先放出来。空气、交通的数据,也可以先放出来,错了也可以挽回。可以做成本效益分析,开放的效益大于成本的,就应该开放。但有些数据错了可能会引起很大问题的,后果难以挽回的,可以暂缓放开。美国的DATA.GOV也不是一步到位的,总有个先易后难的过程。
 
  世界科学:有关资料显示,国际上所有发达国家都已实现政府数据开放,发展中国家如印度、肯尼亚也都实现了数据开放。根据国际经验,您可否谈一下如果在一个新的地方实施数据开放,一般有怎么样的推动方案?
 
  郑磊:首先是自上而下的推动。在美国,由行政管理和预算局和一个白宫首席技术官配合进行数据开放的顶层设计和执行。
 
  在国际上有一个OPEN GOVERNMENT PARTNERSHIP组织,他们会周期性地举行会议,上一次会议在巴西召开,当时美国国务卿希拉里去了,她说未来社会,一种是open的,一种是close的。这样的说法给我们也造成了一定的影响,感觉是针对中国的,西方国家又要分两个阵营了。当然不能因为有这样的阴谋论我们就不去开放数据,就不去参加这样的会议。这个会议其实更像是经验交流会。很多发展中国家也参加的。大家遇到相同或不同的困难,可以一起交流。开放政府数据的目的不是为了别的国家,是为了我们自己国家的发展,我们自己最受益。
 
  另外一种是自下而上的推动。就比如前面提到的公众对PM2.5的诉求引发的空气质量指标公开。当然自下而上的推动,也与公众的认知水平有关。比如以前人们对环境不够重视,反而是政府在推动环保。老百姓温饱没有解决,宁愿砍树造纸,也不愿讨论污染问题。以前上海环保局里面有人想开放空气指标数据,结果老百姓觉得不重要。但是现在随着中产阶层的形成和扩大,越来越多的人都开始关注污染问题了。数据开放的公众诉求已经形成。
 
  政府数据开放需要自上而下和自下而上同时进行。但要做到真正的政府数据开放,我们还有很长的路要走。
 

(本次访谈也是上海市2013年度科技创新行动计划软科学研究重点项目“政府数据创新:国外实践的经验、困境及借鉴意义”的一部分。)