开放数据也是新闻自由环节

郭史光庆
(更新:

【自由苹果】

几天前傍晚驾车载着太太和孩子去他外婆家时,远远看到一排住家的顶部冒起一团团的白烟,太太第一个反应,“是不是有房子着火了?”

车子趋近后才发现是专人挨家沿户喷着蚊雾,“肯定是这一区有人得了骨痛热症”,我说。

在这个资讯爆炸的年代,如果还要我们以喷蚊雾来推断某个地区是否爆发骨痛热症,那还真是荒谬。但是一般上当局对外发表的骨痛热症病例资料并不够详尽,所鉴定的黑区都涵盖一整个住宅区,居民无从知道究竟病例就发生在同一条街还是相隔了10条街。

我回家后打开在去年由几个政府部门联手开发的iDengue手机程序,它能在谷歌地图上显示骨痛热症热点(hotspot)、黑区(kluster)以及用户的所在地点,我发现喷蚊雾的地区的确属于骨痛热症黑区,病例并未散播至我居住的地区,顿时宽心不少。

资讯促成更明智的决定

这个手机程序的推出可说是一大进步,但是只要一打开它,你就会发现其界面设计和稳定性差强人意(我用的是iOS版),所显示的资料也不尽令人满意。除了热点和黑区,用户无从知道有关地区出现多少病例、过去的病例,以及死亡人数等等。难怪它在Google Play store的下载量只有数千次。

如果它可以让用户设定,在居住的地区出现病例时主动发送警告讯息、显示与分析过去的病例数据来说明某个地区的情况有所改善还是恶化,甚至还能结合地方政府的数据库,显示附近在进行建筑工程的工地,那就更好了,因为用户可以过去看看是不是有关工地出现积水,查明了再通过同一个手机程序向市议会投报。

良好的资讯可以协助人们做出明智的决定和行动来解决问题,但是在马来西亚,掌握最多资讯的政府往往最不愿意公开资讯。如果政府没有资源与能力开发一个像样的手机程序,只要公开所有骨痛热症的数据资料(当然必须保护病患的隐私权)。我相信一定会有组织、媒体或IT公司可以开发出更好的产品,因为这些资讯都是人们所需要的,能够借以赚取盈利(私人公司)、吸引读者或用户(媒体)或提供公共服务(非政府组织)。

骨痛热症只是一个例子。政府收集与管理庞大的数据与资料,从宏观经济数据到婴儿的体重身高,用的都是纳税人的钱。只要不危害国家安全或侵犯个人隐私,纳税人当然有权获得。公不公开资讯,不仅左右人们的决策与行动(例:家长会避免送孩子进入长期属于骨痛热症黑区的幼儿园),同时也影响一个国家的新闻自由。

资讯自由法只是起点

每年的5月3日(本周三)被联合国定为世界新闻自由日。提到新闻或媒体自由,大家最先想到的应该就是当权者或利益集团(包括大企业和犯罪集团)如何以各种手段打压新闻从业员,阻止他们公开不利于自己的资讯。

资讯的呈现与传播,事实上是新闻制作的下游阶段,在这之前新闻从业员还必须获取和处理资讯。少了资讯来源,新闻的广度与深度都会大打折扣,因此媒体能否取得资讯、索取的方式是否简单有效率,以及资讯的素质优劣,都是新闻自由的重要部分。

政府除了用纳税人的钱来收集与管理公共数据,也利用这些数据来协助施政,因此人民绝对有权利获取这些左右着本身生活的资讯。民众实践这项知情权的其中一项主要方式,就是通过新闻报导。

若要评估一个社会的知情权,很多人都把重点放在有关政府是否有制定《资讯自由法》(freedom of information law),也称为《阳光法案》(sunshine law),保障人民获取政府资讯的权利。在马来西亚,只有槟城和雪兰莪两个州政府在民联执政后通过了《资讯自由法》。

但是《资讯自由法》只是开始,有了立法保障,还必须确保人人能以简单、快速、有效率的方式获取和分享资讯,这个就是“开放数据”(open data)的概念。

去年10月我受邀到槟城一场论坛主讲开放数据的课题时,就有一位民联国会议员抱怨,民众经常通过槟州《资讯自由法》底下的程序(每次必须缴付50令吉)来索取早已公开的数据,因为他们不知道有关数据究竟刊登在州政府的哪一个网站、哪一份报告,结果被迫走了许多冤枉路。

何谓开放数据?

要解决数据深藏在数百个不同的政府部门网站难以见天日的问题,多个国家的各级政府设立了一般名为data.gov的数据枢纽,管理和存放所有政府单位的数据。

然而,开放数据指的不仅是数据本身的开放,与包括技术上的开放,也就是数据的格式是否可供机器读取(machine readable),例如csv、json、xml或xlsx,而不是pdf或图片(jpg或png),因为数据运算软件如Excel无法读取pdf或图片内所显示的数据。

其他开放数据的最佳作业方式(best practices)还包括每套数据必须有完整的元数据(metadata)或数据字典(data dictionary),也就是“数据的数据”(data about data),用来说明这套数据的背景资料,例如该数据是何时收集、由哪个单位负责、更新频率、具有什么弱点或假设性。

尽管没有《资讯自由法》,马来西亚联邦政府了解开放数据是大势所趋,因此首相署属下马来西亚行政现代化及管理策划单位(MAMPU)在2016年初重新推出了我国的data.gov.my。但是只要稍微试用,就会发现里头的近2000套数据杂乱无章,完全是一盘罗惹(rojak)。

举例说,搜索关键字“population”(人口)会找到83套数据,不同的州属或地区与不同年份的人口数据都存放在不同的文件里,而且格式各不相同,一些州属或地区的数据失了踪,另一些文件的数据则相互重叠。

一些州属的数据提供较小的人口单位,但最小也只是县级,我们无法知道某个甘榜或住宅花园的准确人口,政府通过10年一次的人口普查收集了这些详细资料,但都没有公布。一些数据采用代码,但是却没有元数据来说明这些代码是什么。虽然用户可以通过这个网站索取不在网站内的数据,但是我在去年7月提交了几项数据要求,至今依然音讯全无。

我在美国媒体上班时经常要使用当地的开放数据网站,所提供的人口普查数据的最小单位是block,也就是从一个路口到另一个路口之间的所有建筑物,极为详尽,不仅美国政府,大小企业都会参考人口普查的数据来策划要在哪里开店营业或增设分行。

纽约市政府的开放数据网站甚至上载了所有交通车票的地点和违规详情,以及街上每一颗树的地点、品种和健康状况!

随着政府施政、企业运作和人民生活加速数码化,数据变得越来越庞大与重要,新闻从业员在制作新闻,尤其是进行调查式报导时,数据扮演重要角色,甚至成为新闻的核心。

数据新闻(data journalism)成为越来越多欧美新闻学院的教学重点(美国史丹福大学哥伦比亚大学),未来将是新闻学院毕业生的基本技能之一。

马来西亚新闻从业员为了适应网络时代,已开始掌握多媒体和社交媒体,现在是时候为自己的新闻技能组合加入数据这一项了。另外,在争取新闻自由时除了抗衡当权者的打压与审查,也应该放眼推动与协助政府官僚更好地执行开放数据政策。


郭史光庆,曾在《当今大马》从事新闻报导长达8年。纽约大学新闻学硕士、陶氏奈特创业新闻中心(Tow-Knight Center for Entrepreneurial Journalism)学人、谷歌新闻学人(Google Journalism Fellow)。目前定居巴生谷,除了制作数据与互动新闻,也成立了DataN为记者提供数据新闻培训。联络:[email protected][email protected]

本文内容是作者个人观点,不代表《当今大马》立场。


相关文章

分享

登录