上周六,人们得以看到他们到底有多接近。一份由《卫报》(TheGuardian)援引的NSA文件,展示了一张“全球热度图”,该图看似表示了NSA从世界各地汲取的数据量。比如它显示,2013年3月总共从全世界互联网上收集到970亿条数据;其中14%来自伊朗,有许多来自巴基斯坦,另有约3%来自美国本土,不过其中一些可能是流经美国服务器的外国数据量。
重点的转移
数据专家称,该机构有效地挖掘元数据的能力,已经使窃听和偷听通讯内容的重要性大大降低。元数据指的是关于谁在打电话或发邮件的信息。
“美国法律和美国政策把通讯内容视为最为私密且最有价值的,但这在今天已经过时了,”总部在华盛顿的电子隐私信息中心(ElectronicPrivacyInformationCenter)的负责人马克·卢腾伯格(MarcRotenberg)说。“如今,与通讯关联的信息远比通讯内容本身更重要,那些从事数据挖掘的人都清楚这一点。”
美国法律限制窃听和偷听美国公民通讯的实际内容,但对于打电话这个行为所产生的数据只有很少的保护。而且,对于其他与电话无关的数据,例如用信用卡付帐,几乎没有法律保护。
当不同的数据流被整合到大型数据库中后,例如把使用手机的时间和地点与信用卡购物、或使用E-ZPass电子收费系统的数据相匹配,情报分析师能获得一个人生活的不同侧面,而在过去,仅靠偷听他们的谈话绝对无法得到这么多。《自然》杂志(Nature)上发表的一项研究显示,有关打一次移动电话的地点和时间的仅仅四条数据,足以在95%的情况下确定打电话者的身份。
“我们能发现各种各样的关联和模式,这方面的技术已有重大的进展。”一名为政府工作的计算机科学家说,由于没有获准作公开评论,这位人士要求匿名。
保密项目
2001年10月,乔治·W·布什(GeorgeW.Bush)总统秘密启动了国家安全局的无授权监听项目,在无需获得法院授权的情况下监听美国公民的国际电话和电子邮件,与这个项目同时进行的是大规模的数据挖掘活动。
这些保密项目导致了2004年3月在时任司法部长约翰·阿什克罗夫特(JohnAshcroft)病房里的一次较量,较量的一方是布什的白宫官员,另一方是司法部(JusticeDepartment)和联邦调查局的几个官员。愿意让无授权监听进行下去的司法部律师辩称,是数据挖掘引发了更多与宪法有涉的担忧。
阿什克罗夫特病房里的对峙发生前的一个月,哈佛大学的本科生马克·扎克伯格(MarkZuckerberg)创立了Facebook;Twitter的创立是在两年多以后。苹果的iPhone和iPad当时还不存在。
电子前沿基金会(ElectronicFrontierFoundation)技术分析师丹·奥尔巴赫(DanAuerbach)观察说,“越来越多的像谷歌(Google)和Facebook这样的服务,正在变成信息的大型中央贮藏库。它们所贮藏的大批数据,对执法机构和情报机构来说,是具有极大吸引力的目标。”
据行业分析人士称,长期以来,情报机构一直是对高级计算和数据挖掘软件需求最强烈的客户之一,近年来尤其是这样。一名曾担任技术高管的人士说,“他们对你说,某地有一个美国人将要被炸死,唯一一个能阻止爆炸发生、让他活下去的人就是你。”