关于网易邮箱、cookie与网络时代的隐私问题

(好久没写随笔了,略乱,最近会逐渐恢复博客更新频率~)

最近的315大会似乎打击了许多没有在央视好好打广告的IT公司,苹果向来傲慢,你再指责他傲慢也没什么,不过网易这次恐怕是栽到了。

关于新闻媒体以一种运动式的、娱乐化的方式,高度选择性、倾向性地报道一些负面信息,这种行为令人不齿,不过我一般而言并不反对这种娱乐化和倾向性,因为大众舆论,特别是电视媒体,其本性就是眼球至上、娱乐至死。拿学术界的标准去要求“大众”媒体是不恰当的。当然,大众媒体需要遵守法律的约束,例如不能刻意造假,恶意诽谤等等(当然央视的打假似乎触及了某些下线),但在合法的限度内采取一定的聚焦、夸张、修饰手法,我认为没什么可大惊小怪的。正如我对“南方系”媒体的态度也是如此,左派的根本问题是他们太严肃了,虽然拿大众为挡箭牌,但事实上根本不能适应“大众”的力量……当然央视的问题在于他事实上并不是一个大众媒体,而是一个拥有极大权柄的官方喉舌,因此和南方报系或湖南卫视之类不能等量齐观。即便是网络上对央视的行径有各种讽刺,对网易也有各种深入的讨论,但央视报道对普通大众的影响很难抵消。

扯远了……我倒也不是非要反击央视,只是正好借机谈一谈关于网络时代的隐私问题。

网易被“揭发”的主要是两个问题,一是在其网站的某些部分外挂了第三方公司的代码以获取用户的浏览记录,二是网易邮箱据说能“看到”邮件内容并根据内容精准地投放广告。

当然这里头有许多夸大其词的部分,这一部分是央视添油加醋的后果,另一部分则是网易被暗访人员的夸大,因为央视是冒充客户去暗访的,为招揽生意,不明真相的营销人员往往会吹嘘过多,而且面对的又是非专业人士,介绍得可能会过于简化。比如说业界流行的通过机器识别邮件内容中的关键词来精准投放广告的行为,被简单地说成能“看到”内容。事实上现在以Gmail为首的众多免费邮箱都是采取这样的策略:你可以免费使用服务,网站靠数据获取利润。这种做法虽然有争议,但也是业界的一条“明规则”,对此不能接受的人最好去选择收费邮箱或者买服务器自己架设邮箱,不然的话既然要免费用,就只好服从行规了。

外挂第三方代码的问题也是类似,归根结蒂还是为了获取数据而精准投放广告。cookie这一没有很好中译名的专业词汇被央视妖魔化了,我建议把cookie翻译成“小数据”:我们访问某些网站时会在电脑上记录一些访问数据,而在未加禁止时网站可以得到这些数据,许多时候这些数据是必要的,例如我登录亚马逊,把一本一本书放入购物车最后付款,网站方面必须知道这一系列的操作是来自同一个用户的。如果没有cookie,许多操作也许仍然可能但实现起来极其麻烦。当然,cookie本身只包含在网站上的访问轨迹等小量数据,但央视节目中广告公司所说的在cookie中获知“所在地域、兴趣爱好、年龄、月家庭收入、甚至IP地址等个人信息”这又是怎么回事呢?所在地域和IP地址是可以直接获得的,“甚至”一词应该用在兴趣爱好、年龄、收入等项目上。这些项目一般并不是由“小数据”中直接提取的,而是通过分析大量的小数据,归纳出你的上网习惯,然后通过统计分析估算出来的。通过这种分析,除了可以有助于更精准地投放广告之外,更能够进行许多数据挖掘的研究工作,其样本之巨是任何传统的社会调查方式所无法企及的。

这正是所谓“大数据时代”的趋势之一,国际上最大的两家网络公司是Google和Facebook,当然,他们也都在大量收集网民的上网习惯,有的是通过网站本身进行的,例如Gmail和Facebook,也有通过在其它网站添加代码的方式进行,例如Google的Analytics和Adsense,不幸的是,我的随轩网站也安插了这两个服务,另外我还在文章页面插入了Jiathis的代码以提供“分享到”功能,而这一功能也会给加网提供数据。

当然在一个网站中插入另一个网站的代码这件事情似乎未经用户同意,不过这的确是常见的做法,那些最大型的门户网站也往往要采用第三方广告公司通过的广告——因此势必要安插外站的代码。事实上这也是合理的,试想如果广告代码也由网站本身提供,顾客的浏览和点击情况完全由网站本身掌控,那么如果网站作假虚报广告的效果,广告主怎能放心?广告主当然更愿意把广告代码托付给专业的广告公司,而不是直接托付给中小网站主。如果禁止第三方代码,那么除了那些最大型的网络公司之外,大量中小网站都将难以为继了。

当然,除了这些实际的理由,我们还应该谈谈伦理——如果说搜集用户上网习惯这件事情本身是错的,那么无论它对网站主的生存有多重要,或者即便说它支撑着整个网络世界的发展趋势之类,我们也仍然要否定它。但问题是这里的伦理问题究竟是什么?

“隐私”——我们的隐私似乎被侵犯了。但隐私是什么?

隐私当然会在网络时代遭到挑战,这是因为“隐私”本来就是历史性的,与不同时代的生活方式相关。

最原始的“隐私”概念大约是“隐藏私处”的意思,人最早懂得遮掩的也许是自己身体的私密部位。在原始社会中,除了人的身体,很少有什么东西是“私人”的。直到有了公与私的分别,私成了“私产”的意思。但是一种与公共生活相对立的“私人生活”的概念,是直到近代才出现的。古代的“私人生活”大致等同于其个人的产业,分隔公共与私密的就是自家的围墙——而在中国之类特别注重家族生活的文化之中,在公共与个人之间还有一个家族生活的领域,于是在公事和家事之外,“私事”并没有多大的空间,而且这一空间仍然没有特别鲜明的界限。例如我看江晓原提到过,中国古代的少爷少奶们进行房事的时候常常是有丫鬟在一边伺候的。

在介绍麦克卢汉时我提到,“私人空间”的出现与印刷时代视觉空间取得主导地位有关。在传统社会中,人的大部分活动都是与他人在一起共同生活,特别是那些“有信息量”的活动,几乎都是在公共空间中进行的。而只有书面文字可以要求并支持一个属于个人的、不受打扰的活动空间,但这一变化也是逐渐进行的,最初书本总是被放在公共场合大声朗读,书房最初也更多地是一个社交场所。也许直到近代后期,也就是启蒙时代以来,“私人空间”的神圣不可侵犯性才真正成为一种普遍的意识,这与印刷文化的普及相同步。

但即便是在印刷文化之内,所谓的“隐私”也并没有太大的信息量。隐私从最初的“私处部位”到“私人财产”一直发展成“私人生活”、“私人空间”,但“私人信息”这样的概念似乎是更晚近的东西。

最初的私人信息也许就是字面意义上的“信息”,即私人书信。书信往往是一种不愿公开的私人交往,但与作为“生活空间”的私下交往活动不同,书信一方面是一种发生着的交往活动,另一方面可以被截取、保存、传给他人或公开发布。也就是说,只有从书信开始,“隐私”才从一种只能即时“窥探”的东西,变成一种还可能被“窃取”的东西。

但在古代乃至近代早期,书信并不算一种个人生活中某种特别主要的部分,直到交通和通信的足够发达,书信才成为一种重要的社交方式,但也限于文化人,而且书信的内容取决于作者的书写,也就是说总是由作者本人决定有多少“隐私”可能向哪些对象公开,作者甚至可以决定干脆完全公开它们,例如写公开信或出版书信集。即便这些书信违背作者本意地被人窃取或窥探,作者对于所泄露的东西仍然心知肚明。

而恰恰是到了网络时代,或者所谓的“信息时代”,一方面人的私人生活开始呈现极大的丰富性,另一方面这些丰富性可能作为“信息量”而被获取。

吊诡的是,互联网兴起之初,人们抨击它的重要一条是其“匿名性”,所谓在网络上没人知道你是条狗。而这种所谓匿名性恰恰暗示出私人空间与公共空间的界限被打破了:人们在公共空间中做着隐匿的事情,行为和其主体相分离了,不公开的主体可能进行公开的行为。

互联网是一个公共的空间吗?似乎是的。然而访问这一公共空间的活动却成了某种私人生活。上网者一个人呆在家中点击鼠标——我们当然倾向于认为这是一项私人的活动,但这一私人活动的实质却是访问一个公共空间。试想在传统的世界中,我去访问一家商店、学校或展览馆,无论我是否去发布公开的信息,我这一访问行为本身就是属于公共生活的。但在网络上,公共和私人的界限变得非常模糊了。

当然在传统世界中,我可能也不愿意让别人知道我哪天去过商店,几时去过展览馆之类的信息,但一方面跟踪我并进行这种信息化的处理的事情并不多见,另一方面我们也知道若要人不知除非己莫为的道理,既然在光天化日之下行动,就总得做好被人瞧见的准备。

但在网络世界中,隐匿和追踪同时变得容易了,一方面我们不仅在访问某个网络地址时,甚至在公开发表言论时,都可以戴着面具隐藏个人身份;但另一方面我们的任何足迹都将得到全面和自动的记录。

由于互联网公司记录的大多是这种留在公共领域的匿名的足迹信息,而不会扒开面具指认你的身份,因此宣称并未侵犯人的隐私;但网民感觉这种匿名的活动就是一种私人活动,因此对这种活动的窥探就是侵犯隐私。

在某种意义上这两种看法都是对的,关键在于私人空间和公共空间界限的交错,以及个人身份和个人活动的分离。

于是,网络时代的隐私问题不仅仅是一个法律或道德问题,而更是一个历史和哲学的问题,我们必须重新思考何谓隐私,追溯并重新界定私人空间与公共空间的界限。

 

关于 古雴

胡翌霖,清华大学科学史系助理教授。本站文章在未注明转载的情况下均为我的原创文章。原则上允许任何媒体引用和转载,但必须注明作者并标注出处(原文链接),详情参考版权说明。本站为非营利性个人网站,欢迎比特币打赏:1YiLinDDwvBLT19CTUsNHdiQhXBENwURb

6 条评论

  1. 网络时代“个人隐私”到底触及到怎样的领域的确不好说,不能用法律和道德的制高点压倒一切。虽然个人不反对google等收集用户数据以便精确提供广告,不过具体个人信息还是必须保护的,特别是避免被人肉搜索。

    • 人肉搜索这件事情和保护个人信息是不同的问题,许多人肉搜索只是根据那些已经公布出来的信息来进行整合,每一条信息本身也许不算隐私,但顺藤摸瓜把各种信息整合出来锁定到个人,这就变成人肉搜索了。人肉搜索不仅是隐私保护的问题,更涉及集体暴力、民间法庭的问题,爱好八卦或自诩正义的网民们出于耍乐或罚恶的心态进行人肉搜索,这不是保护隐私信息就能规避的问题。这个问题也与网络时代有关,但还需要另行讨论……我曾经计划写一篇“粉丝与群氓”谈论网络圣战和人肉搜索之类的话题,不过一直没写成……

      • 其实我们在微博和人人网这类SNS所公布的信息其实比cookies收集的信息更多更有全面更真实,这些信息更是我们的个人信息。可是我们其实却很少在关注这些东西,这些看来才是我们的隐私。只能说现今关于隐私的观点的确不成熟,很难下定论。
        同时,期待博主关于人肉搜索和网络圣战的博文。

  2. 在中国琢磨“身份”、“隐私”,感觉都会掉入泥潭,我们的文化里好像没有这个东西。前段时间错过MIT的一个会议论文的deadline,你可关注下,你的分析很有意思,今年他们就是讨论媒介领域里private和public的问题。http://web.mit.edu/comm-forum/mit8/index.html 我也想写点这方面的东西呢,可是,好难。。。。。。。
    另外,上次听一位老师说古代的书信是没有信封的,我到网上查了下,没有这方面的说法,大多数都提到信封的礼仪之类的,但这件事情很重要,它关系到古代书写媒介的美学效应的问题。请问你知道是怎么回事吗?
    平时看你的文章,都好扎实,佩服得很。

  3. 另外,我查了好久都不知道cookies叫什么,今天总算解决了这个问题,呵呵。

发表评论

电子邮件地址不会被公开。 必填项已用*标注