巨量资料下谁有隐私?(2-3)_智能中国_申博7737

当前位置:主页 > 智能中国 >巨量资料下谁有隐私?(2-3) >

巨量资料下谁有隐私?(2-3)

2020-07-08

浏览量:240

点赞:613

巨量資料下誰有隱私?(2/3)

资讯时代下,握拥巨量资料也等同握拥权力,而个人隐私又如何顾及?使用者付费或许是个方法。

(续前文)

未来的读心术

我们被异常好心的技术菁英绑住了。提供社交网络或网路搜寻等现代服务的大型云端运算公司,以及他们在资讯情报界里的对手,大多是出于好意的年轻人。要想像事情会恶化到什幺程度,就得想像这些魅力十足的科技新贵将来会变成愤世嫉俗的老人,或者把他们的王国交给将来那些有权力却没头绪的继承人。这应该不难想像,因为这类情节已经常见于人类历史中。如果你认识一些在我们这个以运算为中心的时代中成功的好心科技人,会觉得这种想法很无情,但要对科技有任何先见之明,就必须尽己所能设想那黑暗的一面。

巨量资料下谁有隐私?(2/3)如果一名观察者拥有功能强大的电脑,能取得够多关于某人的资料,理论上就能预测并操控那个人的想法与行为。就算今日的网路连线装置还做不到,未来终将达成。新世代的超便利消费型电子产品可能是一张贴片,只要黏在后颈就能直接读取大脑,在使用者察觉之前就知道他想去附近哪家咖啡店(如何防範这种产品上市后伴随而来的黑暗思想,已经变成当代消费性科技的基本挑战)。

创造那种产品的要素均已备足。已经有实验室只需透过巨量资料统计分析,比对功能性磁共振造影(fMRI)在不同状况下的脑部讯号,便可推测出某人正在看什幺、想什幺或甚至将要说什幺。美国加州大学柏克莱分校神经科学家葛朗特(Jack Gallant)的实验室就是其中一例。因此就某种程度而言,光靠统计分析就能做到读取心智了。

假设你戴着这种超便利装置,正打算去一家咖啡店,但还没决定去哪家,某些组织(未来的脸书或NSA)就能读取这个装置,而且驱使你远离A店而去B店。正当你有意去A店时,你的抬头显示器便蹦出一则老闆送来的烦人讯息,让你转移注意而感到沮丧,去A店的想法便没机会进到你心里;另一方面,去B店的想法带来的是交友网站上心仪对象的推特讯息,让你心情大好,顿时觉得去B店真是个好主意。此时你已经陷入新古典制约的操弄,这一切完全发生在你意识到之前。

这个在科幻小说中历史悠久的想像实验,说明了运算与统计能有效模拟心智控制。可能再过几年,越来越贴身的可携式装置,里面的云端驱动推荐引擎就能实现部份的心智控制情节。

无能之灾

警世科幻小说的经典剧情,是安排一个全能的邪恶反派角色。但我关注的黑暗未来不是那样,而是更可能发生的情节,而且现今已经表现出初期样貌。它比较不像一个超强反派精心安排的邪恶计画,而较像是因为无能而导致的不明灾害。

在那个故事里,某个组织或产业为了追求利润,投入大量资源研发操控大众的演算法,这种做法一开始确实有利可图,只是最后会变得很荒谬。这已经发生了!看看美国健保业者运用大量统计运算排除高风险的顾客,短期内是一种有利可图的策略──直到无保险的人数达到无法承受的量。社会负担不了这种「成功」的策略。用演算法侵犯隐私为手段来追求财富与权力,最后似乎总是搞得一团糟。

想想现代金融的状况。依赖大量统计运算的金融体系常常一开始是成功的,有足够多的资料和运算就有可能推估出证券市场的未来走势、个人的行为或世上任何平稳变化的现象。但这只是一时的。巨量资料系统终将失败,理由很简单,不够详尽的统计只能不断呈现现实的片段倒影。

巨量资料下谁有隐私?(2/3)巨量资料金融系统直到21世纪初才开始侵犯个人隐私(例如建立个人模型并向他们推销愚蠢的抵押贷款或信用额度)。在此之前,它比较单纯:建立证券模型、自动下单投资,完全不去了解这在真实世界产生什幺结果。总部设于美国康乃狄格州格林威治的长期资本管理公司,其避险基金就是一个早期例子。这家红极一时的公司后来在1998年破产,花了纳税人大把钞票纾困(高频交易系统现在以更大量的资料及更快的运算重新启动了这个模式)。然而,现在高度自动化的金融世界泰半仰赖大规模的个人隐私侵犯──那原本是间谍工具或消费性网际网路的特色。导致美国经济大衰退的不动产抵押贷款证券,最后结合了个人隐私侵犯和自动交易机制,引发另一波牺牲大众权益的宇宙级纾困,未来必定也会有类似的纾困。

这不是超强菁英征服世界的故事,而是每个人(包括最成功的巨大云端服务经营者)都没能搞懂正在发生什幺事的故事。一开始,侵犯每个人的隐私是行得通的,运算创造了财富,然后就失败了。这个模式已经造成了金融危机,在未来,不管是谁来执行有最多个人资料且最佳效能的电脑,或许会取得比社会上任何人都更精準的预测及操控全人类的能力,而后果也会更加黑暗。

巨量资料的真实价值

人们在推销这种蒐集、分析大量个人资料的服务功能时,往往自吹自擂、胡扯一通。容我重述听过无数次的话术:「就算不是现在,但很快地,超强的电脑就能精準预测并锁定消费者,足以让做生意就像按下开关那样容易。大型电脑的吸金能力就像磁铁吸铁屑一样。」

比方说,我看过一场简报:希望被大公司收购的某家硅谷新创公司宣称,他们能藉由分析女性点击了哪些连结,追蹤她的生理期,然后利用此资讯,在她比较容易听信广告词的期间,向她推销时尚产品与化妆品。这个策略或许有某种效果,但由于它纯粹仰赖统计分析而且缺乏科学理论支持,我们无从得知效果如何。

类似状况还有政府机关或服务某机关的私人承包商,在推销一套能蒐集民众资料的系统时,可能会天花乱坠宣称这套系统能藉由观察并分析全世界,在犯人或恐怖份子行动前逮捕他们。这类计画的术语(例如「全面资讯警觉系统」)显露出他们渴望像上帝般无所不知。

科幻小说设想这类事情已经几十年了。例如,多年前我曾协助电影「关键报告」做创意发想,该片改编自1956年狄克(Philip K. Dick)的短篇小说,里面的「预知犯罪」单位负责在罪犯伺机而动前抓住他们。但是我们要搞清楚:这并不是蒐集、分析资料的巨型系统实际在做的事。

创造这类系统的人希望有一天后设资料能支援「自动完成」演算法(猜测我们打算在智慧型手机内输入什幺的那种)的超级版。统计演算法会填补资料的空缺,藉由这种演算法的帮助,研究犯罪组织的后设资料应该是能带领我们发现新的、前所未知的关键资料。

但至少到目前为止,似乎没有证据显示后设资料探勘曾成功防止恐怖行动。我们知道的所有案例,都是专人运用智慧直接找出嫌犯这类的犯罪调查。事实上,无论是政府或私人的各式巨大云端电脑计画负责人,描述他们的工作内容时,这些宣称很快就露出破绽,尤其在仔细解读之后。是的,一旦出现可能为恐怖攻击的阴谋预兆,手边有超大资料库时,要连结线索是比较快,但是,这些资料库并没有在第一时间发现预兆。

最近有个常见的小把戏:对历史事件做事后分析,企图证明巨量资料能在秘密计画发生前就找出关键人物。例如用演算法分析与美国民族英雄列维尔(Paul Revere)同时代的人,可发现列维尔是社群网络里的核心连结人物。这个例子用的资料是在美国革命战争前,他在各组织里的会员身分,南韩首尔国立大学社会学家韩信甲示範分析一个相当小型、包含各种革命前组织的会员资料库,可筛选出列维尔这个独特的连结人物。最近,美国杜克大学社会学家希利(Kieran Healy)也用相同事件但更加多元化的资料库,独立推导出类似结果。

当然,列维尔就在那里,在连结其他人的各群体核心,上述的分析结果对后设资料在安全领域的应用是个好宣传。不过,要相信这种研究能在事件发生之前做出预测,还有许多因素要考虑。

列维尔显然地位特殊、是某事的枢纽,然而,由于缺乏历史背景,我们便无从知道那是什幺事。例如,就连某个能取得最棒啤酒的人,位居群体核心的指标可能也会指向他。后设资料只有在资料来源提供背景资讯时才有意义,统计及图形分析无法取代事情的来龙去脉,虽然它们总是看似能暂时性的取代。

危险的是,巨量资料统计会创造一种「自动安全感产生机」的假象,就像华尔街一直在追求的「保证赚钱机」一样。我们个人生活的隐私资讯,正以惊人的量被储存、分析及运用,却尚未有合理使用的範例。(待续)

相关阅读