区块链如何激励非理性人类?是时候引入行为经济学了

2009年,中本聪设计了比特币,想要把不同计算机的激励措施匹配起来。2018年,我们已经在建设数十亿美元的 区块链 项目,鼓励人们使用同一套原则。我们预测会出现有效的市场,预测人群是有智慧的。然而,倘若人群不那么聪明,又该怎么办呢?


比特币 式的加密经济学激励设计,是一种全新的经济设计范例。它已经实现了不可思议的成就,成为了世界上第一个被广泛使用的数字货币


近年来,这一范例变成了“终极高招”,对互联网世界产生了深远的影响。它向我们承诺:通过在规划和预测中采用激励措施,来构建令人惊叹的未来技术。


许多项目都采用了这种激励机制:在计划、预测方面有Gnosis、Augur;在社会媒体方面有Steemit;在声誉、管理、自组织方面有Colony、Boardroom、Democracy.Earth;在数据协同与数据洞察方面有Ocean、Numerai等。


然而,不论是简单的激励机制,还是从简单机制改造过来的复杂机制,目前都是假定人们一定会作出理性的决定,会采取产出最多的行动,也会合力创造有效市场。但行为经济学观点认为,从经济学角度说,集体智慧往往不那么聪明。


行为经济学教导我们说,人类作的决定,其绝大部分都是基于简单的心理捷径与“拇指规则”(译注:单凭经验做事,不一定准确),在通常情况下一般是正确的;但在边缘案例中,却经常大错特错,例如开车、选举,或在复杂金融市场中交易。


这些现象在现实生活中有着大量的记载。本文主张,目前的加密经济学,对行为因素和心理学的关注还远远不够。我们呼吁,那些人类现实经济行为的专家,例如公共政策专家、行为经济学家、社会学家,要尽快参与那些加密经济学体系的设计团队,从而确保长期的实用性、可行性、成功。


引言: 比特币 、行为经济学、加密经济学


区块 链 中,激励设计的概念最早来自 中本聪 的原始 比特币 白皮书。我们也不妨从事情的起源—— 比特币 说起。


Andreas Antonopoulos制作的图书和视频对此进行了很好的总结。 中本聪 用激励设计是为了达到一个前人从未实现的目标:创造一种科学上可靠的、安全的、去中心化的 数字货币 。 中本聪 的设计,能够激励矿工确保网络安全,并使协议的正常操作摆脱缺点。此外,还能够协调所有利益相关者的激励措施,这些人包括矿工、用户,开发者,都对这个生态系统有所贡献。设计的本质是开源的,能确保有组织的攻击变得不划算,方法是允许利益相关者意识到攻击,并叛逃到其他的链。


中本聪 为“拜占庭将军问题”(Byzantine Generals’ Problem)找到了一个聪明的对策论解决方案,方法是只要将军忠诚,就给将军发工资,但如果将军企图叛变被发现,就扣掉工资。


从历史的角度看, 中本聪 的对策论假定非常温和,温和得令人惊讶。只要有51%矿力合作起来,协调以扰乱 比特币 ,就能成功达到目的。最关键的是, 比特币 的安全并不依赖任何“理性经纪人”假定,这一假定认为人类都是不留情面追求最优解的人,而且极端理性。现实中,哪怕人们十分懒惰,哪怕有些人组成了阴谋集团, 比特币 系统依然能保持安全。与某些现代假设,例如Steemit、Augur相比, 比特币 的假设更加现实,争议也比较小。(此外, 比特币 的安全保证,相对来说很强,而且在数学上得到了证实。)


自从2009年以来, 区块 链 激励设计已经成熟了许多。今天的 区块 链 体系找到了多种更加聪明的方式,把激励结构用于更加复杂的体系:


Zcash和其他加密货币,也具有先驱 比特币 的基本激励结构,以太坊和其他二代 区块 链 体系也是如此。


Gnosis, Augur和其他预言市场,试图用一种价格发现机制,达到预测未来的目的:激励用户试图准确预测未来,而且根据这些预测而打赌。


Steemit激励用户贴出有趣的花边新闻【tidbits】,并且/或者为其他人的帖子质量进行诚实的投票。其他的声誉系统(reputation systems)激励用户为声誉较好的演员投出赞成票,从而创建了一种人类“事实上的声誉系统”的 区块 链 版。(到目前为止,还没有人证实自己的声誉。)


Numerai激励数据科学家设计出优秀的算法,用于金融市场的贸易。


Futarchy 激励用户为良好的决定而打赌。


Ocean激励用户为优秀的数据集(datasets)而打赌,并为现有的数据集提供附加价值。(想一想Numerai遇见Gnosis)

Polkadot激励那些利益相关者在网络中作出诚实决定,即验证者(validators)和校对者(collators);激励他们寻找糟糕的演员,即钓鱼者(fishermen);并决定哪个人值得信任,即提名者(nominators)。


激励设计是 区块 链 系统的杀手锏


总体来说,激励设计已经渗透到很多激动人心的应用程序当中,而且被视为 区块 链 系统的杀手锏之一。有些最重要的 区块 链 创新者在文章中抓住了这一点,例如Trent McConaghy就在最近一篇博客文章写道:


“ 区块 链 社区明白, 区块 链 可以帮助协调整个持币着部落的行为,因为每一名持币人都绑定了自身利益。但与简单的激励措施相比, 区块 链 有着更为普遍的好处:只要奖励他们代币,你就可以让人们做各种各样的工作(这些工作可能反过来又会增加代币的价值)。 区块 链 就是一种激励人们的机制。


我认为,这是一种超能力。 区块 奖励功能决定了你想要让网络参与者们做些什么。于是问题来了:你想让你的网络里的人做些什么?这又引发一个关键问题:你激励网络行为的水平如何?


这是细节里的魔鬼。我们果真知道怎么设计激励措施吗?”


从 中本聪 到Steemit


自从最初 比特币 模型以来,激励设计就通过某些方式得到扩展。图表1用定性的方式画出了目前高度扩展的激励设计分布图,横轴代表的是自主性,纵轴代表的是行动空间。


图表1:各个去中心化系统的定性散布图(Qualitative scatter plot ),显示它们的自主性(automatibility),以及行动空间(Action Space)大小


“自动性”轴描述的是人类利益相关者追随激励措施要花费多少手工劳动。


简单说来,在 比特币 系统当中,作决定的是计算机,而在Steemit系统当中,作决定的是人类。详细一点说, 比特币 矿工连手指都不必动一下就能追随激励措施,只要让计算机诚实地挖矿就行了。而Augur、Steemit系统却依赖人类手动作出预测,写帖子发表,并得到奖励。还有一种位于中间的系统,Polkadot和Proof-of-Stake,要求人类假定他们信任的那些实体不会与系统对抗。


“行动空间大小”的轴,则描述了人们为了让奖励最大化,必须探索多少种可能的行动。


Steemit系统当中,优质帖子数量可能有多少,可能的行动就有多少;而 比特币 系统当中,有效的行动空间只有一种行动:诚实 挖矿 ,诚实校验。Numerai系统当中,系统请一个人类设计一种优秀算法,然后根据算法的表现好坏给这个人类相应的奖励。


比特币 激励设计不仅需要科学家,还需要公共政策专家


由此我们可以看到,激励设计已经扩展到在广阔的行动空间中激励人类内在行为的程度(例如写博客文章)。


人们相信,激励措施力量很大;而激励措施又在加密经济中分布极广。 比特币 的优秀表现,已经给这种信念下了定论。


比特币 说明,位于图表左下方部的 区块 链 项目值得信任;但如今,范例已经大大扩展,乃至图表右上方的各个系统都分享了这种可靠性。最偏右上方的Steemit等系统也被人们作为一般性的基于 区块 链 的加密经济系统对待了,而不认为它们与 比特币 有一丁点不同;但实际上,却一直没有评估措施确认它们的基本加密经济模型是否合格,能经受住时间考验。


这就说明,创造实用激励设计所需的各种跨学科技巧,实际上是缺乏的。这些技巧包括:机械设计、密码学、工程学,但也包括行为经济学和人文学科。我们需要理解人类行为各种复杂、微妙、不合逻辑的方式。 区块 链 激励设计不仅需要科学家,还需要公共政策专家。


难点在于,人类并不是完全理性的演员。现实中的人类经常不作那些最优化的事情。有个经典例子,就是“最后通牒博弈”(the Ultimatum Game):


给张三一百块钱,让张三拿出其中的一部分给李四,李四必须作出两个选择:接受或拒绝。如果李四拒绝,两人都只能离开,完全拿不到钱。如果李四接受,那李四就能拿到这部分钱,张三也拿到剩下的一部分。游戏理论告诉我们,李四最理性的策略是永远接受,哪怕张三只给一分钱也应该接受。


但是在现实中,只要给李四的钱少于30元,李四一般就会拒绝。而且,张三一般给出的至少20-30元。因此经验主义环境下两名玩家采取的策略都远远不是最优策略(就游戏理论而言)。我们可能会预测这样的效应在Steemit一类加密经济系统的复杂环境中还会重复。


于是我们将面临一个很大的问题:如果基于加密经济系统的设计规则包括了很大一部分人类因素,那么要如何做才能防止非理性入侵这些规则呢?


特别是,将这种“行为主义”思考应用于以上图表的两个轴之后,我们认为:


激励系统的自动性越小,就越难设计,也越多包含人类非理性带来的风险,例如确认偏误(confirmation bias)、沉没成本误区(sunk cost fallacies)、各种趋同思维(Groupthink)。


行动空间越大,就越难以最优化,难以作出正确的选择。计算机可以经常搜索很大空间,但费用则难以承受。人类的情况就糟糕得多。人类讨厌被迫选择的情况,于是搜索空间越大,认知思考成本(Cognitive Deliberation Cost)就越高,结果就越差。


因此,在“风险较低空间”(图标上的粉色区域)之外的系统当中,演员本身会难以判断,哪些行动会让自己利益最大化。而且,系统设计者面临的挑战还要困难得多。随着参与者越来越难以决定采取什么行动,设计者设计稳定而可预测的系统难度会成指数上升。哪怕在最好的条件下(个人玩家的行动空间很简单,容易分析、优化),想要应用机械设计来创造“在荒野中”运行良好的系统,也仍然是极为困难的任务。行动一旦难以优化(因为行动将会位于“风险较低空间”之外),机制的设计者就几乎没有一点机会了。


建设牢固的激励系统?


目前为止,我们已经确认:复杂的加密经济系统,其设计十分困难,而且人们还没有理解清楚。因此,加密经济系统大多数都可能一开始就千疮百孔,而且必须通过重复的迭代实现改进。


但这不正是技术系统一直以来的基本情况吗?自从人类学会用火,掌握文字以来,我们走过了建设国家的阶段,走过了太空竞赛的阶段,现在又开始运用计算机、软件、网络。这些技术一开始全都存在严重问题,后来随着时间慢慢改进了。


不幸的是, 加密货币 和 区块 链 体系的现状,并不像历史上其他科技那样容易实现迭代改进。


第一, 区块 链 系统在设计上就注定了一旦应用则难以变化。任何变化(例如分叉)都需要大多数利益相关者的全力支持,因此任何变化都必须对抗各种实在的既得利益(例如, 比特币 致命的 区块 大小之争)(Block Size Debate)。


第二,复杂的 区块 链 系统一定存在各种弱点、容易受攻击的地方,还有设计缺陷,而这些缺陷直到系统广泛应用之后才能暴露出来。到了这个时候,已经存在数十亿美元的市场资本和网络效应使得既得利益更加强大,更难以对抗。一个用户的社区只要从某个设计缺陷得利,就会在激励措施的引导下宣称,这是功能,不是缺陷。这是公共政策一个尽人皆知的难题,在去中心化系统兴盛以后,也会显现出来。


火上加油的是,目前呈指数增长的机制,可能会隐藏以上说到的许多问题。系统的代币价值若能呈指数增长,比起增长停滞的情况,其行为就能减少攻击性,增加友好程度。这意味着 区块 链 的价值增速一旦放缓,我们将看到可能造成恶性循环的下拉效应。功能失调的治理可能会使这个循环更加恶毒。


总结:考虑人性,保持谨慎


优秀的激励系统,哪怕在最好的条件下也极难创造出来。在 区块 链 系统之下(编码就是法律,刻在石碑上,应用于一大群使用假名的利益相关者),优秀的激励系统就更难创造了。


比特币 的成功并不能让我们满意,也不能让我们乐观。我们的激励设计范例必须极端谨慎,慢慢成长,处在各种检测与平衡措施构成的框架中。新的经济体制一旦设计有误,就像前一次金融危机一般,只要系统开始衰退,就会造成雪崩一样的效应,让灾难更长也更深入。


我们必须头脑清醒,认为 区块 链 经济也可能面临它取代的旧体制面临的同样结局。不能因为呈指数的增长和短期的收益而变得大胆,无视掉整个模式在长期方面的不稳定。历史上,这种情况曾经导致市场外部的干预(然而, 区块 链 又处于无国界的状态,因此用纳税人的钱救市可能并不那么方便)。


这个“美丽新世界”的先知和预言家们,在从头创建新经济体制的时候,将会得到足够的建议,小心谨慎地行事。过去无数失败的经济系统的废墟当中,还有无数先例和历史数据可供我们学习。


区块 链 系统拥有前所未有的潜力,能够解决世界上一些最紧要的问题:通过将激励措施修改一致,通过扰乱既得利益,我们就能够朝着好的方向改造社会。这个机会一定不能错过!

本文来自投稿,不代表【新财经-http://www.xcaijing.com】立场,如若转载,请注明出处:【当前页面链接】