编译自:Andy Matuschak and Michael Nielsen, “How can we develop transformative tools for thought?”, https://numinous.productions/ttft, San Francisco (2019).
现代计算起源神话的一部分是1960年代和1970年代黄金时代的故事。在这个故事中,有远见的先驱者追求一个梦想,在这个梦想中,计算机使强大的思考工具成为可能,即增强人类智能的工具。其中一位先驱者,艾伦·凯,在谈到个人电脑的潜力时,总结了这个梦想的乐观情绪:“使用个人电脑将会改变整个文明的思维模式(the very use of it would actually change the thought patterns of an entire civilization)”。
这是一个鼓舞人心的梦想,它促成了现代交互式图形、窗口界面、文字处理器和其他许多东西的出现。但回顾过去,我们很难不感到失望,因为计算机还没有像语言和写作等更古老的思维工具那样具有革命性。如今,在科技界,对过去的先驱性梦想说些空话是很常见的。但是除了怀旧之外,几乎没有坚定的努力去追求变革性新思维工具的愿景。
我们认为现在是再次努力实现这一愿景的好时机。在这篇文章中,我们概述了一套我们认为可以用来帮助开发变革性思维新工具的想法。在文章的第一部分,我们描述了一个我们已经建立的实验原型系统,一种旨在增强人类记忆的助记媒介(mnemonic medium)。这是一个正在进行的项目,详细描述了令人鼓舞的进展以及许多挑战和机遇。在文章的第二部分,我们拓宽了关注的范围。我们还设计了其他几个原型系统。我们提出了这样一个问题:为什么科技行业在开发这种变革性思维工具的愿景方面做得相对较少?
在开头我们提到了一些过去的先驱者。除此之外,还有许多人 — — 伊万·萨瑟兰(Ivan Sutherland)、西摩·帕尔特(Seymour Papert)、万尼瓦尔·布什(Vannevar Bush)等等。网上对这些人有许多当之无愧的崇敬。但是这种崇敬可能会转变成对美好旧时光的不健康的崇敬,认为先驱者已经做了许多工作,而今天能做的事情较少了。是的,那些先驱者们做了令人惊叹的事情,并且可以说他们的工作方式是工业和学术界的现代技术专家都不具备的。但是他们也犯了错误,并且对今天可用的强大思维一无所知。因此,这篇文章的两个部分的主题都是找出那些以前不为人所知或没有付诸行动的强有力的想法。基于这种认识,我们相信,今天会有一系列非凡的机会。
“思维工具”(tools for thought)这个词既不会从舌头上滚落下来,也不会从键盘上滚落下来。此外,“工具”一词意味着某种狭窄。艾伦·凯认为,一个更强大的目标是开发一种新的思维媒介。比如说,Adobe Illustrator这样的媒介与Illustrator包含的任何单个工具本质上都不同。这样的媒介创造了一个强大的沉浸式环境,在这样的环境中,用户可以有新的想法,这些想法以前是不可能的。通俗地说,在这样一种媒介中所能表达的思想范围,是这种媒介中基本对象和行为的一种突现性质。如果选择得当,这种媒介将拓展人类思维的可能范围。
话虽如此,自艾弗森(Iverson)在20世纪50年代和60年代引入“思维工具”一词以来,“思维工具”一词已被广泛使用。因此,我们应该把“思维工具”作为我们的格言,同时允许我们自己去探索更广阔的领域,偶尔在适当的时候,我们也会更喜欢用“媒介”(medium)这个词。
让我们回到开头的那句话,关于改变“整个文明的思维模式”。这听起来很可笑,是一种科技预言。当然,这种变化在人类历史上发生过多次:语言的发展,文字的发展,以及我们其他最强大的思维工具。而且,无论是好是坏,在过去的60年里,计算机确实影响了我们文明的思维模式,而这些变化似乎只是个开始。这篇文章对理解这些变化是如何发生的,以及还有什么是可能的,做出了小小的贡献。
音乐家兼喜剧演员马丁·马尔(Martin Mull)曾说过,“用写作来描述音乐就像是用舞蹈来表现建筑一样”(writing about music is like dancing about architecture)。同样,用写作来描述思维工具也有其固有的不足。在某种程度上,这样的工具是成功的,它扩展了你的思维,超越了现有工具,包括写作所能达到的。工具的变革性越强,差距就越大。相反,差距越大,新工具越难用写作来描述。但是写作能做的,也是我们写这篇文章的原因,是作为一个引导。这是一种识别杠杆点的方法,可能有助于开发新的思维工具。让我们开始吧。
第一部分:记忆系统
介绍助记媒介
很少有比量子计算和量子力学更难的学科了。事实上,大众媒体经常引用著名物理学家的名言来取悦(并恐吓)读者:“任何认为自己了解量子力学的人,其实并不了解量子力学”(anyone who thinks they’ve understood quantum mechanics has not understood quantum mechanics)。
是什么让这些科目变得如此困难?事实上,对于具有技术背景的人来说,许多潜在的想法并不太复杂。人们必须快速地学习量子比特、矩阵符号、哈达玛门、受控非门,以及许许多多其他抽象的、不熟悉的概念。即使他们一开始能跟上,理解较晚的思想需要熟练掌握所有较早的思想。这势不可挡,最终令人沮丧。
作为一项实验,我们开发了一个网站,Quantum Country,探索一种解释量子计算和量子力学的新方法。表面上,Quantum Country似乎是对这些主题的传统论文介绍。这里有文字、解释和方程式,就像任何其他技术论文一样。这里有一段摘录:
但这不是一篇传统的文章。相反,Quantum Country是一种新型助记媒介的原型。令人向往的是,这种助记媒介让用户几乎毫不费力地记住他们所读的内容。这听起来像是一个不可能实现的愿望。认知科学家对人类如何储存长期记忆有相当多的了解,这似乎是合理的。事实上,他们所知道的几乎可以提炼成一个可操作的配方:遵循这些步骤,你就可以记住你所选择的任何东西。
不幸的是,现有媒介对这些步骤的支持很差。有可能设计一种更积极支持记忆的新媒介吗?也就是说,媒介会嵌入(理想情况下,几乎毫不费力地)记忆中的关键步骤。如果我们能做到这一点,那么记忆就不再是一种偶然事件、随机事件,助记媒介将使记忆成为一种选择。当然,就其本身而言,学习诸如量子力学和量子计算这样的学科并不容易 — — 学习这些学科不仅仅是记忆。但这将有助于解决一个核心难题:大量新概念和符号。
事实上,有许多方法可以重新设计文章媒介来做到这一点。在向你展示我们的原型之前,请暂停片刻,考虑以下问题:你如何建立一个媒介来更好地支持一个人对他们所读内容的记忆?什么样的互动可以轻松愉快地帮助人们巩固记忆?更广泛地说:人们能记住两倍、十倍的东西吗?这会对它们的有效性产生长期影响吗?
让我们来描绘一下Quantum Country的用户体验。在撰写本文时,该网站包含三篇助记文章(即助记媒介的特定实例)。我们将专注于介绍性文章“非常有趣的量子计算”(Quantum Computing for the Very Curious)。在这篇文章里有112个关于这篇文章的问题。用户被要求创建一个账户,并在阅读时被问及是否记得这些问题的答案。下面是用户回答三个问题时的交互效果。
https://numinous.productions/ttft/assets/qc_interaction.mp4
请注意,这种互动发生在文章本身的文本中。这是一个缩小的视图,所以你可以看到这样的问题是如何被上下的文本包围的:
我们使用“卡片”(cards)来描述这些将问题和答案配对的界面元素。
当然,对于长期记忆来说,仅仅测试一次是不够的。因此,在第一次阅读文章的几天后,用户会收到一封电子邮件,要求他们进行复习。在复习阶段,他们会再次接受测试,测试方式与上面显示的类似。然后,通过几天或几周的反复复习,人们把这些问题的答案巩固到他们的长期记忆中。
到目前为止,这看起来只不过是一篇整合了老式抽认卡的文章。但是请注意卡片底部显示的时间间隔:
https://numinous.productions/ttft/assets/qc_icons.mp4
高亮显示的图标表示在用户再次测试问题之前的时间间隔。问题以“文本内”的时间间隔开始,这意味着用户在阅读文章时正在接受测试。如果用户记住了问题的答案,那么这个时间就会增加到5天。然后间隔在每次成功的复习之后继续上升,从五天到两周,然后是一个月,依此类推。在5次成功的复习之后,间隔是4个月。如果用户在任何时间点不记得,时间间隔就会下降一层,例如从两周下降到五天。
这利用了关于人类记忆的一个基本事实:当我们被反复测试一个问题时,我们对答案的记忆会变得更强,而且我们可能会保留更长时间。这种指数式的增长也许看起来无害,但却是革命性的。这意味着相对少量的复习将使用户能够记忆多年。复习一个典型问题所需的时间仅为几秒钟,这意味着用户只需花费几分钟就可以实现长期的记忆。相比之下,传统的抽认卡需要几个小时的复习才能达到同样的持久性。指数时序安排要高效得多。
原型助记媒介的早期影响
尽管Quantum Country还处于早期阶段,但我们可以开始看到助记媒介的一些影响。下图显示了每个用户保留答案的情况,对照助记文章中每个问题被复习的次数:
这张图需要一点时间来解释。我们所说的一张卡的“留存率”(demonstrated retention)指的是一张卡的成功复习和之前的复习之间的最长时间。更具体地说,考虑第6次重复(在水平轴上)。在这一点上,一个用户已经复习了这篇文章中的所有112个问题6次了。纵轴表示所有卡片的累计留存率,每个蓝点代表一个重复次数达到6次的用户。
例如,在重复6次之后,我们从图表上可以看到大多数用户的留存时间都在6000天左右。这意味着论文中每个问题平均需要6000/112 ~ 54天。从直觉上看,这似乎很好 — — 如果你和我们一样,读了几个月的东西之后,你就只有模糊的记忆了。相比之下,这些用户以较低的时间成本完成了112个详细问题近两个月的记忆。
此外,你可以看到用户留存率随着卡的复习次数呈指数增长。在第一次复习之后,每张卡的平均留存时间只有2天多一点。但到第6次复习时,这一数字上升到平均54天的保留时间。这通常需要大约95分钟的总复习时间来完成。考虑到论文大约需要4个小时来阅读,这意味着少于50%的时间开销可以为论文中几乎所有重要的细节提供数月或数年的记忆。
这就是“间隔重复”最大的、违反直觉的好处:你付出的努力越多,得到的回报就越大。平均而言,在复习上每多花一分钟就会带来越来越多的好处。这与我们在生活中的大多数经历形成了鲜明的对比,在这些经历中,我们的回报在递减。例如,通常情况下,如果你将阅读时间增加50%,你所期望的额外阅读时间不会超过50%,甚至更少。但是对于助记介质,当你将阅读时间增加50%时,你可能会得到10倍的效果。当然,我们并不是指字面上的数字。但它确实传达了获得强非线性回报的关键思想。这是媒介质量的变化。
这种延迟的好处使助记媒介在许多方面与众不同。另一个是:大多数在线媒介使用短期参与模式,使用操作性条件作用的变化来驱动用户行为。这是通过Twitter、Facebook、Instagram和许多其他流行的媒介形式实现的。助记媒介更像是冥想 — — 在某些方面,它是反产品,因为它违反了硅谷的许多传统智慧 — — 因为收益被延迟了,很难立即产生任何感觉。的确,对于助记媒介,延迟越大,获益越多。
这些只是初步结果,还需要更多的调查。人们自然会想,果我们对复习时间表采取更积极的态度,将初始复习间隔设置为(比如)2个月,会发生什么?如果用户能够可靠地保留到那个时候的信息,那么图表会从很高的位置开始,我们就不会看到指数。我们需要调查这些和许多类似的问题,以便更好地理解用户的记忆。
用户的早期反馈让我们谨慎乐观地认为,他们发现助记媒介很有用。2019年5月,我们中的一个人在推特上发布了一个简短的帖子,解释了量子隐形传态的技术细节。Quantum Country的一位用户回复了帖子:
我只完成了第一个Quantum Country课程(到目前为止),但我发现它很了不起,我可以查看证明并跟随它,知道这一切意味着什么。这就像《黑客帝国》里的尼奥告诉墨菲斯,‘我知道量子计算’。
一位有着更丰富量子计算经验的用户写道:
我有量子信息/计算的博士学位,在阅读这篇文章之前,我已经知道了它的所有内容,但是我从给定的间隔重复抽认卡中获得的额外理解极大地提高了我对材料的理解。每个读这篇文章的人,都应该报名并尝试间隔重复。
另一位刚接触量子计算的用户告诉我们,Quantum Country “是我能想到的介绍这种材料的最好方式”。当我们问他如何使用他所学到的知识时,他解释说,当一位访客到他的公司做一个关于量子计算的技术研讨会时,他预计大约10分钟后就会迷失。然而:
哇,我实际上跟踪了40或45分钟,因为矩阵看起来很熟悉…(媒介的意思是)你一次又一次地碰到概念…它在更有效的抽象概念层次上提供交互。
网站分析显示,不断有人以我们希望的方式在稳步完成复习。在原型发布6个月后,195名用户在这篇文章中展示了至少80%的卡片保留了一个月的时间,展示了对这一过程的非凡投入。我们还没有一个准确的模型来描述这些人到底学到了什么,但是看起来似乎是要比从一篇传统的文章,甚至是一门传统的课程中学到的东西要多得多。
当然,这样的反馈和这样的结果不能全信。助记媒介尚处于起步阶段,有许多不足之处,需要在许多方面加以改进(很快还会改进)。然而,令人鼓舞的是,一些用户已经发现该媒介非常有用,并建议进一步开发和测试该媒介。至少,记忆媒介似乎是在真正帮助人们记忆。此外,它具有上述指数级增长的效率:人们学习越多,他们每分钟学习的收益就越多。
在另一个非正式的实验中,我们试图找出当用户没有被要求复习卡片时,这对他们的记忆有多大影响。为了做到这一点,我们特意对8张卡片中的一小部分进行了短暂的(两周)复习延迟。也就是说,一些用户会在第一次阅读时会看到这8张卡片,然后至少在两周内不能再重新查看它们。其他用户将继续照常学习8张卡片。通过比较这两组,我们可以估计出复习卡片对用户记忆的影响。
发生了什么事?对于那些复习被延迟的用户,准确率从91%(初次阅读)下降到87%(两周后)。这似乎是一个小的下降,但请记住,用户继续复习其他卡,这几乎肯定会放大他们的最终表现,因为这些其他卡在内容上与延迟的卡有些重叠。如果不延迟所有卡片上的复习,就很难避免这种重叠,这是用户体验中比我们想要强加的更剧烈的变化。对于那些被要求像往常一样复习卡片的用户,准确率从89%提高到96%。简短的总结是:当用户没有复习卡片时,准确率下降了4%;当他们复习卡片时,准确率提高了7%。
查看这个非正式实验数据的另一种方式是,询问哪些用户的表现得到了改善或没有改变,哪些用户的表现变得更差。事实上,每一个定期复习卡片的用户(100%)都发现他们的表现要么保持不变,要么有所提高。相比之下,用户复习被延迟中的40%,他们的表现变差了,而其余60%的表现保持不变或有所改善。
这些都是小而有希望的结果。当然,我们的实验只进行了两周,我们期望在更长时间的实验中会有更大的效果。而且,如前所述,这种效果可能会因为卡片之间的重叠而减弱。尽管如此,这个非正式的实验再次表明,助记媒介有助于人们的记忆,并建议进行更全面的研究。
尽管这些初步结果具有启发性,但还是很容易被忽视。这不就是一篇嵌有抽认卡的文章吗?当然,在某种程度上,这是正确的。同样,wiki只是可编辑的web页面;Twitter只是一种分享非常短的写作形式的方式;Facebook只是一种与朋友分享文字和图片的方式。事实上,书写本身就是在一页上排列少量符号的巧妙方式。虽然媒介可能很简单,但这并不意味着它不深奥。我们将看到,助记媒介有许多惊人的特性。事实证明,抽认卡的价值被大大低估了,在开发助记媒介方面,我们有可能比预想的要深入得多。
在我们更深入地研究助记媒介之前,让我们先提一下讨论中的一个挑战:在传达热情和那种适当评估的客观怀疑之间取得良好平衡的固有困难。一方面,如果我们对潜在的想法不感兴趣,不想发展这些热情,我们就不会建立助记媒介。为了更好地解释助记媒介,我们需要把读者带进这种思维。但在此之后,我们还需要退一步,以更怀疑的态度思考以下问题:这种媒介真的有用吗?它实际上对人们有什么影响?它能做得好10倍吗?好100倍?或者,反过来说,有没有阻滞剂使这是一个无可救药的坏主意,或者至多是个平庸的主意?无论如何,记忆在认知中扮演着多么重要的角色?到目前为止,我们一直关注媒介的热情案例,为什么人们会考虑这种设计。但是在这篇文章的后面,我们将逐渐后退,以一种更加怀疑的框架来思考。
扩大记忆系统的范围:它们可以用于什么类型的理解?
Quantum Country是记忆系统(memory system)的一个例子。也就是说,它是一个系统,旨在帮助用户轻松地将他们所学的知识整合到长期记忆中。这是记忆系统悠久历史的一部分,可以追溯到古代,演说家西塞罗(Cicero)和修辞学家昆体良(Quintilian)描述了可以用来记忆长文本的记忆技巧。
在现代,已经开发了许多记忆系统。其中比较出名的有Anki、SuperMemo、Quizlet、Duolingo和Memrise。像Quantum Country一样,每一个系统都使用增加的时间间隔来复习特定的问题。这样的系统有时被称为间隔重复记忆系统(或SRM系统,spaced-repetition memory systems)。它们通常以类似于我们对Quantum Country的解释的方式被证明是合理的:每次复习的一些概念逐渐增加了记忆的巩固强度。
SRM系统在语言学习中应用最为广泛。例如,Duolingo宣称每月有2500万活跃用户。关于成功的报告有好有坏。一些认真的用户对Duolingo的成功很感兴趣。但是其他人发现它的效用有限。当然,该公司吹捧的研究显示,它非常成功。在我们看来,Duolingo和类似的系统作为(但仅仅是)一个严肃的语言学习项目的一部分,对许多用户来说是有用的。
用于语言以外用途的记忆系统呢?Quizlet很受欢迎,每月有5000万活跃用户。它在课堂上被广泛使用,尤其是对于简单的陈述性知识 — — 美国总统名单、国家首都等等。Anki和SuperMemo似乎最常用于类似的简单陈述性知识,但是它们的活跃用户基数比Quizlet小得多。
激发Quantum Country的一个想法是,记忆系统不仅仅对简单的陈述性知识有用,比如词汇和首都列表。事实上,记忆系统对于掌握抽象的概念知识非常有帮助,这些知识是学习量子力学和量子计算等学科所需要的。这在一定程度上是通过许多详细的策略来构造能够编码这种理解的卡片。但是,更重要的是,这是有可能的,因为助记媒介将间隔重复嵌入到叙述中。这种叙事嵌入使得上下文和理解以其他内存系统中难以实现的方式构建成为可能。
其他人也开发了使用记忆系统获取抽象概念知识的方法。或许最引人注目的是,SuperMemo系统的创始人彼得·沃兹尼亚克(Piotr Wozniak)写了大量关于他使用记忆系统的许多巧妙方式的文章。其他几个记忆系统的专家用户也开发了类似的策略。然而,运用这些策略需要相当的技巧。实际上,这种技巧障碍意味着只有很少一部分人使用这些策略。
相比之下,在Quantum Country中,专家负责写卡片,他不仅擅长论文的主题,还擅长对抽象概念知识进行编码的策略。因此Quantum Country提供了一种更可扩展的方法来使用记忆系统来进行抽象的概念学习。从某种意义上说,Quantum Country旨在扩大用户能够理解的主题范围。在这一点上,它与之前的所有记忆系统有着非常不同的期望。
更一般地说,我们认为记忆系统比以前实现的空间要丰富得多。现有的记忆系统仅仅触及了可能的表面。我们已经把Quantum Country看作是一个记忆实验室。也就是说,这个系统既可以用来更好地理解记忆是如何工作的,也可以用来开发新的记忆系统。我们想回答以下问题:
- 除了过去系统的简单、陈述性知识外,还有哪些新的方法可以应用于记忆系统?
- 通过记忆系统形成的理解有多深?什么样的模式可以帮助用户尽可能加深理解?
- 我们能在多大程度上提高人类的记忆能力?有多轻松?优点和缺点是什么?
- 也许有一天大多数人会有一个常规的记忆练习,作为他们日常生活的一部分?我们能让记忆成为一种选择吗?在某种意义上有可能解决记忆问题吗?
在接下来的几节中,我们将概述一些关于如何开发记忆系统的想法。我们将看到,记忆系统只是更大图景中的一小部分。认真开发记忆系统不仅有可能带来一种或多种变革性思维工具,我们还相信它将教会我们许多关于开发这类工具的一般问题。
改进助记媒介:制作更好的卡片
在写助记文章时,很容易把卡片的内容看得很随意。毕竟,卡片只是一个问题和一个答案,每个答案都包含一些文字,也许是一个图形。它们应该很容易写吧?
虽然这样想很诱人,但却是错误的。事实上,卡片是助记媒介的基本组成部分,而写卡片最好被认为是一种开放性的技能。如果做得不好,那么助记媒介的效果也不好。如果你把它做得非常好,那么助记媒介的效果就会非常好。通过发展写卡片的技能,就有可能扩大这种媒介的可能性。
一个有用的比较是与书面散文中的句子进行比较。对于初学写作的人来说,随意对待句子是很有诱惑力的。但是在一个伟大作家的手中 — — 比如纳博科夫 — — 句子可以发展成一种艺术形式。在书写助记媒介的卡片时,怎样才能获得精湛的技巧呢?
写卡片是一项如此丰富的活动,这并不是一个显而易见的推论。我们中的一个人写了一万七千到六千字的文章,主题主要是如何写好卡片。当他开始写作时,他没有意识到这个主题;只有在回顾卡片书写是多么丰富的时候才变得清晰。事实证明,回答“如何写好卡片?”这需要你认真思考你的知识理论以及如何表达它,以及你的学习理论。这些理论越好,你的卡片就越好。难怪这是一个丰富的、开放式的问题!
综上所述,让我们对写好的卡片做一些具体的观察。虽然下面的具体例子相对来说比较老套,但它们应该让你对改善助记媒介中出现的深刻问题有一些感觉。我们将从我们在Quantum Country写卡片时使用的三个原则开始。请注意,这只是众多原则中的三个 — — 关于卡片构造的良好原则的更详细的讨论可以在增强长期记忆(Augmenting Long-term Memory)中找到。
- 大多数问题和答案都应该是原子性的:在他个人记忆实践的早期,我们中的一个正在学习Unix命令在文件系统中创建链接。他在自己的记忆系统中输入了以下问题:“如何创建从链接名(linkname)到文件名(filename)的软链接”。连同相应的答案“ln -s filename linkname”。这看起来是个好问题,但是他经常忘记答案。为了解决这个问题,他将卡片重构为另外两张原子卡片。一张卡片:“创建软链接的基本命令和选项是什么?”(A: “ln-s”)。第二张卡片:“当创建一个软链接时,链接名和文件名的顺序是什么?”(A: “ filename linkname “)。把卡片分成更多的原子碎片,把一个他经常出错的问题变成两个他经常正确的问题。似乎原子问题越多,他忘记的东西就越容易被发现,这就为提高记忆力提供了一个更好的工具。原始卡片呢?最初,他删除了它。但他最终还是把这张卡片加了回去,用同样的问题和答案,因为它有助于将理解整合到更多原子卡片中。
- 在一篇助记文章中,确保开头的问题是琐碎的:这有助于许多用户意识到他们在阅读时注意力不够集中。这是我们发表第一篇Quantum Country论文时的发现。考虑到用户可能会在新界面上遇到困难,我们故意让文章的前几个问题变得非常琐碎 — — 有点像量子的“2+2 =?” — — 这样他们就可以专注于界面。令我们惊讶的是,用户在这些问题上表现不佳,比他们在后面的问题上表现得更差。我们目前的假设是,当用户不能正确地回答最初几个问题时,它就起到了唤醒的作用。这些问题显然很简单,他们意识到自己在阅读时并没有真正集中注意力,因此后来变得更加小心了。
- 避免孤行卡片:这些卡片与其他任何东西都没有紧密联系。为了说明起见,假设你想学习非洲地理,有一个问题:“摩洛哥在非洲争议的领土是什么?”(A:“西撒哈拉”)如果你对西撒哈拉或摩洛哥一无所知,也不知道为什么会有争端,那么这个问题就成了孤行,与其他一切都脱节了。理想情况下,你会有一个紧密相连的问答网络,一切都以惊人的方式交织在一起。
最终,我们想提炼出一套有用的实用原则和习惯用法,帮助写好卡片,更一般地说,写好助记文章。从理想的角度来看,这样一套原则和习惯用法会很像《风格要素》(The Elements of Style)(或一些类似的散文建议书),并且会帮助其他人学会写高质量的助记文章。
当我们第一次描述上面的Quantum Country时,我们用简单的间隔重复模型解释了它:增强记忆的巩固力度,从而增加复习之间的时间间隔。这是一个有用的简单模型,但有可能造成一种误导的印象,即这就是系统中正在发生的一切。事实上,为了使助记媒介有效工作,间隔重复必须与许多其他思想配合使用。我们刚才描述的三个思想 — — 问题和答案的原子性、使早期问题变得琐碎、避免孤行卡片 — — 只是助记媒介中使用的几十个重要想法中的三个。我们不会在这里列举所有其他想法 — — 这不是本文的目的。但是我们想强调这一点,因为人们通常有一个简单的模型“好的记忆系统=间隔重复”。这是错误的,而且是一种毫无帮助的思维方式。
事实上,以这种方式思考是间隔重复记忆系统经常失败的原因之一。我们经常遇到这样的人:“哦,我觉得间隔重复听起来很不错,我试过Anki[等等],但是对我没用。”稍微深入一点,就会发现这个人在以一种肯定会失败的方式使用他们的记忆系统。他们会写糟糕的问题,或者用它来学习他们不关心的话题,或者犯一些其他的错误。他们有点像一个认为“学习吉他听起来很棒”的人,拿起它半个小时,然后放下,说它们听起来很糟糕,因此是一种糟糕的乐器。当然,真正的问题是吉他和记忆系统都是需要时间来培养的技能。但是,尽管如此,我们还是希望尽可能多地为媒介提供支持。理想情况下,即使是新手也会从助记媒介中获益良多。这意味着建立许多超越简单的间隔重复模式的想法。
我们中的一个人曾断言,在间隔重复记忆系统中,用户需要自己制作卡片。原因是非正式的:用户在使用他人制作的卡片时,经常报告不满意和糟糕的结果。原因似乎是,制作卡片本身就是一种重要的理解行为,有助于记忆材料。当用户使用别人制作的卡片时,他们就失去了这些好处。
Quantum Country违反了这一原则,因为用户没有制作卡片。当我们开始研究Quantum Country时,这种违反是一个主要的问题。然而,初步的用户反馈表明,它已经充分发挥了作用。一个可能的解释是,如上所述,制作好的卡片是一项很难掌握的技能,因此,用户因为没有自己制作卡片而失去的东西,可以通过使用质量可能比自己制作的卡片高得多的卡片来弥补。在未来,有必要对这个问题进行更深入的研究,不仅要超越非正式的模型来理解它,而且要探索如何从主动制卡中获益。
以上我们讨论了好的问答结构的三个原则。当然,也有可能对卡片本身的性质进行更多的结构性修改。这里有三个问题暗示着这方面的实验:
- 我们如何确保用户不仅仅学习问题的表面特征?Quantum Country的一个问题是:“谁在用量子计算机模拟量子场论方面取得了进展?”答案是:“约翰·普雷斯基尔和他的合作者”。这是唯一的“谁……?”的问题,许多用户很快就能从“谁……?”,然后鹦鹉学舌地回答问题,而不深入思考问题。这是记忆系统中常见的故障模式,对理解是致命的。我们计划很快尝试的一种回答是,以多种不同但相当的形式提出这个问题。所以用户首先看到的问题是“谁取得了进步[等等]?”但当这个问题第二次以填空题的形式出现时,“ _ _ _和他的合作者在使用量子计算机模拟量子场论方面取得了进展。”诸如此类,问题的多种不同形式,设计成让用户必须始终深深地理解问题的含义,而不是它的表面现象。最终,我们希望开发一个技术库,用于识别这种表面特征学习模式何时出现,并对其进行纠正。
- 当用户忘记问题的答案时,如何才能最好地帮助他们?假设一个用户不记得问题的答案:“谁是美国的第二任总统?”也许他们以为是托马斯·杰斐逊,但惊讶地发现是约翰·亚当斯。在一个典型的间隔重复记忆系统中,这可以通过减少时间间隔来解决,直到问题再次被复习。但是,为了帮助用户上下文而设计的问题可能更有效。例句:“乔治·华盛顿的副总统是谁?”(A:“约翰·亚当斯”)。实际上,可能会有一系列的后续问题,都是为了帮助更好地将最初问题的答案编码到记忆中。
- 如何在助记媒介中对故事进行编码?人们经常发现某些想法在故事形式中最引人注目。这里有一个简短而有趣的例子:你知道吗,在iPhone早期,史蒂夫·乔布斯(Steve Jobs)曾积极反对App Store的发展?相反,它得到了苹果另一位高管斯科特·福斯特尔(Scott Forstall)的支持。这样一个故事所承载的力量不仅仅是陈述性的事实。抽象地说,即使是新技术背后的梦想家也常常看不到它们的许多用途,这是一回事。听到史蒂夫·乔布斯与斯科特·福斯托尔就一项被认为是乔布斯发明的技术在今天的主要用途进行争论,那就完全是另一回事了。助记媒介能帮助人们内化这些故事吗?这样做可能会违反原子性原则,因为好的故事很少是原子性的(尽管这个特殊的例子很接近)。尽管如此,如果能够有效地将这些故事编码到卡片中,那么违反原子性似乎是值得的。
以类似的方式很容易产生更多的问题和想法。助记媒介不是一种固定的形式,而是一个实验和不断改进的平台。
思考如何改进助记媒介的一个有用的比喻是,把每一篇助记文章看作是一篇传统的文章,并伴有一种“反射文章” — — 所有卡片所编码的知识。用户可以很容易地选择想记多少就记多少。当然,反射是不完美的。但是,通过制定好的卡片制作策略,我们可以使反映出来的文章几乎忠实地反映所有重要的思想,即读者理想情况下希望保留的思想。
我们在上面说过,使用“良好的记忆系统=间隔重复”这个简单的模型是错误的。事实上,虽然间隔重复是介绍Quantum Country的一种有用的方式,我们当然不应该把助记媒介归类到现有SRM系统的范式中。相反,最好还是回到最初的原则,问一些问题,比如:怎样才能让Quantum Country成为一个好的记忆系统?除了间隔重复之外,我们还能在系统中建立其他强大的记忆原理吗?
事实上,有些关于记忆的想法与间隔重复非常不同,但力量相当。其中一个想法是精心设计的编码。粗略地说,这就是我们对一个概念的联想越丰富,我们就越容易记住它。因此,我们可以通过丰富联想网络来提高记忆力。
从某种意义上说,这是一个显而易见的想法,与日常经验相符。例如,这是我们更容易在自己擅长的领域里学习新知识的部分原因 — — 我们很快就会对现有知识形成联想。但是仅仅因为这个想法很明显,并不意味着它得到了现有媒介形式的特别好的支持。在助记媒介中,我们可以积极地支持许多唾手可得的成果。实际上,上面的一些建议已经隐含地建立在精心编码的思想上 — — 像“避免孤行卡”这样的原则就是基于此。这里还有三个建立在精心编码基础上的建议:
- 以多种形式提供问题和答案:1971年,心理学家艾伦·派维奥(Allan Paivio)提出了双重编码理论,即语言信息和非语言信息分别储存在长期记忆中。派维奥等人研究了图片优势效应,他们发现图片和单词放在一起比单独的单词更容易被记住。例如,这就暗示了这样一个问题:“谁是乔治·华盛顿的副总统?”如果附有华盛顿的照片,或者如果答案(约翰·亚当斯)附有亚当斯的照片,回忆率可能更高。对于记忆系统,双重编码理论和图像优势效应提出了许多问题和想法。以多种形式提出问题和回答有多大好处?也许甚至有多张图片,或者是音频或视频(也许有多位不同性别、不同口音的演讲者,等等),或者是计算机代码?也许是需要某种形式的互动?在每种情况下:什么最有效?
- 改变环境:1978年,心理学家史蒂文·史密斯(Steven Smith)、阿瑟·格伦伯格(Arthur Glenberg)和罗伯特·比约克(Robert Bjork)报告了几项研究地点对人类记忆影响的实验。在他们的一个实验中,他们发现在两个不同的地方学习材料,而不是在同一个地方学习两次,在以后的记忆中能提高40%。这是一个更广泛的实验模式的一部分,表明改变复习的背景可以促进记忆。我们可以使用记忆系统来支持这样的事情:改变复习地点的位置;更改一天中的复习时间;复习时改变背景声音或没有背景声音。在每种情况下,实验都表明对回忆有影响。并不一定清楚这些结果有多可靠,或者可再现性有多强 — — 可能有些(或者全部)是其他效应的结果,在最初的实验中是无法控制的。尽管如此,构建系统来测试和(如果可能的话)改进这些结果似乎还是值得的。
- 这些卡片是如何相互作用的?什么是理想的知识网络结构?这是一个非常复杂和微妙的问题。让我们举一个简单的例子来说明这个想法。我们在助记媒介中呈现了这些卡片,就好像它们是独立的实体一样。但是卡片之间有联系。假设你有一张卡片:“乔治·华盛顿的副总统是谁?”(答:“约翰·亚当斯”,配一张亚当斯的照片);“约翰·亚当斯长什么样?”(答:亚当斯的照片);也许这个问题涉及到亚当斯和华盛顿在某个关键时刻的关系;等等。现在,这组卡片形成了一个相互关联的卡片网络。你可以使用Quantum Country这样的记忆系统来研究这个网络。如果你拿走一张卡片,人们观察到的回忆会发生什么?有关键的关键卡片吗?是否存在特别有效的网络结构?卡片之间特别有效的关系?至关重要的是:在这个系统中,我们能否找到最深入、最有力的表达知识的方法?
现在很明显,我们开发的助记媒介原型只是冰山一角。更重要的是,我们在这里提出的建议和问题也仅仅是一个开始,让你了解什么是可能的。
为记忆技巧欢呼两声
当我们与人讨论记忆系统时,许多人立即回答说,我们应该研究记忆技巧。这是一种记忆系统的方法,与Quantum Country、Duolingo、Anki以及我们讨论过的其他系统非常不同。你也许熟悉学校里简单的记忆技巧。一种常见的形式是技巧,如记住彩虹的颜色 — — Roy G. Biv(红、橙、黄、绿等)。或者用一首歌来记住元素周期表。
一个更复杂的变化是可视化技术,如位置记忆法(method of loci)。假设你想记住你的购物清单。为了用位置记忆法做到这一点,你想象自己在某个熟悉的地方 — — 比如你童年的家。然后你想象自己从一个房间走到另一个房间,把购物清单上的一件物品放在每个房间的显著位置。当你去购物时,你可以通过想象自己走过房子 — — 你所谓的记忆宫殿(memory palace) — — 并查看每个房间里的物品来回忆起清单。
如果你从未使用过记忆宫殿,这听起来似乎是不可能的。但是即使是新手,只要少量练习,也会对这些技巧的效果感到震惊。努力发展这些技术的专家可以做一些非凡的事情,比如记忆一副洗牌的纸牌的顺序,或者数百位数字的列表。这是一种利用人们极其强大的视觉和空间记忆作为其他类型记忆杠杆的方式。
考虑到所有这些,我们经常会遇到这样的人,他们告诉我们记忆技巧是一种比间隔重复更有前途的记忆方法,这也许并不奇怪。
我们对这种助记技巧很感兴趣。但是理解它们的局限性很重要,不要被那些能很快记住一副牌的人的印象所迷惑。
需要注意的是,使用助记技术可以记住的内容范围很广。在实践中,它们通常是非常专业的。例如,助记专家将使用稍微不同的方法来记忆数字列表和纸牌。这些方法必须分别掌握 — — 对于两种狭窄的记忆来说,这是一项巨大的时间投资。此外,与抽象的概念知识相比,记忆技巧更适用于具体的物体 — — 比如,很难将《凡尔赛条约》中的要点储存在你的记忆宫殿里。这并不意味着不可能 — — 助记专家已经开发了将抽象概念知识转化为可存储在记忆宫殿中的具体对象的巧妙技术。但是,总的来说,间隔重复的一个优点是它比任何助记技巧都适用于更广泛的知识范围。
第二个注意与精心编码有关。正如你可能已经意识到的,助记技巧是一个精心编码的例子,它把我们想要记忆的东西(比如说,我们的购物清单)和已经对我们有意义的东西(比如说,我们的记忆宫殿)联系起来。相比之下,当专家在他们的领域中学习新信息时,他们不会人为地建立与记忆宫殿的联系。相反,他们找到了与他们已知的有意义的联系。这些联系本身就是有用的专业知识;他们正在建立一个紧密的相互理解的网络。这是一种更深入、更令人向往的专业知识,是与主题本身的联系,而不是人为构建的记忆方法。
所有这些都让我们对记忆技巧持消极态度。事实上,我们是热情的,而且到目前为止,在助记媒介中还没有充分利用它们。我们在这里所写的只是为了缓和我们有时会遇到的过度热情。有些人甚至告诉我们,记忆技巧可以解决记忆问题。这完全是错误的。但是了解了它们的局限性之后,它们就成为了一个强大的工具。对于具有任意、特殊结构的知识尤其如此。例如,很难记住彩虹的颜色,因为这些颜色与其他任何东西都没有明显的联系,除非你碰巧因为其他原因记住了可见光的光谱!这使得像Roy G. Biv这样的助记符非常有用。因此记忆技巧应该被认为是建立强大记忆系统的有用工具,尤其是当它与间隔重复这样的想法相结合时。
记忆到底有多重要?
当提到助记媒介时,人们往往分成两类。一组人对这个想法很着迷,想要尝试一下。第二种人持怀疑态度,甚至是排斥态度。在漫画中,他们说:“我为什么要关心记忆?我想要更深层次的理解!我就不能在网上查资料吗?我想要创造力!我想要概念上的理解!我想知道如何解决重要问题!只有乏味、注重细节的人才会专注于死记硬背。”
这种反对意见值得认真思考。为了开发尽可能好的记忆系统,我们需要理解和解决潜在的问题。在某种程度上,这意味着深入挖掘,以识别这些问题的错误或表面部分。这也意味着要尽可能敏锐地提炼出问题的真相。这两种方法都有助于我们改进和超越目前的助记媒介原型。
对这些反对意见的一个回应是来自亲身经历的论证。在过去,我们中的一个人(MN)经常帮助学生学习诸如量子力学之类的技术学科。他注意到,人们常常认为自己陷入了深奥复杂的问题。但是,正如本文导言中所提到的那样,通常真正发生的是,他们在基本符号和术语方面遇到了困难。当你不清楚每三个单词或符号时,很难理解量子力学。每一句话都是一场斗争。
就像他们试图用法语写一首优美的十四行诗,但只懂200个法语单词。他们很沮丧,认为问题是很难找到一个好的主题,引人注目的情感和形象,等等。但真正的问题是他们只有200个单词可以写。
那时,MN多少有点自我满足的信念是,如果人们更关注于记住基本的东西,而不是担心“困难的”高层次的问题,他们会发现高层次问题会自己解决。他没有意识到这也适用于他。当他开始使用记忆系统Anki来阅读新领域的论文时,他发现Anki让学习这些学科的基础知识变得如此容易,这几乎让他感到不安。这让他开始思考,在学习新领域时,记忆是否常常是一种约束。
对助记媒介一个特别常见的负面反应是,人们不想记住“不重要的细节”,而只是在寻找“广泛的、概念性的理解”。很难知道如何理解这个论点。坦率地说,这些人似乎是在愚弄自己,把享受的感觉与任何持久的理解混为一谈。
想象一下,你遇到一个人,他告诉你,他对如何说法语“有一个宽泛的概念理解”,但结果是,他不知道“bonjour”、“au revoir”或“tres bien”的意思。你会认为他们声称对法语有广泛的概念理解是可笑的。如果你想真正理解一个主题,你需要知道基础知识的细节。更重要的是,这意味着不只是阅读后立即了解它们。这意味着长期内化它们。
一个更好的模型是,概念的掌握实际上是由对细节的掌握来实现的。Quantum Country的一位用户告诉我们,她发现阅读的体验出乎意料地放松,因为她“不再需要担心”是否会记得内容。她只是相信媒介本身会确保她做到。她报告说,她反而能够在概念问题上花更多的时间。
当人们对助记媒介的反应是“你为什么要专注于那些无聊的记忆材料?”,他们没有抓住重点。助记媒介在很大程度上自动消除了记忆问题,使人们更容易花更多时间关注学习的其他部分,如概念问题。
反对间隔重复系统的另一个常见论点是,自然重复更好。例如,有人说,如果你正在学习一门编程语言,你不应该记住这门语言的每一个细节。相反,当你在实际项目中使用语言时,你会自然地重复使用,并最终记住语言中最需要学习的部分。
这里有一些重要的部分事实。把你学到的东西作为你创造性项目的一部分是很好的。事实上,一个理想的记忆系统可能会帮助你实现这一点,在你工作的时候提醒你,而不是在一个基于人工卡片的环境中。此外,记忆系统的一个常见故障模式是,人们试图记忆那些他们不太可能用到的东西。例如,如果一个人只打算在一个小项目中使用一种编程语言,那么记住这种语言的很多细节是不好的(但也很常见)。或者记住细节“以防万一”。这些模式是错误的。
但是,最后一段的真理也有其局限性。如果你正在学习法语,但不认识讲法语的人,那么等待“自然机会”说法语是行不通的。即使你确实有(或创造)说法语的机会,加速尴尬、不舒服的早期阶段是可取的,因为这是使用语言的障碍。
正是在这个阶段,记忆系统大放异彩。它们可以加速人们在学习一门学科的初期阶段的尴尬。理想情况下,它们会支持创造性项目的工作。要使这一方法有效,需要对任何特定的人应该记住什么进行很好的启发;对一个人有好处的东西对另一个人可能有坏处。在记忆系统的设计中,处理这样的启发式是一个持续的挑战。
(顺便说一句,数量惊人的人说他们被间隔重复记忆系统“排斥”,或一些类似的强烈词汇。他们的论点通常是不同的:据说间隔重复系统有助于记忆;如果这是真的,我必须使用这些系统;但我讨厌使用这些系统。回应是否认论点的第一步。当然,错误在其他地方:绝对没有理由任何人“应该”使用这样的系统,即使它们有助于记忆。讨厌使用它们的人应该选择不这样做。使用记忆系统并不是道义上必须的!)
关于记忆与掌握的关系,已经做了大量的研究。这项研究的大部分内容都很详细,而且是根据具体情况而定的。但是从更广泛的结论来看,赫伯特·西蒙(Herbert Simon)和他的合作者在20世纪70年代做了一系列特别有趣的研究。他们研究了国际象棋棋手,发现当国际象棋大师观察一个位置时,他们不会从单个棋子的角度来观察,这里是车,那里是兵。相反,经过多年的下棋和分析,棋手学会了识别25000到100000种棋子的模式。这些更复杂的“组块”是棋子的组合,玩家将其视为一个整体,并能够在比单个棋子更高的抽象层次上进行推理。至少在一定程度上,是对这些组块的识别和推理能力使他们技术比新手好得多。此外,尽管西蒙在国际象棋的背景下做了这项工作,后续的研究在其他专业领域也发现了类似的结果。虽然还需要进一步的研究,但似乎有可能的是,助记媒介可以帮助更快地获取这种组块,从而加快掌握的习得。
那么,这一切是否意味着我们都是死记硬背的拥趸呢?
当然不是。我们确实认为,许多人不喜欢死记硬背,这导致他们普遍不喜欢记忆,因此低估了记忆在认知中的作用。事实上,记忆是认知的核心部分。但正确的应对方法不是大量枯燥的死记硬背。相反,使用好的工具和好的判断来记住什么是真正重要的。
我们已经发现了一些对记忆系统的批评是错误的或没有抓住要点。但是这些批评有什么深刻的见解呢?记忆系统的缺点是什么?我们应该在哪些方面对它们保持警惕?
我们已经含蓄地提到了这方面的几点。想想像避免孤僻问题的必要性。或者确保用户不只是学习问题的表面特征。如果使用不当,记忆系统可能会以这些方式失败。这里还有几个关于记忆系统的关键问题:
- 记忆系统不容易决定要记住什么:最明显的是,我们遇到了很多人,他们使用记忆系统的目的选择得很糟糕。下面是一段我们都曾多次交谈的记录,令人惊讶地接近:
“我不喜欢(记忆系统)。我试着去记住非洲的国家,但很无聊。”
“你为什么要记住非洲的国家?”(茫然困惑的表情。)
这种事很容易被人取笑。但是我们都在自己的记忆练习中做了同样的事情。就连Quantum Country的一些用户似乎也是出于某种错位的责任感才这么做的。“什么对记忆是有益的”这个问题是最基本的,回答好这个问题并不是无关紧要的。
- 助记媒介对人们认知的真正影响是什么?它是如何改变人们的行为的?一个著名的拳击手应该说过,每个人都有一个计划,直到他们被打中脸。经常使用记忆系统的用户有时会报告说,虽然他们可以在系统测试时记住答案,但这并不意味着他们可以在真正需要的时候回忆起答案。你可能会有一种“哦,我知道这个”的感觉,但并不是真正的回忆,更不用说人们最终想要的有效行动的流畅性了。此外,用户甚至可能没有意识到使用他们所学知识的机会。更广泛地说:记忆本身不是一个终极目标。它嵌入在一个更大的背景中:创造性地解决问题,发现问题,以及世界上采取行动的所有方式。我们怀疑记忆系统的影响会有很大不同,这取决于它们的设计。它们可以作为人们依靠的拐杖。或者它们可以被用来极大地帮助人们发展他们认知的其他部分。我们还不太清楚如何确保它们是推动者,而不是拐杖。但在这篇文章的后面,我们将描述一些其他的思维工具,当它们与记忆系统集成时,可能会更好地实现向更有效的行为的转变。
如何发明印度-阿拉伯数字系统?
让我们暂时远离记忆系统。想象你是一名居住在古罗马的设计师,为MDC(Mathematical Designs Corporation,数学设计公司)工作。一天,一个客户来了,表示想要改进罗马数字。当然,这并不是他们向你描述他们问题的字面意思 — — 更有可能的情况是,一个想要更有效地制表收税的人,并且有一些模糊的概念,认为MDC可能会提供帮助。但是对你,一个有经验的设计师来说,一个改进的数字系统似乎是他们所需要的。
你应该如何回应这个请求?从我们现代的角度来看,我们知道一个更好的数字系统是可能的,即印度-阿拉伯数字系统。事实上,印度-阿拉伯数字是思维工具历史上的一大飞跃。作为一名设计师,你能实现这样的飞跃吗?从罗马数字开始,发明印度-阿拉伯数字需要哪些创造性的步骤?是否有一种创造性的做法,使这些步骤有可能发生?
需要说明的是:这是一个有点异想天开的思维实验。事实上,在巴比伦人、希腊人和其他文化中,人们早就知道了获得印度-阿拉伯数字所需的许多想法。算盘和类似的工具也处于早期阶段。所以我们并不是在问一个字面意义上的历史问题。相反,这是一个旨在激发思考的问题:什么样的设计过程可以让你从罗马数字变成印度-阿拉伯数字?
我们不能肯定这个问题的答案。但是值得指出的是,印度-阿拉伯数字不仅仅是一个非凡的设计。它们也是非凡的数学洞察力。如果你只知道罗马数字,它们包含了许多不明显的想法。也许最显著的是,一个数字的含义实际上是变化的,这取决于它在一个数字中的位置。同样值得注意的是,当我们将数字72和83相加时,我们可能会使用2+3=5;同样地,当我们把27和38相加时,我们也会用2+3=5,尽管2和3在第二个“和”中的意义与第一个“和”中的意义完全不同。在现代用户界面术语中,数字具有相同的启示,尽管它们在两种情况下的含义非常不同。我们认为这是理所当然的,但这种行为上的相似性是数字系统深层事实的结果:交换性、结合性和分布性。所有这些特性(以及更多的特性)都表明设计和数学洞察力是纠缠不清的:在某种意义上,数学洞察力是设计洞察力,反之亦然。
事实上,似乎可以公平地说,任何一个能从罗马数字开始发明印度-阿拉伯数字的人,都将是有史以来最伟大的数学天才之一,也是有史以来最伟大的设计天才之一。他们必须在这两个领域都有非凡的能力,能够形成一个洞察循环,这个循环利用不断发展的数字系统不仅改进他们自己的数学思想,而且对数学有独到的、世界级的见解;并利用这些数学见解来改进他们不断发展的数字系统。
与传统的现代设计实践相比,这是相当发人深省的。在典型的实践中,你会采访领域专家(在本例中是数学家),并阅读任何相关的文献。你可以和现有系统的用户交谈,分析重要的行为,无论是个人行为还是大规模行为。简而言之,你会做设计社区的人所说的把自己沉浸在目标领域中。
这是一个强有力的实践。在最好的情况下,它导致系统的存在,否则是不可想象的。如果应用于罗马数字(在假设的古罗马,不是今天),这种做法可能会大大改善它们。但是它不能提供接近达到印度-阿拉伯数字所需的数学洞察力。
我们关于印度-阿拉伯数字和数学的故事是虚构的。但它表达了一个普遍的真理:最强大的思想工具表达了对潜在主题的深刻洞察。就记忆系统而言,这意味着它们不仅仅是“应用认知科学”,即利用现代设计实践,将认知科学的现有观点拼贴在一起。相反,它们将表达对记忆的深刻独到见解,这种见解是世界上从未有过的。一个真正伟大的记忆系统将是最高层次的认知科学。
从这次讨论中,我们带走了一个警告和一个愿望。
警告是这样的:传统技术产业的产品实践将无法产生足够深刻的主题洞察力,从而无法创造出革命性的思维工具。事实上,这也是科技行业在思维工具方面进展如此之少的部分原因。这听起来像是对传统产品实践的冲击,但事实并非如此。这种做法在其目的上取得了惊人的成功:创建伟大的企业。但这也是艾伦·凯所说的流行文化,而不是研究文化。为了构建思维的变革工具,我们需要超越流行文化。
对于任何一个认真致力于开发变革性思维工具的团队来说,这都是一种渴望。它是要创造一种文化,将现代产品实践的最佳部分与(非常不同的)现代研究文化的最佳部分结合起来。你需要一个有洞察力的循环来运作,在这个循环中,关于这个主题的深刻的、原创的洞察会反馈给你,从而改变和改进这个系统,而系统的改变会产生关于这个主题深刻的、原创的洞察。
请注意,我们并没有提出一个常见的观点,即制作新工具可以为工具制作者带来新的主题见解,反之亦然。这是正确的,但比我们所说的要弱得多。相反:制造新的工具可以为整个人类带来新的主题洞见(即重要的原创研究见解),反之亦然,理想情况下,这将是一个快速发展的循环,以开发最具变革性的工具。
这是一场文化斗争。在这种情况下,似乎很难找到一种能让人洞悉一切的方法。在这个循环的一端有专业知识的人常常很难理解(更不用说理解和参与)在这个循环的另一端工作的性质。你有在他们的领域里很有才华的研究人员,他们认为做一些本质上很琐碎的事情,“只是执行的问题”。还有一些根本不懂研究的制作者,他们认为研究只是一个相当缓慢、不正常(且无利可图)的制造过程。这在硅谷当然是正确的,在那里经常遇到一些有成就的技术创造者,他们在阅读了理查德·汉明(Richard Hamming)和理查德·费曼(Richard Feynman)的一些故事后,认为自己对研究有足够的了解,可以“创建新的贝尔实验室”。通常他们是达克效应(Dunning-Krugeritis)的受害者,无知到甚至意识不到自己的无知。
当然,Quantum Country还有很长的路要走。它还没有产生足够深刻的关于记忆和认知的想法;它还不是世界上最重要的记忆实验室之一。作为一种产品,它也是在最早期;我们还没有足够快地迭代,也没有足够快地从系统中学习。让洞察循环全速运行,将意味着部分重新创造研究文化和传统产品开发文化;这将意味着新的规范和参与关键决策的新型人。但这就是我们的愿望,我们相信这是开发革命性思维工具所必需的。
第二部分:探索更广泛的思考工具
我们已经深入地研究了助记媒介。其目的是向你展示一种特定思维工具开发的早期阶段,以及这种开发所带来的一些思考。在这篇文章的第二部分,我们将更广泛地探索,简要地概述一些其他的思想工具。我们将讨论一些更广泛的问题,特别是关于为什么没有更多的思考工具的研究。
助记的视频
2014年,数字艺术家埃里克·韦恩奎斯特(Eric Wernquist)发布了一段名为《漫游者》(Wanderers)的短视频。该视频提供了探索太阳系的第一人称视角:
我们听到叙述者(卡尔·萨根)的惊叹和敬畏,我不禁同情他对探索价值的深刻信念。我们可以感受到我们周围的宇宙有多神秘,有多美丽。音乐以一种对敢于探索的祖先的怀念开始,然后变化来传达兴奋和危险,以及我们和后代继续进行这一探索的勇气。
将这段视频与卡尔·萨根的一段简短的视频脚本进行对比是很有趣的。文本很美,但阅读它是一种更遥远、更理性的体验,传达的是一种更少发自内心的情感理解。
我们有个朋友格兰特·桑德森(Grant Sanderson),他在自己的YouTube频道3Blue1Brown上制作了令人惊叹的数学视频。下面是我们最喜欢的一个视频,它利用代数拓扑的思想,对一个相对较新的几何学研究成果进行了证明。这听起来很可怕,但这段视频很美,也很容易理解,浏览量已经超过了120万次。
https://www.youtube.com/watch?v=AmgkSdhK4K8
和《漫游者》(Wanderers)一样,观看这段视频是一种非凡的情感体验。很明显,视频的叙述者热爱数学,你会情不自禁地产生共鸣。当你观看时,你会不断地重复“啊哈!”,瞬间顿悟的时刻,就像以前看不见的联系变得明显。它展示了数学是一种美丽的东西,它包含了非凡的思想和有趣的奥秘,同时也展示了数学不是神秘的,它是任何人都可以理解甚至做的事情。
人们很容易忽视或低估这种与主题的情感联系。但它是所有有效学习和所有有效行动的基础。使用视频比使用文本更容易建立这样的情感联系。
然而,这种情感联系也有另一面。我们经常听到人们把桑德森的视频描述成“教数学”。但在谈话中,他告诉我们,他认为只有一小部分观众对数学有了更深入的了解。我们怀疑这通常是真的,高影响力的视频通常对改变人们详细的智力理解没有什么帮助。相反,这些视频的非凡价值在于它们所创造的情感联系。
有没有可能创造一种融合了视频和文字的最佳品质的媒介?
特别是,是否有可能创造一种媒介,它具有视频中可能有的情感范围 — — 一种可以用来传达敬畏、神秘、惊喜和美丽的范围?但是,哪一种方法又能将这种情感联系牢固地建立在对细节的理解上呢?对细节的掌握是传统文本存在的理由,甚至是助记媒介存在的理由。
我们相信这是可能的,我们计划开发一种助记视频形式,既能提供视频中可能的情感联系,又能掌握助记媒介中可能的细节。
创建这种形式很有挑战性。许多MOOC平台都尝试过这种方式。典型的方法是有一个低影响的头部谈话视频,视频偶尔被打断进行简短的测验。以下是它在Coursera这一MOOC平台上的工作方式:
其他MOOCs在细节上有所不同。但是总的情感体验可以总结为:
视频中最精彩的部分可能在情感上引人注目,尽管它们很少能达到格兰特·桑德森(Grant Sanderson)等人的最佳视频所能达到的情感范围和联系。整体的情感体验是脱节的,几乎是令人厌恶的。有没有可能创造一个整合的媒介,一个统一的、精心制作的情感和智力体验?理想情况下,是否有可能创建如下内容?
在MOOCs中,问题通常以非常枯燥的形式呈现,与上下文无关。在助记视频中,叙述者将解释为什么这些问题很重要,以及为什么用户会从参与中受益,作为整个叙述的无缝部分。如果处理得当 — — 也许配上合适的音乐,在叙述中加入一种紧迫感或戏剧感 — — 它会创造一种真正的利害关系感。同时,作为间隔重复体验的一部分,可以修改视频播放器,以便用户可以直接回答问题。这样一来,高情感的核心叙述和中等情感的问题之间就会有更柔和的过渡。
下面是实现此目的的一种方法的简要说明,展示了作为整体叙述的一部分,叙述者是如何大声提问的:
助记视频的节奏似乎与助记文章大相径庭。特别是,问题的频率和密度将低于助记媒介,并且有必要测试不同的节拍和节奏,以确保情绪和智力体验的良好平衡。即使是高影响力的视频也有安静的时刻;对比低强度的时刻,它实现了部分高的影响。想想一部好的动作电影或惊悚片需要暂时平静;如果一直强度过高,最终我们的情绪反应会变得迟钝。我们可以设计助记视频,这样这些问题有助于填补这种低强度的情绪波动。
当然,这只是助记视频设计方法的一个快速草图。理想情况下,还应该有一个间隔重复部分,可能是用文本而不是视频来提问。在我们看来,这是一个很有希望的方向,但是需要大量的开发和大量的测试。特别是,我们需要做详细的、逐秒的用户体验测试,以理解和塑造用户的情感和智力体验。这种情况将持续下去,直到我们确信我们的目标用户拥有所需的体验。理想情况下,我们还会生成更多非常不同的设计,并尝试理解每种方法将如何影响用户的情感和智能体验。
更重要的一点是要认真对待情感。从历史上看,许多关于思维工具要么忽略了情感,要么仅仅把它当作次要的问题。相反,这项工作关注的是获得的新技能,以及用户“学习”的内容。他们一直在为斯波克(Spock)设计,当情感联系是一个高阶位时。用户是否不感兴趣?害怕吗?敌意?焦虑?还是他们内化了一种兴奋感,一种美感,甚至是他们自己目标的扩展,自我的扩展?
相比之下,电影、音乐和电子游戏等媒介形式确实非常重视情感。这种形式的设计者通常会精心设计用户情绪反应的模型。这些模型包括详细的、逐秒的理解,以及对用户整体情感旅程的深入思考。我们相信,在思维工具的开发中使用这种方法是可能的,也是可取的。
同时,仅仅积极的情感体验是不够的。为了使思维工具获得持久的力量,使用者必须经历真正的掌握能力的增长,行动能力的扩展。因此,我们希望认真对待思维工具的情感和智力体验。助记视频是这种探索的好地方。套用爱因斯坦的话,在不形成情感联系的情况下获得详细的理解是站不住脚的;而在没有详细理解的情况下形成情感联系没有持久的力量。(attaining a detailed understanding without forming an emotional connection is lame; while forming an emotional connection without detailed understanding has no enduring power.)
为什么今天没有更多关于思维工具的研究了?
如果思维工具如此伟大,为什么不在它们上面做更多的工作呢?为什么它们不是一个主要行业?
正如引言中提到的,肯定是有很多口头上的支持。例如,经常听到技术专家提到史蒂夫·乔布斯(Steve Jobs)将计算机比喻为“思维的自行车”。但实际上,这只不过是说说而已。许多计算机先驱对计算机作为提高人类认知工具的有限使用深感失望。道格拉斯·恩格尔巴特(Douglas Engelbart)蔑视“危险的、令人失望的、狭窄的、我们似乎无法摆脱的道路”。当2006年被问及他的愿景实现了多少时,恩格尔巴特开玩笑地回答“大约2.8%”。艾伦·凯在演讲中声称“真正的计算机革命还没有发生”,并在一次采访中把现代网络描述为“重新发明轮胎……至少让我们看看恩格尔巴特做了什么,看在上帝的份上。”
我们的感受是,今天的许多技术领导者真正崇拜恩格尔巴特、凯和他们的同事。许多人甚至觉得计算机作为改善人类思维的工具有巨大的潜力。但他们不知道如何围绕开发新的思维工具来建立良好的业务。如果没有这样的商业机会,工作就会停滞不前。
是什么让建立开发思维工具的公司变得困难?要回答这个问题,请考虑一下Adobe,它是少数几家认真考虑开发新思维工具的大公司之一。它投入大量资金为设计师和艺术家开发新的媒介 — — 如Illustrator、Photoshop等程序。这些媒介是非凡的思维工具。
不幸的是,对Adobe来说,开发这样的媒介非常昂贵,而且很难阻止其他公司廉价地复制这些想法或开发类似的东西。例如,考虑一下Sketch是如何蚕食Adobe的市场份额的,因为它复制了Adobe多个产品(可能最著名的是Illustrator)的许多好的功能。想想Figma正在蚕食Sketch和Illustrator的市场份额。Sketch和Figma都是这样做的,而不需要在研究上投入巨额资金。这是它们相对于Adobe的一大优势。
正如马克·安德森(Marc Andreessen)所观察到的:
纯粹从产品层面来说,真正的可防御性在硅谷是非常罕见的,因为那里有很多非常优秀的工程师……还有跳跃式前进的问题。下一个团队有机会从你所做的事情中学习,然后做得更好。
换句话说,许多思维工具都是公共产品。最初开发它们通常要花很多钱,但是其他人很容易复制和改进它们,免费使用最初的投资。虽然这种复制和改进对我们整个社会来说是好事,但对那些进行初始投资的公司来说却不是好事。因此,这些思维工具遭受了许多公共产品的命运:相对于它们提供的利益,我们的社会集体投资不足。
早些时候,我们认为现代设计实践通常无法应对产生真正变革性思维工具的挑战。从表面上看,这个过程层面的论点似乎与我们刚刚提出的公共产品论点大相径庭。事实上,过程层次的解释是公共产品解释的结果:公司不使用必要的流程,因为这样做没有什么价值。相比之下,在“高技术”行业,例如芯片设计行业,企业更有动力进行深入的研究工作。在这些行业中,其他公司很难复制或获取研究的价值。
与电子游戏对比是很有启发性的。游戏公司开发了许多全新的界面创意。这似乎有些令人惊讶,因为你可能会认为这样的界面创意也会受到公共产品问题的影响:游戏设计师需要投入大量的精力去开发这些界面创意,而这些创意通常会被其他公司以很少的成本立即复制(并改进)。从这个意义上说,它们是公共产品,并丰富了整个电子游戏生态系统。
但电子游戏公司与Adobe等公司之间存在巨大差异。许多电子游戏的大部分收入来自最初几个月的销售。虽然其他公司可以(也确实)加入进来,复制或重复任何新创意,但这往往对从最初的游戏中获得的收入影响甚微,因为它已经赚了大部分钱。虽然这种抄袭毫无疑问会激怒被抄袭的公司,但对它们来说,进行前期投资仍然是值得的。
最终的结果是,在游戏中,巧妙的新界面创意能够成为区别于其他游戏的特色,这也成为了游戏在市场中的主要优势。事实上,新的界面理念甚至可能帮助游戏成为经典 — — 考虑一下游戏中的许多原创(当时)理念,从《太空侵略者》(Space Invaders)到《德军总部3D》(Wolfenstein 3D),再到《纪念碑谷》。因此,许多公司在开发新的界面创意方面进行了大量投资,而不是投资不足,即使这些创意后来变成了公共产品。通过这种方式,电子游戏产业在很大程度上解决了公共产品的问题。
相比之下,像Adobe这样的公司是围绕发行和长期锁定来开展业务的。他们说服人们 — — 实际上是整个组织 — — 对他们的产品做出长期承诺。学校开设课程,让人们可以自称为“Photoshop专家”或“Illustrator专家”。公司将其设计部门指定为“Adobe商店”。因此,尽管Adobe确实投资于开发新界面创意(对他们来说,与电子游戏公司不同,这确实意味着思维工具),但这对他们的竞争优势并没有那么重要,如果这是他们的核心优势,他们的投资也会更少。Adobe在开发思维工具方面所做的工作可能与其他公司一样多,甚至更多。
令人鼓舞的是,电子游戏行业可以在公共产品问题上取得进展。思维工具有解决方案吗?不幸的是,游戏行业基于新颖性的短期收入方法不起作用。你想让人们真正掌握最好的新思维工具,发展精湛的技巧,而不是花几十个小时(和大多数游戏一样)变得相当好,然后去做一些新的事情。
另一个解决公共产品问题的可行办法是专利,即对一项发明的使用给予暂时的垄断。包括Adobe在内的许多软件公司都开发了大量的专利组合。然而,现行的专利制度并不能解决这个问题。2017年,Adobe负责知识产权和诉讼的副总裁达纳·拉奥(Dana Rao)呼吁对专利制度进行重大改革,她说:
(专利)系统崩溃了……发生了什么?专利暴发户掀起的专利淘金热……它们的价值不在于专利背后的创新,而在于专利要求的含糊不清,以及在原告友好的法庭上强制执行的能力……这些糟糕专利的材料来自哪里?软件的出现……这就导致了只提供创意的专利被授予广泛且通常无效的权利主张,渴望专利的投机商非常乐意利用这一点。
Adobe和许多其他软件公司一样,它们的许多专利申请都是防御性的:它们为创意申请专利,因此专利流氓无法就类似创意起诉它们。情况几乎与你想要的完全相反。创新公司很容易受到专利流氓的攻击,这些专利流氓在一大堆专利中提出了宽泛且通常相当模糊的要求,但他们都没有详细地解决这些问题。但当创新公司开发出(成本高得多的)真正好的新创意时,其他公司往往可以复制该创意的核心内容,同时对其进行足够的修改,以貌似合理地规避任何专利。专利制度没有保护正确的东西。
从单个公司的观点,到整个社会的观点,我们不仅想要激励发明,我们还想让想法合理地迅速进入公共领域。想想基本的思维工具,比如书写和数字系统。显然,那些不受知识产权问题困扰的人遍布社会是好事!更广泛地说,随着思想工具变得越来越普遍,它们对社会的价值也越来越高。同样,现代专利制度有许多众所周知的问题,在私人利益和公共利益之间难以取得平衡。虽然设计良好的专利制度可以很好地帮助解决公共产品问题,但我们现有的专利系统似乎不太适应这个问题。
有可能完全避免公共产品问题吗?这里有三类思维工具:
- 像谷歌这样的搜索引擎是思维工具。它们避免了公共产品问题,因为它们的价值在于品牌,在于难以复制和资本密集型的后端元素(包括它们的数据中心、专有算法、广告网络和分销),而不是在于它们的界面理念。
- 像Twitter这样的服务可以被认为是集体思维工具。虽然界面很容易复制,但由于网络效应,公司很难复制。
- 新颖的硬件设备(如VR,或Wii遥控器,或新的乐器)可以作为新思维工具的基础。虽然硬件可以复制,但通常比复制软件要贵得多。无论如何,这类公司的优势通常在于分销、营销以及与为平台生产产品的供应商的关系。
虽然这些建议都避免了公共产品问题,但并没有直接解决公共产品问题。许多有希望的方向 — — 包括助记媒介和助记视频之类的想法 — — 都涉及大量的公共产品元素。在这种情况下,有可能解决公共产品问题吗?在我们看来,最有希望的两种方法是:
- 慈善研究基金。例如,这种方法被用于计算机动画和动画电影领域。数十年的计算机动画公共研究工作产生了大量强大的(在许多情况下)公开可用的思想。这反过来又为皮克斯(Pixar)和梦工厂(Dreamworks)等公司铺平了道路。这些公司进一步发展了许多创意,并将其推广。
- Adobe和类似公司使用的模式,在这种模式中,新的思维工具是公司运营的核心部分,而不是竞争护城河的核心。
质疑我们的基本前提
到目前为止,我们认为有三个重要的前提是理所当然的。首先是我们仍处于早期,还有许多更具变革性的思维工具有待发现。其次是思维工具的工作停滞不前,即没有太多有趣的工作在进行。第三,一种元前提是,相对于当前流行的人工智能和脑-机接口等相关概念,这种工作是值得做的。在本节中,我们将讨论这些前提。
如果已经发现了最好的思维工具呢?
换句话说,也许20世纪60年代和70年代是一个不可重复的黄金时代,我们所能期待的未来是逐步渐进的改进,也许是偶尔的重大突破,但频率越来越低?
有一个貌似合理的说法表明这是真的。科技是一个庞大的产业,资金充足,有许多聪明、有抱负、有才华的人。当然,如果有重大想法可以发现,人们会这样做吗?在个人层面上,我们遇到许多杰出的人,他们着迷于(并经常致力于)思维工具,但似乎进展缓慢,这一事实强化了上述观点。
虽然这个故事表面上很吸引人,但它具有误导性。真正困难的问题 — — 像发明印度-阿拉伯数字这样的问题 — — 并不仅仅通过良好的意图和兴趣来解决。重要的是缺少足够强大的基础思想来取得进展。在一个学科的早期 — — 原始学科阶段 — — 一些非凡的人 — — 像伊万·萨瑟兰(Ivan Sutherland)、道格·恩格尔巴特(Doug Engelbart)、艾伦·凯(Alan Kay)和布莱特·维克多(Bret Victor) — — 可能能够取得进步。但是这是一个非常定制的、个人的进步,很难帮助其他人变得精通,或者扩展到一个社区。这还不是一门真正的学科。我们所需要的是发展一套强有力的实践,一套明确而有力的核心思想,使新人们能够迅速地吸收它们,并开始发展自己的实践。我们现在还没有思维工具。但我们相信我们也离目标不远了。
虽然这个论点是有帮助的,但它并没有触及核心问题:这并不意味着有许多新的变革性思维工具等待被发现。再说一遍:也许最重要的思考工具已经被发现了?
我们无法预测未来,所以不可能肯定地回答这个问题。但在我们看来,人类还没有真正努力过。当一小群有积极性的人这样做时 — — 在开创性的实验室,如PARC、SRI和其他受DARPA支持的早期努力,以及在现代实验室,如Dynamicland,他们取得了快速的进展。非常令人鼓舞的是,这些努力 — — 人类整体研究成果中的微小努力 — — 取得了如此迅速的进展。对我们来说,这意味着扩大规模,变得更加雄心勃勃。
科技行业不就是这样吗?思维工具不是有很多进展吗?
尤其是,难道不是已经有很多富有想象力、有决心、资金充足的人在做这件事吗?技术在很大程度上不是已经在开发了新的思维工具吗?
这个问题的部分原因是术语上的混淆。显然,许多科技公司都为解决特定问题而开发专用工具。但是,虽然这些可能是有价值的工具,但它们肯定不是我们正在讨论的广义上的“思维工具” — — 不像语言或写作,也不像Illustrator。
不过,确实有一些科技公司在开发思维工具。我们已经讨论了一些公司部分或完全避免了公共产品问题的例子,比如:Illustrator、谷歌搜索、Twitter、Slack、谷歌文档、程序员工具等等。所有这些都是重要的思维工具。
但是想想我们最基本的思维工具 — — 语言、写作、音乐等等。这些都是公共产品。没有人拥有语言;就其所有权(商标等)而言,它实际上可能会限制语言的效用。这些工具都是关于引入基本的新心理表征和心理操作。这些不是任何公司拥有的,而是人类拥有的模式。
这一论点似乎表明,许多最基本、最有力的思维工具确实存在公共产品问题。这意味着科技公司把重点放在其他地方;这意味着许多富有想象力和雄心勃勃的人决定把精力放在别处;这意味着我们还没有开发出在该领域开展工作所需的强大实践,其结果是该领域仍处于学科前阶段。最终结果是,这意味着最基本、最强大的思维工具供应不足。
为什么不研究人工智能(AGI)或脑-机接口(BCI)?
我们经常被问到:为什么不使用AGI或BCI而不是思维工具呢?这些不是更重要也更令人兴奋吗?尤其是对AGI来说,许多需要的技能似乎是相关的。
它们当然是重要和令人兴奋的主题。更重要的是,目前AGI和BCI要时髦得多(资金也更充足)。作为一个读者,你可能会翻白眼,假设我们在这里的想法是预先确定的:如果我们不喜欢思维工具的工作,我们就不会写这篇文章。但这些都是我们在决定如何度过自己生活时苦苦思索的问题。我们中的一个人在决定主要关注思维工具之前写了一本关于人工智能的书;这不是一个轻率的决定,而是他不时回顾的一个决定。事实上,考虑到AGI和BCI带来的持续的兴奋,这将是令人惊讶的,如果从事思维工具开发的人们的脑子里没有一个小声音在说“嘿,你不应该去那里吗?”时髦是诱人的。
一个显著的区别是,AGI和BCI基于相对具体、明确的目标。相比之下,研究思维工具的工作就不那么清晰了。在很大程度上,我们不能指出明确的长期目标;相反,我们有长远的愿景和抱负,几乎能引起共鸣。这项工作实际上是探索一个开放式的问题:我们如何开发工具来改变和扩展人类的思维范围?
从文化上来说,技术是由工程设计、目标驱动的思维模式主导的。当你心中有一个非常具体的最终目标时,设置关键绩效指标(KPIs)、评估确定的目标(OKRs)和管理可交付成果要容易得多。因此,科技文化更认同AGI和BCI作为整体工作计划,这也许并不奇怪。
但从历史上看,人类最大的突破并不是以这种目标驱动的方式实现的。语言的创造 — — 我们的思维工具 — — 也许是人类存在中最重要的事情。尽管关于语言的起源存在激烈的争论和不确定性,但它似乎极不可能是目标驱动过程的结果。试着想象一些史前的季度OKRs导致了语言的发展是很有趣的。人们可以设定什么样的目标?也许是新的不规则动词的指标?这是不可思议的!
同样,其他思维工具的发明 — — 写作、印刷等等 — — 也是我们有史以来最大的突破之一。而且,据我们所知,所有这些都主要来自于开放式的探索,而不是以目标驱动的方式。即使是计算机本身,也是在一次探索中诞生的,这种探索在今天的技术中也被认为是一种荒谬的推测,而且定义也很模糊。没有人坐下来思考“我需要发明电脑”;他们没有任何参考依据。相反,像艾伦·图灵(Alan Turing)和阿朗佐·丘奇(Alonzo Church)这样的先驱者,当时正在探索有关逻辑、数学和可证明事物本质的极其基本的(似乎有些深奥)问题。经过多年的探索,计算机的概念应运而生;这是一个被发现的概念,而不是一个目标。基本的开放式问题似乎至少和目标一样是突破的好来源,不管目标有多雄心勃勃。在硅谷以目标为导向的文化中,这很难想象,也很难说服其他人。事实上,我们自己也感受到了目标驱动文化的吸引力。但是从经验上看,开放式探索也可以同样成功,或者更成功。
“新的思维工具会是什么样的?”这是我们经常听到的问题。然而,几乎从定义上来说,我们不能说。正如我们之前所提到的,如果我们可以在一篇文章中传达这些经验,那么这些工具的作用就会失效;它们不会改变一个人的思想,甚至他们的意识。具体地说:要理解助记介质,你必须在一段较长的时间里大量地使用它。即使那样,你也可能没有意识到这种影响;我们采访了一些用户,他们显然没有意识到自己对文章的惊人记忆力。意识哲学中最著名的论文之一题为“变成蝙蝠会怎样?”(What is it like to be a bat?)每种思维工具都提出了类似的问题,如果不沉浸在工具中,几乎不可能回答:“作为一名语言使用者是什么感觉?音乐家?”等等。
在我们看来,在接下来的几十年里,研究思维工具似乎比研究AGI和BCI更重要。此外,考虑到目前在AGI和BCI上的工作是多么时髦和资金充足,几乎可以肯定的是,研究思维工具会带来更大的好处。
那么长期呢?情况不太明朗。这三个领域似乎很可能会合并,或者至少会彼此强烈融合。我们中的一位与肖恩·卡特(Shan Carter)一起认为,人工智能最有前途的应用之一,是发现新的思维工具。
BCI似乎有更紧密的联系。BCI有时被描述为使用像长期记忆的记忆芯片或者某种增加短期工作记忆的方法。这些想法很可能变得很重要。但是,似乎也有可能用BCIs来促成新的思维活动、新的思维表征和新的思维启示;简而言之,与开发非BCI思维工具所涉及的事情是一样的。也许我们会发展直接想象自己在四维、五维或更多维度的能力;或者遍历黎曼流形;或者拥有多种有意识注意力的能力。这些是关于改变思维的界面,允许的基本抽象和操作。因此,今天研究思维工具的工作似乎会直接影响我们未来使用BCIs的方式。
可执行书(executable book)
写作的技巧在于创造一个其他人可以思考的环境。(The skill of writing is to create a context in which other people can think.)
— — 埃德温·施罗斯伯格(Edwin Schlossberg)
计算机科学家彼得·诺维格(Peter Norvig)写了一篇讨论社会财富分配的互动式文章。诺维格的文章是一个Jupyter项目,可以执行Python代码的许多想法。该代码建立了一个代理群体,初始分配财富。代理人随机地(重复地)成对相遇,并进行简单的经济交易。更具体地说:一个简单的交易模型可能是,当两个人相遇时,他们的共同财富被汇集起来,然后在他们两人之间随机分配。这个模型只是给你一个要点 — — 当然,更复杂的交易模型是可能的。这个项目模拟财富分配是如何随时间演变的。
诺维格的文章之所以漂亮,部分原因在于,只需几行Python代码,诺维格就能够展示一些关于财富不平等的惊人结果。例如,他的研究结果表明,经济中财富的初始分配对财富的长期分配影响不大。相反,是交易的性质决定了财富的长期分配。这可能至少违反了一些读者的直觉。作为另一个例子,他的研究结果还表明,限制代理人只与地理位置接近的人交易,对财富的最终分配几乎没有影响。
这样的结果将挑战一些读者的直觉。但是,这些挑战不是基于容易被忽视的抽象参数,读者可以立即使用诺维格的模型。他们需要找到一个反例,即财富的初始分配会影响长期的不平等。他们可以很容易地进行实验,只需对一行或几行Python代码进行简单的修改,就可以尝试找到初始分布很重要的实例。不管他们是成功还是失败,他们都会对这个问题有更好的理解。
假设诺维格文章的内容以更传统的静态形式呈现。读者要扩展或查询结果,就需要完全掌握材料,并具有高水平的数学能力。但是在这个项目中,读者更容易进行实验。他们的探索是搭建起来的,他们可以做一些小小的修改并看到结果,甚至是诺维格没有预料到的问题的答案。这种框架式的探索是一种建立自己理解的方式,甚至可能会推动知识的前沿。
诺维格的文章是成千上万(甚至上百万)Jupyter项目之一。当然,大多数这样的项目都写得仓促而糟糕。但是,在像诺维格这样优秀的作家和思想家的手中,这个项目可以成为非凡的思考环境,无论是个人的还是共享的。人们很容易认为它们仅仅是文章和代码的混搭。但实际上,它们是一种新的媒介形式,与论文或代码有不同的可能性,并有显著的进一步发展的机会。在本节中,我们将探讨这些机会。
我们将诺维格的文章描述为“互动文章”(interactive essay)。有一个更具体的术语是有用的,可以将它与其他交互形式(如助记媒介)区分开来。在这篇文章中,我们将使用术语“可执行的书”(executable book)。我们不会在这里精确地定义它;定义不是重点。相反,重点是试图更好地理解媒介形式的潜力,这种形式将文章和代码结合在一起。
在从事严肃的工作时,必须开发思维工具。对规范内容的渴望
西摩·帕尔特(Seymour Papert)是Logo编程语言的主要创建者之一,他对Logo有着非凡的追求。Logo有时被描述为“儿童的编程语言”,人们有时认为帕尔特最感兴趣的是帮助儿童学习如何编程。但这并不是帕尔特的主要目的。相反,帕尔特想要创造一个沉浸式的环境 — — 一种“数学世界” — — 在这个环境中,孩子们可以沉浸在数学思维中。从本质上讲,孩子们可以通过Mathland学习微分几何。
这是一个美好的愿望,Logo包含了许多惊人的想法。但是据我们所知,没有专业的微分几何学家(或者更一般地说,数学家)在他们的工作中认真地使用Logo作为工具。仔细想想,这似乎很麻烦。如果Logo真正表达了微分几何的思想,为什么微分几何学家不使用它呢?你开始怀疑:是不是Logo忽略了微分几何的重要思想,甚至是微分几何最重要的思想?毕竟,虽然帕尔特受过数学训练,但他自己并不是一个出色的微分几何学者。他怎么会知道包括什么?当然,大多数对Logo感兴趣的人没有资格做出这样的判断。
对此有一个标准的反驳,这是我们从Logo社区听到的。关于不同思维环境的“地板”和“天花板”。Logo有一个低的地板(意味着任何人都可以使用它)和一个低的天花板(所以它不太适合专业人士想要做的高级工作)。
乍一看,这似乎是合理的。但仔细一想,就很难理解了。Logo的创造者如何知道掌握Logo有助于理解真正的(请原谅我们!)微分几何?成功的标准是什么?我们中的一个人(MN)在黎曼几何的相关领域做了几年的研究。虽然Logo使用起来很有趣,包含了许多有趣的想法,但是MN很难看出学习Logo对学习微分几何有很大帮助。
在诺维格的经济学论文结尾,是一篇简短的后记,解释了他是如何写出这篇论文的。在写这篇文章前不久,他听说了在Jupyter上讨论的各种经济模型,他想探究关于这些模型的几个问题。与一些同事讨论后,他们决定各自独立地解决问题,并交换意见。虽然诺维格的文章在某种意义上是“教育性的”,但诺维格的意图是探索一系列他自己真正好奇的问题。教育方面是副产品。
所以你有一个世界级的研究科学家,他想探索一系列问题。他用Jupyter进行这些探索,然后与世界分享这种探索。他以一种其他人可以立即建立和扩展他的思维分享它。
有很多关于思维工具的研究,它们以玩具或“教育”环境的形式出现。没有被真正的作者使用的写作工具。没有被真正的数学家使用的数学工具。等等。尽管这些工具的创造者有良好的意图,但很难不怀疑这种模式。人们很容易陷入一种货物崇拜(cargo cult)模式,做一些看似(比如说)数学上的工作,但实际上避免了触及主题的核心。通常情况下,这些玩具的创造者从来没有做过严肃的原创工作,而他们本应是为这些工作制作工具的。他们如何知道需要包括哪些内容?
具体来说:假设你想要为主题X构建工具(例如X =微分几何)。除非你深入地参与到实践中去,否则想要建立一个好的工具是非常困难的。这就像你自己不用做任何木工活就可以为木工制作新工具一样。这也许是Mathematica这样的工具做得很好的部分原因 — — 其首席设计师斯蒂芬·沃尔夫勒姆(Stephen Wolfram)对数学和物理有着真正的研究兴趣。当然,并不是Mathematica的所有部分都做的一样好;有些部件感觉就像玩具,而这些似乎是公司内部没有认真使用的部件。
这里有一个普遍的原则:好的思维工具大多是在解决严肃问题的原创工作中产生的副产品。它们要么是由从事这项工作的人创造的,要么是由与之密切合作的人创造的。此外,问题本身对于解决问题的人来说是非常重要的。他们不是为了薪水而解决这个问题;他们正在努力,因为他们迫切地想知道答案。
许多人问我们为什么要写一篇关于量子计算的助记文章。如果我们选一个更简单的主题,我们就能吸引更多的观众。但我们也希望这篇文章是真实的,是关于我们想要解决的问题。我们中的一个人(MN)在量子计算方面做了很多原创性的研究工作。这篇文章反映了这种思想。事实上,这篇文章的框架是关于回答MN个人想回答的一个问题:如果人类发现了外星人,他们会有电脑吗?如果有,他们会有什么样的电脑?这可能听起来像是一个做作的问题,但它是相当严肃的,这是一个很深奥的问题,答案也很重要:写这篇文章帮助MN大大提高了他对这个问题的理解。
也就是说,回答这个问题并不是创作这篇文章的主要目的:创造助记媒介才是。对于未来思维工具的研究,更加努力地推动我们真正想回答自己的问题是有价值的。这是保持诚实的一种方式,确保你不仅仅是在制造一个华而不实的玩具,而是对解决独立关心的实际问题真正有用的东西。
在严肃的媒介中,有一个规范媒介(canonical media)的概念。通过这种方式,我们指的是媒介的实例,它扩大了媒介的范围,并在媒介的创造者中建立了一个广为人知的新标准。例如,《公民凯恩》、《教父》和《2001》都扩大了电影的范围,并启发了后来的电影制作人。新媒介也是如此。像格兰特·桑德森(Grant Sanderson)这样的YouTubers创建了规范的视频:它们扩大了人们认为视频形式可能的范围。类似费曼的物理讲座(Feynman Lectures on Physics)也适用于教科书。在每一种情况下,你都能感受到人们对自己所做的事情是多么的投入。在他的许多演讲中,很明显费曼不仅仅是在教育:他在报告自己毕生痴迷于理解世界如何运转的结果。这是令人兴奋的,它扩展了形式。
从这个意义上说,我们对那些没有雄心壮志的人使用Jupyter感到失望。他们没有那么努力地推动媒介;没有Jupyter的《公民凯恩》。事实上,我们仅仅比卢米埃尔兄弟强一点点。像诺维格的例子是很好的作品,但作为媒介的主要例子来评价,似乎令人失望。
出于对规范的追求,一个有趣的项目是获取最新的IPCC气候评估报告(可能从一小部分开始),并开发一个可执行的版本。你将有一个实时的气候模型 — — 实际上是许多相互关联的模型 — — 供人们探索,而不是一个充满断言和参考的报告。如果足够好,人们会用它来上课;如果它真的很棒,不仅会用它来上课,它也可能成为许多气候科学家的创造性工作环境。
在这个方向上一个有希望的探索是经典力学的结构和解释(The Structure and Interpretation of Classical Mechanics),这是一本建立经典力学的漂亮的可执行的书。许多经典力学的定理不仅仅是在页面上以静态的形式表达,而是作为用户可以修改的代码实时表达。定理变成了APIs,它实际上可以应用于其他对象,并链接在一起。它使用了比Jupyter更强大的底层模型,开发了一种新的符号语言作为书的一部分。它有很多缺陷,其中之一是,该书不能在浏览器中实时运行,这让用户很难进行实验。虽然这本书写得很好,但作者对经典力学的理解不如其他一些书的作者深刻。但无论如何,这都是对可能性的一种鼓舞人心的召唤。它还暗示了,当作者将可执行的书用于严肃的目的,并渴望规范媒介时,什么是可能的。
通过倒写结构加强情感联系
考虑一位作者正在写一本关于量子力学的畅销书。这样的作者处于有利地位:他们可以从诸如黑洞蒸发、量子隐形传态以及量子波动在早期宇宙中的作用等令人震惊的现象,开始他们的书。或者,如果他们愿意,他们可以从一些人类已知的最深奥的奥秘开始:量子力学和引力之间的关系,或者量子测量问题。非凡的现象和美丽的奥秘层出不穷。这些东西触动了许多人,也许是大多数人的心弦。因此吸引读者、让他们参与进来并保持联系相对容易。
相比之下,考虑一本关于量子力学的典型技术书籍。这不太可能从黑洞蒸发或量子隐形传态开始 — — 如果是这样,这样的讨论将是敷衍了事。相反,它将从枯燥的技术细节开始。复数。波函数。许多不同类型的微分方程,以及如何求解它们。埃尔米特矩阵和幺正算符。等等,一点一点地慢慢建立起解决量子力学问题所需的所有机构。这本书可能要花上几十甚至几百页的篇幅,才开始涉及那些构成通俗读物主要内容的令人兴奋的问题。
缺乏良好技术写作经验的人常常抱怨这种枯燥的、自下而上的方法。他们会抱怨作者应该更接近有趣的材料,使用较少的技术符号和术语。但是,当有能力的作者试图遵循这一处方时,总是收效甚微。
其中一个问题是,一个人可能要花数年时间来阅读有关黑洞蒸发、量子隐形传态等的类比。在阅读的最后,他们通常没有真正的理解。类比和启发式推理根本行不通。它们可能很有趣,并产生一些理解的感觉。但是推理不会扩展;它不能应用于其他现象,至少没有很多的注意事项,读者是无法理解或应用的。因此,优秀的技术写手大多是从基本原则出发,偶尔会偏离主题,转向更广泛的激励图景。这意味着从大量详细的技术细节开始。
将传统的技术书籍与可执行的书所能提供的可能性进行对比是令人吃惊的。你可以想象从一本可执行的书开始,比如说,量子隐形传态,就在第一页。你需要提供一个界面 — — 可能需要导入一个库 — — 让用户可以立即传送量子系统。他们可以用量子隐形传态协议的不同部分进行实验,立即说明最引人注目的想法。用户不一定能理解发生的一切。但是他们会开始内化隐形传态的准确含义。随着时间的推移,作者可以在闲暇时解开一些可能是先验知识的细节。随着时间的推移,作者可以在闲暇时解开一些可能是先验知识的细节。除非到那时读者会被这些细节所吸引,而且它们不会那么枯燥。
换句话说,你可以用用户已经关心的材料开始一本可执行的书,可以很容易地连接,并找到激励。例如,你可以从探索隐形传态或大爆炸开始。但这样的开头不会遭受通俗科学的缺陷,即含糊和不精确。相反,界面将被完全指定。而且,小心一点,这个界面可以向外扩展,在不断扩展的上下文中应用。这种理解是可以转移的。即使一个用户只理解了材料的一小部分,也可以开始修改,在玩耍和探索的基础上建立理解。人们通常会认为这种方法会导致一种玩具式的理解;相反,我们认为,如果有足够好的框架设计,就能加深理解。发展到足够的深度,这样的环境甚至可以用来探索新的研究思路。
总结和结论
我们已经讨论了很多,有助于提炼出主要的要点 — — 一般原则、问题、信念和愿望。让我们从记忆系统开始,特别是助记媒介:
- 记忆系统让记忆成为一种选择,而不是一件随机事件:这就改变了我们与所学知识的关系,减少了忧虑,解放了注意力,使之专注于其他类型的学习,包括概念性的、解决问题的和创造性的。
- 记忆系统处于初级阶段:有可能将人类的有效记忆提高一个数量级,甚至超过现有的记忆系统;并且诸如助记媒介的系统可以帮助扩大用户可以理解的主题范围。
- 一个使用助记媒介的大师会是什么样的呢?从某种意义上说,助记媒介“只是”记忆卡。正确的结论并不是说它是微不足道的;问题是,卡片的价值被大大低估了。在Quantum Country中,我们以崇敬的态度对待卡片的写作;理想情况下,作者会像纳博科夫(Nabokov)对待句子写作一样认真对待卡片写作。当然,我们没有达到那个水平,但是渴望扩展了媒介的范围。大师甚至助记媒介的规范使用会是什么样子?
- 记忆系统可以用来建立真正的概念理解,而不只是学习事实:在Quantum Country中,我们实现了这一目标,一方面是通过对大师级卡片写作的渴望,另一方面是通过在叙事中嵌入间隔性的重复,逐渐建立起背景和理解。
- 记忆技巧,如记忆宫殿,很棒,但还不足以建立真正的概念理解:这些技术都是非常专业的,并且强调人工的联系,而不是许多概念知识中存在的内在联系。然而,助记技术对于用特定结构引导知识非常有用。
- 记忆比人们想象的要重要得多:它几乎在认知的每个部分都发挥作用,包括解决问题、创造性工作和元认知。另一方面,记忆系统本身也想发展成其他类型的工具 — — 用于阅读的工具、用于解决问题的工具、用于创造的工具、用于注意力管理的工具。也就是说,我们还不知道什么是记忆系统。重申一下:记忆系统还处于初级阶段。
助记媒介仅仅是思维的一个原型工具。我们还讨论了其他一些想法,包括助记视频和可执行书。以下是一些关键要点:
- 什么样的实践会产生像印度-阿拉伯数字一样具有变革性的思维工具?现代设计实践和科技产业产品实践在哪些方面存在不足?要想成功,你需要一个洞察力十足的循环,将最优秀的深度研究文化与最优秀的硅谷产品文化结合起来,全力运转。
- 思维工具(大部分)是公共产品,因此供应不足:也就是说,有一些紧密相关的生产模式已经取得了成功(游戏产业,Adobe, AutoDesk,皮克斯)。应该研究这些模型,尽可能地模仿它们,并将其作为寻找更多此类模型的灵感。
- 认真对待情感:历史上,思维工具主要集中在认知上;很多工作都被困在了Spock空间。但它应该像最好的音乐家、电影导演和视频游戏设计师一样认真对待情感。助记视频是一种很有前途的探索工具,它可能结合了助记媒介所渴望的深厚的情感联系和详细的知识掌握。
- 思维工具必须与深入的、原创的创造性工作一起开发:很多思维工具的工作都集中在玩具问题和玩具环境上。这在原型设计时很有用,但是要想成功,这些工具最终必须用于进行严肃的、原创的工作。这是测试这些工具是否真的在工作,或者仅仅是在讲述一个好故事的基准。理想情况下,对于任何这样的工具,都将有一个规范媒介流来扩展表现形式,并进入其他创造者的意识。
让我们回到文章开头的问题:如何为思维构建变革性的工具?当然,我们甚至还没有准确定义什么是这样的变革性工具!它们是这样一种工具,实践中相对较低的成本变化会导致结果的变革 — — 非线性回报和思维的质的转变。这与通常的情况相反,在这种情况下,实践中的小变化会导致结果的小变化。
历史上,人类已经发明了许多这样的变革性的思维工具。写作和音乐是古老的例子;在现代,Photoshop和AutoCAD等工具是合格的。虽然现在还为时过早,但我们相信这种助记媒介大有前途。它需要进一步发展,就像我们已经描述的那样,并且可能需要额外的强有力的想法。但我们相信人类有可能拥有广泛的记忆实践,从根本上改变我们的思维方式。
更广泛地说,我们希望本文中的原则将有助于支持创造更具变革性的思维工具。历史上,大多数思维工具的发明都是由受启发的个人和团体定制的。但是我们相信,将来会有一个成熟的社区定期进行这种发明。