[转贴]如何提高自己批判性思维的能力?
老陈审过一个走私头目。
审讯室里桌子很小,两张椅子,一盏灯。老陈夹着一叠照片,封口朝下,压在手肘底下。那个人坐对面,眼睛盯着那沓东西,嘴里没停。他讲他那天晚上在哪家饭店吃饭,点了什么菜,服务员长什么样,他说得细致,连那家店门口的霓虹灯哪一段坏了都讲出来。老陈什么也不问。就听。
讲了四十分钟,那个人忽然自己停下来。他说,你怎么不问我?
老陈这时候才把最上面那张照片翻过来。照片上是同一家饭店的门口,时间戳和他说的时间只差三分钟。门口停的是一辆不该出现在那里的车。那张照片老陈已经拿了三天,他没出示,他在等对方把那家饭店讲满。讲得越细,后来要改口就越难。
这叫 strategic use of evidence,战略性证据使用,缩写 SUE。瑞典哥德堡大学的 Pär Anders Granhag 从 2005 年开始做这套方法的对照实验,到现在跑了大概二十年。核心只有一条:证据不是越早摆越好,而是越晚摆越好,而且要让对方先把话说死再摆。
这一条,今天读任何公开信息的人都应该抄在桌上。
大部分人读财报、读公告、读会议纪要、读候选人简历,方法是反过来的:先看数字,再听人讲。他们以为数字是硬的,话是软的,先硬后软是合理的。
SUE 说不是。话是被反复排练过的,数字是被裁剪过的,两者都不是原始信号。真正的信号在两者的错位里。你不看那个错位,就等于把钱包交给对面那个人让他替你数一遍。
Granhag 团队 2015 年在 Law and Human Behavior 上发了一篇综述,他们把审讯里的证据披露时机分成三档:一开始就亮牌、等嫌疑人讲完再亮、根据嫌疑人的叙述选择性地亮一部分。实验对象是几百个被告知”你刚刚犯了一个模拟犯罪”的大学生,还有一批真正的警察被试。结论很单调:一上来就亮牌,测谎准确率大约是 56%,基本等于抛硬币。后两种,准确率跳到 85% 上下。
这个差距几乎全部来自一件事:嫌疑人在不知道对方手里有什么牌的情况下,会更倾向于建立一个自洽但与事实有细微出入的故事。等他讲完,再把那张照片、那条短信、那个打卡记录拿出来,错位自己就浮出来。他要再编,成本就高得离谱。
我们读公开信息的时候恰好相反。每一份季度报告、每一份政策解读、每一份路演材料,都是发布方在假设我们手里有某些”照片”的前提下写的。他们在脑子里模拟过你会怎么读,然后反向设计了每一句话。这叫提前框架化。
你读的不是信息。你读的是经过框架化的、且发布方已经假设你会如何解读之后再做过一次修订的陈述。
这件事写成一句话,大部分人都同意。但真正坐下来读一份公告,90% 的人还是从第一段读到最后一段,然后得出一个印象。
Reid technique 是美国司法系统里用了六十多年的一套审讯流程,John E. Reid 1947 年的原型,现在几乎每一本刑侦教材都会讲它的九步法。我不打算把九步背一遍,因为 Reid 这几年在学术上被批得很惨,尤其是它对无辜嫌疑人产生虚假供述的风险。但 Reid 里面有一个动作今天仍然有用,叫 behavioral analysis interview,简称 BAI。
BAI 不是审讯。它发生在审讯之前。
审讯官坐下来,先跟嫌疑人聊一些完全跟案子无关的事情:你今天早饭吃了什么,你上周末去哪里了,你家里有几口人。表面上在建立关系。真正的目的是建立一个基线,这个人在回答无压力问题时的语速、手部动作、眼神落点、呼吸节奏、用词偏好是什么样的。
然后才开始问跟案子相关的问题。这时审讯官在听的不是内容,是偏离。哪一句话他开始用比之前更抽象的代词,哪一句他开始用被动语态,哪一句他的停顿从 0.4 秒变成 1.2 秒。
这套东西的科学基础其实不如 Reid 自己宣称的那么硬,Aldert Vrij 团队做过荟萃分析,发现 BAI 里列出的 21 个”说谎信号”在控制变量之后大多数没有稳定预测力。但基线这个概念保留下来了,它在今天任何一份叫做认知访谈或策略性访谈的协议里都是第一步。
我把这个动作搬出来,因为它刚好解释了 LLM 为什么是一个天生的朴素读者。
LLM 没有基线。它没跟发言人聊过早饭。它第一次读到这个人,是这个人最重要的一次发言。那次发言已经被律师、公关、投行、法务、合规反复修改过。LLM 读到的每一份材料都是第一轮接触,而且接触的永远是被精心排练过的版本。它不知道这个人平时讲话用什么词,它不知道这个人在低压场景下是什么呼吸节奏。它只拿到了一段高压场景下的陈述,然后被要求做判断。
你让它去审讯一个从不现身的嫌疑人,而且它只能读一份由律师代笔的书面陈述。
这就是 LLM 的信息论起点。
Granhag 还有一个同行叫 Maria Hartwig,她在纽约做过一系列实验,把 SUE 拆得更细。她把证据披露分成四个变量:时机、具体度、框架、来源归属。
我举一个她常用的例子。
假设你手里有一张停车场监控录像,显示嫌疑人 21:47 把车停在案发地点附近。
早 + 具体:你一见面就说,我们有录像,你 21:47 停在了那里。
晚 + 具体:你让他讲完当晚行程,他说 21 点他在家,你再亮出录像。
早 + 模糊:你说,我们掌握了你当晚的行踪信息。
晚 + 模糊:你让他讲完,然后说,你讲的跟我们掌握的有出入,你要不要再想想。
四种组合在她的实验里效果差得很远。早 + 具体 最差,因为嫌疑人立刻知道你的底牌,然后围绕 21:47 重新编一套合理化叙述。晚 + 模糊 最好,因为嫌疑人要同时处理两件事:自己刚才讲的那套话怎么圆回去,加上对方到底知道多少。认知负荷一上来,漏洞就多。
Vrij 在 Psychological Bulletin 上 2017 年那篇综述把这个机制讲得很清楚:撒谎本身比讲真话在认知上贵得多,因为撒谎需要同时维护两套模型:事实的模型,和你告诉对方的故事的模型,并且要确保两者在对方可能探查的所有维度上保持一致。再给对方加一层”他不知道对方手里有什么”,这个成本是乘法的。
这些方法论听起来跟 LLM 没关系。它有关系。
我去年帮一个做并购尽调的朋友搭了一套流程。他每个月要读四十份左右的标的公司材料,包括审计报告、业务简介、管理层访谈纪要、行业白皮书。他之前用 LLM 的方式很直接。把 PDF 扔进去,让它总结,让它提炼关键风险点。效果他自己说,”像请了一个从没干过投行的实习生帮我读”。
我们改了一件事。
我让他每份材料进去之前,先往 LLM 里塞一段指令,结构是这样的:
这份材料是由 X 角色(CFO / 财务顾问 / 公关 / 律师)撰写,目的是 Y(融资 / 退出 / 监管应对),读者是 Z(潜在投资人 / 监管 / 媒体)。请你先假设撰写方预先知道读者关心的三个问题是什么,然后逐段标注:这一段在回答哪个预设问题,这一段如果是无压力陈述会怎么写,这一段用了什么缓冲语、被动语态、限定词。最后再总结。
这一段指令本质上是把 SUE 加 BAI 的逻辑封装进去了。我没教它 SUE 和 BAI,我只是告诉它:你读的是一份经过框架化的陈述,你要先反推框架再读内容。
他跑了两个月。他的原话是:现在我要的不是它读出来的东西,我要的是它在每一段旁边标出来的那个”如果是无压力陈述”的重写版。那个重写版跟原文的差距,就是我以前读这种材料十年积累的那种感觉:”哪里不对劲”。LLM 帮我把那个感觉从直觉变成了一栏可对照的差分。
这个动作的关键不在于它识别出了多少”谎言”。尽调材料里没有谎言,它们几乎都在法律允许的边界内写得无懈可击。关键在于它把”这段是精心措辞的”这件事本身变成显性的输出。
SUE 里还有一个我偏爱的子工具,叫对比效应。
审讯里用法是这样:你先问一连串无关的、容易回答的问题,让嫌疑人进入一种”这个人好对付”的松弛状态。然后在第七个、第八个问题的位置忽然切入一个带压力的具体问题,并且在他开始回答之前突然把一张照片翻过来。
人的大脑对前后对比极其敏感。同样一个问题,放在第一个位置问,和放在一串松弛问题之后问,对受试者产生的压力差能到两倍以上(Horselenberg 等,2003)。这个东西在谈判学里也存在,叫松弛后锚定。
我读一份公开信息的时候现在习惯做一件事:先读这家公司最近六份财报的开头段。不读细节,只读开头段。
这是我自己拼出来的基线。
开头段是管理层语气最不设防的地方,因为它不披露具体数字,不承诺具体指引,它只是一个定调的段落。连续六份读下来,你会发现有些家的开头段每一份都像同一个模板,措辞、节奏、用词范围几乎不变;另一些家的开头段每一份节奏都略有变化,你能感觉到谁的笔在动。
然后你读最新的那一份。如果这一份的开头忽然跟前五份不一样,变长了,变短了,忽然多了一个限定词,忽然少了一个习惯性的自我表扬,你就有了第一个信号。
这个信号从来不告诉你”出事了”。它只告诉你:这个人在压力下。剩下的事情是去找那个压力源在哪里。
LLM 在这个动作上完胜人类。它可以一次性吃六份财报的开头段,给你跑一个词频差异和句法结构差异。它能识别出”第四季度开头段比前五份平均多了 23% 的限定词”这种人眼很难直接看出的东西。前提是你告诉它:你不是来总结内容的,你是来做基线比对的。
大部分人用 LLM 的方式是让它做第一步:总结。这就像你请了一个福尔摩斯让他帮你整理卷宗。
审讯学里有一对概念,放大和缩小。
放大:审讯官强调这个罪行的严重性,后果的严重性,证据的充分性。目的是把嫌疑人推到一种”反正已经完了”的心理状态。
缩小:审讯官暗示这个事情其实没那么严重,谁都会犯这种错,说出来反而是一种解脱。目的是降低嫌疑人开口的心理成本。
这两个东西成对出现。典型的 Reid 审讯里,一个审讯官扮演放大者,另一个扮演缩小者,俗称红脸白脸。
被审讯的一方如果知道这个结构,他的反应会完全不同。他不再被红白脸牵着走。他开始问自己:对方现在在用哪个工具?他想让我进入什么状态?
我读任何一份产品发布会材料的时候会做同样的事。
这份材料在放大什么?(通常是市场规模、技术壁垒、时代拐点)
它在缩小什么?(通常是竞争对手、替代风险、资金消耗速度)
两张表摆在一起,你一眼就能看出这家公司的”情绪结构”。它在怕什么,它想让你忽略什么。
这个动作很简单,简单到几乎显得幼稚。但它区分了两种读者:一种读者读完 60 页路演材料之后脑子里留下的是”这公司很酷”,另一种读者留下的是两张对照表,而且每一行都标了引用页码。
LLM 放进这个框架里有一个奇怪的位置。
它不像人。人有”被放大话术影响”的感性基础。你看到”万亿赛道”会本能兴奋,看到”弯道超车”会本能警觉。LLM 没有这种本能。它处理”万亿”和”千亿”在词元层面的反应差不多。
但它也不是天生的 SUE 审讯官。它的默认行为是相信文本的表面含义。你给它一段公关稿,它的第一反应是把公关稿里的断言当作命题来处理,”这家公司拥有行业领先的技术”,它会把”行业领先”编码成一个语义标签,而不是一个需要证据的声明。
LLM 的原始状态是一个非常朴素的读者。朴素在这里不是贬义,它是一个严格的技术意义:它缺少先验框架。它不知道发言人一般会在哪里夸张,它不知道发言人一般会在哪里省略。这些东西一个老练的人类读者从几十万小时的社会生活里免费得到,LLM 没有。
但一旦你把这套框架显式地喂给它,它就变成一个非常高效的 SUE 执行者。因为它的注意力不会疲劳,它不会因为对方态度诚恳就放松警惕,它不会因为数据图漂亮就忘了问来源。人类审讯官的最大弱点是感性判断会污染技术判断,LLM 没这个问题。
所以正确的用法是:人来提供框架,LLM 来执行对框架的持续应用。
有一次我跟一个做 IR(投资者关系)的朋友吃饭。他的工作是帮上市公司写披露材料。他喝多了跟我说了一句话,我记了很久。
他说:我们写任何一份公告,都会先预判买方会怎么问我们。我们把可能的问题列出来,然后设计公告,使得读完公告之后,这些问题要么被提前回答掉,要么被转化成一个更缓和的问法。我们不撒谎,撒谎违法。我们只是让真相以一个特定的形状进入市场。
他说这话的时候没有任何得意,也没有任何愧疚。这就是他的工作。
他不是坏人。他只是一个职业上非常专业的造框者。
大部分市场参与者读到的材料,都出自一个像他这样的人之手。如果你读材料的方式是”先看内容再下判断”,你就等于把自己的判断权外包给了这个人。你以为你在分析,你其实在消费他的框架。
SUE 的全部价值观就建立在一件事上:信息的披露时机和披露形状,和信息本身同等重要,有时候更重要。
我自己现在读任何一份重要文本,都会做三件事。
第一件,先不读正文,先读元信息。谁写的,为谁写的,写于什么时间点,发布渠道是什么,读者预期是什么。这是框架层,在任何内容进入我大脑之前先被识别出来。
第二件,读完之后,花同样长的时间重写一遍。重写的标准是:把所有的缓冲语、限定词、被动语态、情绪词全部剥掉,只留事实断言。然后数一下事实断言的数量,以及每一个事实断言背后有没有独立可验证的引用。一份 8000 字的材料,剥完之后如果只剩下十几个事实断言,这份材料的信息密度就只有十几除以八千。
第三件,把原文和重写版并排摆开,看差在哪里。差的那部分就是发布方的框架意图。它告诉你,对方希望你把这些事实放在一个怎样的情绪框架里读。
这三件事现在我全让 LLM 做第一轮,我做第二轮校验。它的速度比我快十倍,我的判断比它准。分工很清楚。
老陈跟我讲那个案子的时候是在一个小馆子里。他退休好几年了,讲这些事情没什么顾忌。他说他年轻的时候也犯过错。他说他第一次独立审讯,一进门就把所有证据摊在桌上。他想吓那个人。他以为证据越多越能压倒对方。
对方看了一眼桌面,笑了一下,说,这些我都能解释。
然后对方真的把每一张照片、每一条记录都解释了一遍。解释得毫无破绽,因为他现在知道对方有什么,没有什么,缺什么。那个人最后被放了。
老陈说,从那天起他再也不早亮牌。他说,你手里的牌不是给对方看的,是给对方不知道你手里有这些牌的时候,去看他怎么讲话的。
我想了很久这句话。
读公开信息跟审讯有一个共同点:对方总是先讲。你不可能让一家上市公司陪你坐下聊早饭。你唯一能做的是,在他们讲话之前,你先建立好你的证据池:你自己的 baseline,你自己的独立数据源,你自己对这个行业的先验。他们讲的时候你不评价。他们讲完你再拿出你的那一叠照片,一张一张翻过来,看每一张和他们讲的那段话对不上的地方。
那个对不上的地方,就是你真正的信息。
不是他告诉你的那些。
那个走私头目后来怎么样了,老陈没讲。他只讲那个动作:那张照片扣在手肘下面三天没动。
我记住的是那三天。
桌子上有一张照片。它随时可以翻过来。老陈选择不翻。他不是在等一个好时机,他是在等那个人把自己讲得足够具体,具体到翻过来的那一瞬间,整张桌子都会响。
你手里有没有这样一张照片?