Claude 深度研究指南:斯坦福验证的多视角提问法(附 4 个提示词)
你问 Claude 一个问题。它给了你一个看起来不错的答案。
但你看完总觉得少了点什么。说不上来。好像都说了,又好像什么都没说透。
这不是 Claude 的问题。是一个提示词本身就只能给你主流观点——最主流的框架,最安全的说法,最不可能出错的共识。
真正有价值的东西不在这套答案里。
斯坦福把这事写成了一篇论文
2024 年,斯坦福 OVAL 实验室在 NAACL 2024 上发表了一篇论文,提出了 STORM 这个研究系统。全称很长,你只需要记住一件事:
它在同行评审测试里,产出的文章条理性比次优方法高出 25%,覆盖广度高出 10%。
怎么做到的?多视角提问。
STORM 的做法是让五个截然不同的视角同时审视同一个主题:
| 视角 | 关注什么 |
|---|---|
| 实践者 (Practitioner) | 每天跟这件事打交道,知道什么实际管用 |
| 怀疑者 (Skeptic) | 认为这个领域可能走错了方向 |
| 经济学视角 (Economist) | 盯着钱流,暴露利益动机 |
| 历史视角 (Historian) | 见过类似模式反复上演 |
| 学者 (Academic) | 真正读过原始论文 |
实践者看到学者忽略的东西。怀疑者挑战实践者的假设。经济学视角暴露学者视而不见的利益结构。历史视角提供其他所有人都看不到的模式。
五个视角,「视角」本身就是信息。你从哪个角度看,决定了你能看到什么。
这就是整个突破的核心。
论文是开源的(github.com/stanford-oval/storm,MIT 许可),在线工具免费(storm.genie.stanford.edu)。但重点不是去跑那个系统——重点是这背后的思维方式,你可以用四个提示词在 Claude 里直接复现。
四步走,每一步做什么
第一步:多视角扫描
给 Claude 同一个主题,让它分别从上面五个视角回答。
实践者怎么说?怀疑者怎么说?盯着钱的人怎么说?看过历史重复的人怎么说?真正读过论文的人怎么说?
你得到的不是五个答案——是五种盲区,一齐亮了。
第二步:矛盾地图
五个视角说出来的东西不会完全一致。让 Claude 找出它们在哪儿打架。
冲突发生的地方,藏着真正的理解。
两条简单的判断规则:
- 所有视角一致 → 这件事大概率站得住
- 某个话题没人提 → 你刚刚发现了整个领域的空白
大多数人会跳过这一步。而正是这一步,把表面理解跟真正的专业认知区分开了。
第三步:综合简报
让 Claude 基于前两步,整合出一份研究简报——覆盖所有角度,标注矛盾点,排可信度,最后落在具体行动上。
这是一个博士生花 48 小时手工阅读才能拿到的成果。
第四步:同行评审
让 Claude 给自己的作业打分。
强论据在哪儿?弱论据在哪儿?有什么偏见?漏了什么角度?
这一步是 STORM 方法的关键补偿——斯坦福团队自己承认,系统不会自我批判。来源偏差和事实错配会悄悄渗入。第四步强制 LLM 审视自己的输出。
真正学术界的同行评审要几个月。
直接实操:四个提示词,直接复制
上面是每一步在做什么。下面是可直接用的提示词全文。将 [YOUR TOPIC] 替换为你的研究主题,按顺序逐一粘贴到 Claude。
Prompt 1:多视角扫描
我需要研究:[YOUR TOPIC]
模拟 5 种不同专家视角对这个主题的看法:
1. THE PRACTITIONER(实践者):每天实际操作这个领域的人。 - 他们知道哪些学术界通常忽略的现实情况? - 哪些实用细节被忽略了?
2. THE ACADEMIC(学者):多年研究这个领域的人。 - 同行评审证据实际说了什么? - 证据在哪里与流行观点矛盾?
3. THE SKEPTIC(怀疑者):认为主流观点有问题的人。 - 最有力的反驳是什么? - 支持者通常忽略了哪些证据?
4. THE ECONOMIST(经济学家):追踪金钱流动的人。 - 谁从当前叙事中获利? - 哪些财务激励塑造了研究和观点?
5. THE HISTORIAN(历史学家):见过类似模式的人。 - 存在哪些历史平行案例? - 从那些案例的结果中我们能学到什么?
对于每个视角,请提供:- 核心立场(2 句话以内)- 支持其观点的最强证据- 他们会告诉我、而其他视角不会提到的独特洞见Prompt 2:矛盾地图
(在 Prompt 1 的输出后直接使用)
基于上面 5 种专家视角,制作一份矛盾映射:
1. 哪些地方两个或多个视角直接相互矛盾?列出具体分歧点和原因。2. 哪些地方多个视角达成共识?这些共识的可靠性如何?3. 哪些重要方面完全没有被任何视角触及?(研究空白)4. 整体来看,这个主题最被低估或高估的风险/机会是什么?
用清晰的结构化格式输出,便于阅读。Prompt 3:综合简报
(在 Prompt 2 之后使用)
现在,将 5 种视角和矛盾映射中的所有信息综合成一份研究简报。
输出结构:1. 主题概述(1-2 段)2. 关键发现(列出 5-7 条最重要的洞见)3. 主要矛盾与分歧(简要说明)4. 可靠性排序(哪些部分证据最强,哪些最弱)5. 行动建议(具体、可执行的下一步或决策建议)6. 未被充分回答的问题(未来可深入的方向)
保持客观、平衡,并突出跨视角的洞察。Prompt 4:同行评审
(在 Prompt 3 之后使用)
现在对上面的研究简报进行同行评审:
1. 置信度评分:为每个关键发现打 1-10 分,并说明理由。2. 潜在偏差或盲点(模型可能引入的、或视角覆盖不足的)。3. 事实可能错误或需要验证的地方。4. 缺失的重要角度或反驳观点。5. 整体强度评估:这份简报在哪些方面最强?最弱?6. 改进建议:如何让它更可靠或更全面?
诚实且批判性地输出。能用在哪儿
七个场景,分三组——看你属于哪类读者。
如果你在写东西:
- 写文章或报告之前。跑一遍四个提示词。你覆盖的角度别人压根想不到。
- 做演示之前。你的幻灯片会在观众提出反对之前就回答掉他们的顾虑。
如果你在做决策:
- 重大商业决策之前。实践者告诉你什么在现实中管用,怀疑者告诉你哪里会崩,经济学视角告诉你谁在获利。
- 投资之前。五个视角天然覆盖看多 / 看空 / 历史类比 / 利益格局 / 学术证据。矛盾地图帮你找到真正的风险藏在哪儿。
- 谈判之前。用五个视角拆解对手——他们的激励结构、弱点、历史行为模式。你带着结构性优势走进谈判桌。
如果你在学习:
- 面试之前。实践者视角给你业内话术,怀疑者视角给你能问倒面试官的犀利问题。
- 学新技能之前。实践者告诉你先学什么,学者给你理论基础,怀疑者告诉你什么被吹过头了。跳过噪音,直取核心。
写在最后
STORM 不是完美的。斯坦福自己的论文也写了:系统不会自我批判。
这就是为什么第四步必须存在——它不是锦上添花,是补丁。
另一个实话:这篇论文 2024 年就发了。代码开源,工具免费,方法就是四个提示词。真正在用的人没几个。方法在那里。四个提示词,按顺序粘贴到 Claude。
本文方法来源:Stanford OVAL Lab, NAACL 2024. 开源仓库 github.com/stanford-oval/storm
支持与分享
如果这篇文章对你有帮助,欢迎分享给更多人或赞助支持!