Claude 深度研究指南：斯坦福验证的多视角提问法（附 4 个提示词）

你问 Claude 一个问题。它给了你一个看起来不错的答案。

但你看完总觉得少了点什么。说不上来。好像都说了，又好像什么都没说透。

这不是 Claude 的问题。是一个提示词本身就只能给你主流观点——最主流的框架，最安全的说法，最不可能出错的共识。

真正有价值的东西不在这套答案里。

斯坦福把这事写成了一篇论文#

2024 年，斯坦福 OVAL 实验室在 NAACL 2024 上发表了一篇论文，提出了 STORM 这个研究系统。全称很长，你只需要记住一件事：

它在同行评审测试里，产出的文章条理性比次优方法高出 25%，覆盖广度高出 10%。

怎么做到的？多视角提问。

STORM 的做法是让五个截然不同的视角同时审视同一个主题：

视角	关注什么
实践者 (Practitioner)	每天跟这件事打交道，知道什么实际管用
怀疑者 (Skeptic)	认为这个领域可能走错了方向
经济学视角 (Economist)	盯着钱流，暴露利益动机
历史视角 (Historian)	见过类似模式反复上演
学者 (Academic)	真正读过原始论文

实践者看到学者忽略的东西。怀疑者挑战实践者的假设。经济学视角暴露学者视而不见的利益结构。历史视角提供其他所有人都看不到的模式。

五个视角，「视角」本身就是信息。你从哪个角度看，决定了你能看到什么。

这就是整个突破的核心。

论文是开源的（github.com/stanford-oval/storm，MIT 许可），在线工具免费（storm.genie.stanford.edu）。但重点不是去跑那个系统——重点是这背后的思维方式，你可以用四个提示词在 Claude 里直接复现。

四步走，每一步做什么#

第一步：多视角扫描#

给 Claude 同一个主题，让它分别从上面五个视角回答。

实践者怎么说？怀疑者怎么说？盯着钱的人怎么说？看过历史重复的人怎么说？真正读过论文的人怎么说？

你得到的不是五个答案——是五种盲区，一齐亮了。

第二步：矛盾地图#

五个视角说出来的东西不会完全一致。让 Claude 找出它们在哪儿打架。

冲突发生的地方，藏着真正的理解。

两条简单的判断规则：

所有视角一致 → 这件事大概率站得住
某个话题没人提 → 你刚刚发现了整个领域的空白

大多数人会跳过这一步。而正是这一步，把表面理解跟真正的专业认知区分开了。

第三步：综合简报#

让 Claude 基于前两步，整合出一份研究简报——覆盖所有角度，标注矛盾点，排可信度，最后落在具体行动上。

这是一个博士生花 48 小时手工阅读才能拿到的成果。

第四步：同行评审#

让 Claude 给自己的作业打分。

强论据在哪儿？弱论据在哪儿？有什么偏见？漏了什么角度？

这一步是 STORM 方法的关键补偿——斯坦福团队自己承认，系统不会自我批判。来源偏差和事实错配会悄悄渗入。第四步强制 LLM 审视自己的输出。

真正学术界的同行评审要几个月。

直接实操：四个提示词，直接复制#

上面是每一步在做什么。下面是可直接用的提示词全文。将 [YOUR TOPIC] 替换为你的研究主题，按顺序逐一粘贴到 Claude。

Prompt 1：多视角扫描#

1
我需要研究：[YOUR TOPIC]
2

3
模拟 5 种不同专家视角对这个主题的看法：
4

5
1. THE PRACTITIONER（实践者）：每天实际操作这个领域的人。
6
   - 他们知道哪些学术界通常忽略的现实情况？
7
   - 哪些实用细节被忽略了？
8

9
2. THE ACADEMIC（学者）：多年研究这个领域的人。
10
   - 同行评审证据实际说了什么？
11
   - 证据在哪里与流行观点矛盾？
12

13
3. THE SKEPTIC（怀疑者）：认为主流观点有问题的人。
14
   - 最有力的反驳是什么？
15
   - 支持者通常忽略了哪些证据？
16

17
4. THE ECONOMIST（经济学家）：追踪金钱流动的人。
18
   - 谁从当前叙事中获利？
19
   - 哪些财务激励塑造了研究和观点？
20

21
5. THE HISTORIAN（历史学家）：见过类似模式的人。
22
   - 存在哪些历史平行案例？
23
   - 从那些案例的结果中我们能学到什么？
24

25
对于每个视角，请提供：
26
- 核心立场（2 句话以内）
27
- 支持其观点的最强证据
28
- 他们会告诉我、而其他视角不会提到的独特洞见

Prompt 2：矛盾地图#

（在 Prompt 1 的输出后直接使用）

1
基于上面 5 种专家视角，制作一份矛盾映射：
2

3
1. 哪些地方两个或多个视角直接相互矛盾？列出具体分歧点和原因。
4
2. 哪些地方多个视角达成共识？这些共识的可靠性如何？
5
3. 哪些重要方面完全没有被任何视角触及？（研究空白）
6
4. 整体来看，这个主题最被低估或高估的风险/机会是什么？
7

8
用清晰的结构化格式输出，便于阅读。

Prompt 3：综合简报#

（在 Prompt 2 之后使用）

1
现在，将 5 种视角和矛盾映射中的所有信息综合成一份研究简报。
2

3
输出结构：
4
1. 主题概述（1-2 段）
5
2. 关键发现（列出 5-7 条最重要的洞见）
6
3. 主要矛盾与分歧（简要说明）
7
4. 可靠性排序（哪些部分证据最强，哪些最弱）
8
5. 行动建议（具体、可执行的下一步或决策建议）
9
6. 未被充分回答的问题（未来可深入的方向）
10

11
保持客观、平衡，并突出跨视角的洞察。

Prompt 4：同行评审#

（在 Prompt 3 之后使用）

1
现在对上面的研究简报进行同行评审：
2

3
1. 置信度评分：为每个关键发现打 1-10 分，并说明理由。
4
2. 潜在偏差或盲点（模型可能引入的、或视角覆盖不足的）。
5
3. 事实可能错误或需要验证的地方。
6
4. 缺失的重要角度或反驳观点。
7
5. 整体强度评估：这份简报在哪些方面最强？最弱？
8
6. 改进建议：如何让它更可靠或更全面？
9

10
诚实且批判性地输出。

能用在哪儿#

七个场景，分三组——看你属于哪类读者。

如果你在写东西：

写文章或报告之前。跑一遍四个提示词。你覆盖的角度别人压根想不到。
做演示之前。你的幻灯片会在观众提出反对之前就回答掉他们的顾虑。

如果你在做决策：

重大商业决策之前。实践者告诉你什么在现实中管用，怀疑者告诉你哪里会崩，经济学视角告诉你谁在获利。
投资之前。五个视角天然覆盖看多 / 看空 / 历史类比 / 利益格局 / 学术证据。矛盾地图帮你找到真正的风险藏在哪儿。
谈判之前。用五个视角拆解对手——他们的激励结构、弱点、历史行为模式。你带着结构性优势走进谈判桌。

如果你在学习：

面试之前。实践者视角给你业内话术，怀疑者视角给你能问倒面试官的犀利问题。
学新技能之前。实践者告诉你先学什么，学者给你理论基础，怀疑者告诉你什么被吹过头了。跳过噪音，直取核心。

写在最后#

STORM 不是完美的。斯坦福自己的论文也写了：系统不会自我批判。

这就是为什么第四步必须存在——它不是锦上添花，是补丁。

另一个实话：这篇论文 2024 年就发了。代码开源，工具免费，方法就是四个提示词。真正在用的人没几个。方法在那里。四个提示词，按顺序粘贴到 Claude。

本文方法来源：Stanford OVAL Lab, NAACL 2024. 开源仓库 github.com/stanford-oval/storm