如何做好研究:没人教过你的 8 项基本功

1869 字
9 分钟
如何做好研究:没人教过你的 8 项基本功

你领到一张桌子,一个别人替你选好的问题,还有一条模糊的指示——做出点新东西来。

然后呢?

大多数人从论文、推特长帖、公告里逆向还原这份工作。问题在于,你看到的是产品,不是生产过程。结果你学会的是怎么 装成 一个研究者,而不是怎么 成为 一个。

真正的研究能力是一堆小技能的叠加。几乎每一项都可以刻意训练。

自己选题#

Hamming 在贝尔实验室午餐时会问旁边的人: 你们领域的重要问题是什么?那你为什么不去做?

人们开始换桌子。

大多数人不是在选题,而是在吸收问题——从导师、大实验室、热门论文那里吸收。吸收来的问题,你拥有结论但没有推理过程。你不知道他们为什么在意,不知道什么情况下他们会放弃。等他们转向了,你要过一年才发现。

Schulman 把研究分成两种模式。一种读文献找改进空间。另一种先选定你真心希望它变成现实的结果,反向推导实验。他推崇第二种。一个你真正在意的目标,会把你拽进任何综述论文覆盖不到的疆域。

品味是肌肉,不是天赋。 跑每个实验前先预测结果。遮住论文结果部分,仅凭方法猜数字。预测、修正、重复几百次——所有好模型都这么训练,包括你头脑里的那个。

升级输入#

共享的阅读清单产出共享的想法。信息食谱如果是 arXiv 热门加群聊过滤,你会和所有人同时得出相同结论——价值约等于零。

旧材料被严重低估——低得离谱。 Shannon 在 1952 年的演讲里做了一件事:把问题缩到几乎微不足道,搞定缩小版,再把难度一块块装回去。就这一招,胜过任何现代生产力建议。

广度不亚于深度。懂 GPU 怎么搬运内存,就能在基准测试跑出来之前判断哪些架构论文注定失败。诚实的统计学可能是 ML 最稀缺的技能——很多发表出来的严谨不过是”用误差线包装的直觉”。

读论文本身,不要读总结帖。附录才是真正藏东西的地方。局限性部分通常是整篇文档里最诚实的一段。

把一切写下来#

Paul Graham 发现,一个想法在写成文字之前可以一直自我感觉很完整。纸面会暴露你头脑自动抹平的裂缝:那个没检验过的假设,那个不成立的推理步骤,那两句互相矛盾的主张。

Feynman 的准则: 第一个你不能骗的人是你自己。 写作是最便宜的防御。Darwin 更进一步——任何相悖的事实当场记下来,因为他发现记忆删除不利证据比删除有利证据更快。你的记忆对你失败的实验做着同样的事。

写日志:假设、设置、预期、结果、更新后的信念。重读上个月的条目,那种谦卑任何审稿人都无法匹敌。

公开发布一部分。一份清晰的解释是真正的贡献,不是服务性工作。 一整套公开发表的写作,是你思维方式最诚实的样本——无法伪造的那种。

收紧循环#

关于 Alec Radford 的故事很少涉及神来之笔。它们关乎的是量:每天更多实验,每周丢弃更多错误想法。

研究速度,本质上是你发现自己错了的速度。

工具建设是头等研究活动。启动实验,一条命令。画图,再一条命令。每次运行从配置文件复现。Karpathy 的诀窍:在规模化训练前,先在单个批次上过拟合。三十秒,一半 bug 消失。缩到足够小,先做对,再投算力。

放弃”工程只是配角”的观念。前沿领域两者已融为一体。能自己搭建实验框架的人,假设才真正得到检验。其他人都在排队。

盯着输出看#

下降的损失曲线不是分析,是心理安慰。实验抛出的信息远比你消化的多——失败案例、分布中奇怪的尾巴,大部分在日志文件夹里无人阅读。

Karpathy 在写任何训练代码之前,花几个小时亲手处理原始数据。大多数 ML 的 bug 藏在数据里,失败得悄无声息。什么都不会崩溃,你只会得到一个平庸的模型和一个错误的理论。

Andrew Ng 教了十几年同一个方法: 拉出一百个失败案例,全部读一遍,归成几堆,攻击最大的一堆。 一段真正怪异的行为记录,比精确率小数点后多一位能教的要多得多。

有目的地游荡#

你的第一个子领域不过是时机的偶然。在决定定居哪里之前,花时间去不同领域待一待。某个角落里,你的古怪特质恰好是不公平的竞争优势——找到它的唯一办法是交学费。

没有人能免掉这笔学费。

每个想法先跑一次性版本,让大部分尽早死掉。基线调到痛为止——ML 的坟场里堆满了在调好的基线上蒸发掉的收益。做消融实验直到弄清哪个组件撑起了结果。通常只有一个,通常不是标题里那个。

广度是保险。子领域都会饱和,就在推特上达到顶峰之后。能穿越转换期持续产出的人,早已熟悉邻近领域。

找到你的人#

Hamming 注意到一个模式:关着门的同事每年产出更多,开着门的同事做出了真正重要的工作。

因为每一次打断都在告诉你一件事——世界真正需要什么。你的敞开的门,大概是个收件箱。让它保持敞开。

慷慨的复利效应无与伦比。复现结果并发表。把给自己做的工具发布出去。用通俗语言解释难事。回报从侧面来——几个月后的合作、引用、你本不可能申请的职位。

半成型的想法公开抛出来。在时间线上犯错的代价,远比在出版物上犯错小。那个在陷进去三个月前就告诉你想法不行的合作者,价值胜过算力。这种关系买不到,只能挣来。

长期游戏#

Pasteur:机遇青睐有准备的头脑。

Hamming 搭建了一整套哲学:知识和生产力像利息一样复利增长。

日积月累的优势单独看微不足道。你读的东西、记录的东西、循环跑多快、跟谁争辩。给它们几年,它们造就出在外人眼里像是运气的职业生涯。

在觉得必要之前开始复利。现在才是代价最小的时候。


以上这八件事,没人会替你做。但好消息是,你也不需要任何人批准才能开始。

支持与分享

如果这篇文章对你有帮助,欢迎分享给更多人或赞助支持!

赞助
如何做好研究:没人教过你的 8 项基本功
https://blog.moewah.com/posts/how-to-be-good-at-research/
作者
MoeWah
发布于
2026-06-17
许可协议
CC BY-NC-SA 4.0
相关文章 智能推荐
1
8 个提问技巧,让 AI 问答质量翻几倍!
AI实验室 如何让AI的回答更精准?本文揭秘8个实用提问技巧,从角色设定到思考过程展示,教你通过优化提问方式大幅提升AI输出质量,解决信息模糊、答案笼统等常见问题。
2
旧文章怎么改造?独立博客存量内容翻新实战
增长与SEO 存量内容已积累域名权重和外链,稍改结构就能让AI搜索主动引用。本文用Hub-Spoke模型组织主题,让片段可独立提取,答案前置解释后置,标题描述改成问题导向。
3
史蒂芬·平克《The Sense of Style》:基于脑科学的 10 条写作法则
认知与成长 哈佛心理学家史蒂芬·平克从认知科学角度重写写作规则——知识的诅咒、古典风格、元话语、僵尸名词、树而非线……10条方法,每一条都解释了大脑究竟如何阅读。
4
创业第一年到底该干什么?YC 合伙人用 15 条生存法则讲透了
认知与成长 Tom Blomfield 在 X 上分享了 YC 沉淀十几年的 15 条创业生存法则。从产品、用户、执行到心态,帮你回答创业第一年到底该干什么、不该干什么。从 0 到 2200 个付费用户,靠的不是某一条法则,是把 15 条都做了。
5
纳瓦尔的人生智慧:关于财富、幸福与自由的 18 条原则
认知与成长 硅谷投资人纳瓦尔·拉维坎特的人生洞见浓缩:从财富创造、幸福修炼到心智模型,18 条可执行原则帮你在长期主义中找到自由。
随机文章 随机推荐

评论区

Profile Image of the Author
MoeWah
Hello, I'm MoeWah.
专题文章
分类
站点统计
文章
203
分类
9
标签
441
总字数
385,136
运行时长
0
最后活动
0 天前

目录