沈向洋、华刚：读科研论文的三个条理、四个阶段与十个问题

新智元报道

来源：微软学术互助

编辑：白峰

【新智元导读】近日，微软亚洲研究院「沈老师带你肝论文」暑期科研训练班在线上举行了开班仪式。沈向洋博士与同学们分享了他阅读、撰写科研论文的名贵经验，尔后Wormpex AI Research 副总裁兼首席科学家华刚博士分享了他对于低级科研事情者如何通过论文阅读得到快速发展的思索。

学会阅读论文是科研事情的第一步，下面，我们将与各人分享沈向洋博士和华刚博士的演讲，希望为做科研的你带来思索和启发。

沈向洋

美国国度工程院外籍院士

英国皇家工程院外籍院士

微软公司前执行副总裁

沈向洋博士主要专注于计算机、视觉、图形学、人机交互、统计学习、模式辨认和呆板人等偏向的研究事情。他所设计的四分树样条函数算法是世界上最好的运动参数预计算法之一。他已发表关于计算机视觉、计算机图形学、图形辨认、统计学习和呆板人科学方面的数百篇论文，拥有凌驾 50 项美国专利。

华刚

Wormpex AI Research

副总裁兼首席科学家

华刚博士是 IEEE Fellow，IAPR Fellow 和 ACM 良好科学家。他的研究领域包括计算机视觉、模式辨认、呆板学习和呆板人技能等。在加入 Wormpex 之前，华刚曾担任微软计算机视觉科学主任以及史蒂文斯理工学院副教授。

沈向洋博士：如何以正确方式打开一篇科研论文？

很兴奋有如许一个时机跟列位同学、VC 组的研究员们交流，也非常感谢华刚跟我一起准备这个演讲。

我想今天听陈诉的大多数学生应该是在研究生院阶段，我非常喜爱这个阶段的生活，由于这可能是你一生中时间最富足的阶段，以后事情了就会非常忙。我想夸大的是在这个阶段，你应该多念书、多读文章。如果你决定要从事科研事情，就需要不停地学习、理解和消化知识，再过渡到自己创造知识、散布知识。

多年前，我到微软亚洲研究院后就建立了 Visual Computing 组，对它有着深厚的情感。这几年我也一直在思索息争决一个非常紧张的问题——阅读和理解之间的不匹配。通过科研论文的角度去思索阅读和理解之间的关系，是整小我私人类智能中非常紧张的部门。下面，我想分享自己对做科研方面的一些领会，特别是怎样读 paper 和写 paper、怎么样更好地做科研。

我认为好的研究员有几个特质，起主要 open-minded——这个世界只有想不出来的工具，没有做不出来的工具，要有批判性思索的能力；其次是要积极事情；另有要不停更新自己的知识面，要读许多最新的工具，然后思索、交流，如许才能逐步把自己学到的工具用起来。

今天主要想跟各人分享我在读科研论文方面的一些心得。读文章有几个阶段，最简朴的是所谓的“消极阅读”（passive reading），即大概知道文章讲了什么；然后是“积极阅读”（ active reading），自动思索这些知识有什么用；然后是“批判性阅读”（critical reading），思索这篇文章是否言之成理理；末了是“创造性阅读”（creative reading），搞清晰文章对接下来的事情有什么帮助。

我认为在读研究生期间需要掌握三个非常紧张的技能：阅读、写作和展示。现实上这三件事情有内在的逻辑关联。我有个同事 Simon Peyton Jones 对此提了一些发起，各人可以到 MSR Cambridge 寓目他的视频“how to write a great research paper”和“how to give a great research talk”。

读论文为什么这么难？

如果各人决定做科研，那读论文就是必修课。为什么读论文这么难呢？

起首，大多数科研论文自己写的不是特别好，大多数作者的母语并不是英语，而英语又是学术界的官方语言，以是一些作者在论文语言把控上短缺火候。我回过头来看自己早年写的几篇 paper，有时候会希望自己没有写过它们。文章写得欠好只是一个客观缘故原由，论文难读的第二个缘故原由，是读论文时读者需要对论文主题有很深的配景知识储备。第三个缘故原由是在阅读中遇到困难的时候，我们不知道应该从那里、向谁寻求帮助。第四个缘故原由是读完论文以后，如果我想继续深挖这个主题或者探索研究偏向，除了去问导师以外，还可以向谁寻求意见呢？第五个缘故原由，是当今世界有太多的诱惑和滋扰，不像我们从前“两耳不闻窗外事、同心专心只读圣贤书”，在这个有互联网的世界里，长时间专注是一件很困难的事情。

我想跟各人分享这几年我一直在想的一个问题，就是所谓的“disconnect between reading and writing”。人类社会发展到现在离不开获取知识和利用知识，但是目前为止，阅读和写作这两件事仍是脱节的，作者和读者的非直接相同中一定有理解的偏差。

现实上，这种关系可以用香侬的信息论原理来解释——论文是作者和读者之间交流信息的渠道，主要是单向传输，信息源是作者，而目的地就是读者。写作就像编码，阅读就像解码，以是我们需要一本 Codebook 来先容“编码”到“解码”所需要的知识，也即作者根据这本 Codebook 中的规范举行“编码”，阅读者则用它来“解码”。

实在，香侬理论只是归纳综合了阅读与写作的一部门，真实的阅读每每逾越了传统的“传输-压缩”框架，它更多的是一个重复的理解历程。在这个历程中，读者不停地臆测作者的意图，并将之解组成可以或许理解的片断，随后这些片断被构建到读者脑中的认知模子里。以是，阅读等同于理解，差别条理的阅读对应差别条理的理解——深度阅读导致深度理解，浅近的阅读对应的一定是浅近的理解。差别需求应该对应差别的阅读条理，你可能需要快速欣赏，可能需要仔细阅读，如果你的导师需要你复现论文中的细节，那么你就需要非常深入地研读。

阅读文章的三个条理：速读、精读与研读

相识了阅读的本质，那么我们应当如何阅读paper呢？

起首是要有“速读”的能力，快速知道一篇文章讲了什么。其次是要“精读”。精读有两个方面：批判性阅读和创造性阅读。起主要对论文举行否认、质疑，仔细挑毛病；其次，对论文有了足够的相识之后，如果发明论文中提到的想法非常优秀，那么要创造性地思索你能用这篇论文做什么。第三个步骤，我称之为“研读”，好比说自己实验将文章中的算法实现一遍。

除了阅读的方式，读者还要理解所读的论文是怎样写出来的。一篇好的论文在逻辑上是层层递进的，不仅可以或许转达信息也可以或许激励读者。以是作者在写的时候也是有结构化的逻辑性思索水平的。总体上作者会思索：这篇论文的真实使命是什么、研究发明是什么；论文的孝敬是什么等等。

相应地，读者在读论文的时候也应该要有逻辑，起主要清晰论文中的表达是否是我想要学习到的；其次，我能从论文中学到几多，能不能找到新的偏向与新的课题初稿；末了，这篇论文的配景是什么——是什么样的配景让这篇论文变得紧张和有趣。

无论是计算机视觉领域的文章照旧泛计算机类的文章，一般来讲，都可以归为以下几类：提出问题型论文、解决问题型论文、论述和观察型论文、总结型论文。

快速阅读：如何读标题、择要和弁言

接下来我向各人先容一些读论文的经验。起首是快速阅读。计算机视觉领域的著名学者 Don Geman 曾经说，一篇文章可以分为标题、择要、弁言、论文主体四个部门，每一部门都需要花同样的时间举行撰写。这个说法虽然夸张但是不无原理，由于大多数读者现实上最存眷的就是文章开始的两页纸。对读者而言，看完前两页就知道这篇文章是不是值得去读；对 reviewer 而言，看完开头就知道能不能拒绝这篇文章。

我的前同事 Jim Kajiya 是一个非常了不得的图形学专家，他最牛的地方就是基本上从来不和别人合写文章，都是自己独立完成。Jim曾经写过一篇文章“How to get your SIGGRAPH paper rejected”，文中最焦点的观点是文章一定要写得易读——这篇论文是关于什么的？它解决了什么问题？迷人之处在哪？有什么新的工具（我一直夸大做科研的终极问题就是 what's new，写文章的时候一定要夸大文章中有什么新的工具）？巧妙之处安在？

如何读论文的弁言？举个例子，我最近在读《拥有伦理学：企业逻辑、硅谷与伦理学的制度化》（Owning Ethics：Corporate Logics, Silicon Valley, and the Institutionalization of Ethics），在弁言部门，我问了 Kajiya 提出的那几个问题。起首这篇论文讲的是高科技公司在道德方面做了什么；其次，解决的问题是现在的实践（拥有道德）做法；文章的迷人之处在于最近的丑闻和技能后冲（techlash）；这篇文章的最新之处是对 17 位科技公司的“道德拥有者”举行了采访；末了，论文的神奇之处是得出告终论：道德全部者在令人担心的动态中运营公司。

接下来，我将先容如何读择要。计算机学科论文中的择要一般有固定格式，读起来非常枯燥。以是，要读择要的时候，将其剖析并加上一些有趣的亮点，可能有利于阅读。中国学生的英语一般都不太好，虽然到了研究生阶段，思维方式可能还停留在中文思维到英文思维转换的阶段。对此，一个很好的发起是实验把择要翻译成中文，在这个历程当中，你会发明自己有一些细节没有领会到位，第一遍读的时候不见得读懂了。

回到标题，如何读论文的标题？标题一般只有一句话。从整篇论文的排版的角度来看，在一页半的弁言、四分之一页的择要以及八页的双栏正文眼前，只有一句话的标题显得不太“紧张”。但是标题是总结、抽象的归纳综合。我曾有一个紧张发明：高质量的文章通常标题用两个词就能归纳综合，并以 ing 末端，比方 Plenoptic sampling、Lazy Snapping、Poisson matting。以是对于读者来说在读这些抽象的词或句子的时候，只有花费较多的时间才能读懂论文作者的意图。

仔细阅读：从批判性阅读到创造性阅读

下面我将先容仔细阅读的一些技巧。

以批判性阅读开始，带着质疑的心态问问题。如果作者论文中声称解决了一个问题，那么你就要在心里问自己：论文是否正确、真正地解决了问题？作者论文中所用要领是否有局限性？如果所读的论文没有解决问题，那么我能解决么？我能接纳比论文中更简朴的要领解决么？以是，一旦进入仔细阅读的状态，要在读论文之前对自己说：这篇论文可能有问题，我要找出来。这就是批判性阅读。

批判性阅读可能非常难，也可能占用你许多的时间，早期知识储备不敷时，读论文的历程中很容易卡壳。常见的发起是找熟悉这方面事情的人帮助，让他们解释你遇到的难点。但你要意识到找人帮助也可能遇到困难，一方面，你要找谁帮助？另一方面，如何能让他们愉快的接受你几分钟、十几分钟、甚至靠近一个小时的咨询？他们不一定有那么多时间。以是我一直勉励各人在研究生阶段一定要跟身边导师、师兄师姐、厉害的同学们搞好关系。比及你自己成为师兄师姐后，也要积极回应学弟学妹们的提问。

除此之外，也发起你们多找一些配景知识阅读，多做条记，多在网上搜索相干论文，然后再次通读所卡壳的论文，并试着把它与其他论文相接洽起来，云云坚持下去，定能度过难关。

掌握了批判性阅读的技巧后，如何到达创造性阅读的条理呢？这时候你要问自己：在我所读的论文中，有哪些好的idea？（一般文章中只有一个idea，好的文章中可能有两个idea，最了不得的文章可以有2.5个idea。）搞清晰作者的idea以后你要思索，作者有哪些点还没有想到？可以怎么改进？如果我现在做这项研究，我能做的新事情是什么？

如果说批判性阅读是“negative thinking”，那么创造性阅读就是“positive thinking”。创造性的阅读需要把你所读的论文和其他相干的论文建立接洽，从而产生一些新的想法，这些想法可以支持你举行三个月到五个月的研究。如果读到了非常好的文章，不妨写一篇半页到一页左右的review。最好做一个口头展示，如许你会发明，只有把工具写下来或者说出来才能真正深刻理解。

我一直以为理解了一个工具以后，最紧张的是可以或许自问自答，这张图片是一个总结（图片不见啦？），图片的上半部门是比力客观的问题，包括论文的焦点观点是什么？主要的局限性是什么？代码和数据是不是可得的？论文的孝敬是否有意义？论文中的实验是否足够好？图片的下半部门是比力主观的问题，包括我错过了什么相干论文么？这对我的事情有何帮助么？这是一篇值得存眷的论文么？这个研究领域的领头人是谁呢？哪些公司、研究院、实验室值得存眷？其他的人对这篇论文有何看法呢？如果有机访问到作者，我应该问作者什么问题？当你在阅读论文的时候如果能回答出上面列出的问题，我信赖你会对你所读论文有非常深刻的理解。

有哪些工具可以帮助我们？

我还想跟各人分享一些可以或许帮助阅读论文的工具，比方谷歌以及必应网页搜索引擎、谷歌学术、arXiv 等可以或许搜索到你想要的论文，但这些工具都不能真正帮助我们读懂 paper。在阅读的历程中，OneNote 可以帮助你做条记；CliffsNotes 作为美国知名的学习指南网站，可以或许提供文献学习指南；Mendeley 是非常优秀的参考文献管理。

另外也强烈发起各人使用在线论坛讨论论文，增长学术交流，增强对所读论文的理解能力，但是遗憾的是，尚未有非常适合讨论论文的在线论坛，现在的一些社交网络产物大概很棒，但是它并不是为了学术研究目的而设计，究竟学术论文的“非有趣性”不适合社交产物的调性。

末了，我想向各人先容几个小tips。我最想夸大的是要养成写小总结的习惯，最好能做陈诉，如许真的可以或许增长你对所读论文的理解。我想再次夸大，各人一定要有耐心，由于阅读就是在你大脑中建立认知模子的历程，虽然不知道今天读的文章未来什么时候可以或许派上用场，但是请各人保持阅读、建立认知的习惯。

华刚博士：带着十个问题去阅读和思索

接下来我将和各人分享作为研究员如安在学术领域得到发展的一些经验。这次暑期训练班的初志是希望帮助到各人建立科学研究事情的认知模子，下面我会引入一种叫做“模板阅读”的要领论。

犹如前面沈老师所说的，读 paper 可以分为四个阶段：消极阅读、积极阅读、批判性阅读和创造性阅读。

我认为各人可以通过严酷的科研训练到达批判性阅读之前的阶段，但是创造性阅读的境界很难只通过训练告竣。只有积极自动地去思索问题、把自己的配景知识与之接洽起来，形成一个“故事”，并可以或许自己誊写自己的“故事”时，才能在学术社区建立认同。

本次科研训练中，我希望同学们可以或许带着这十个问题去阅读文章，可以或许筛掉无用的信息、让真正有用的信息被构筑到自己的认知模子中，真正掌握这种科研思维模式。从呆板学习的信息瓶颈（Information Bottleneck) 的类比看，这个历程就是让你的思维认知模式颠末这十个问题模板形成的一个信息瓶颈而打造成型。

带着10个问题去阅读和思索

1. 这篇文章究竟讲了什么问题？比方说你设计一个算法，它的 input 和 output 是什么？

2. 这个问题的性子是什么？是一个新的问题吗？如果是一个新问题，它的紧张性安在？如果不完满是一个新问题，那为什么它“仍然紧张”？

我在西安交大念书的时候，沈老师曾经给我们做过一个演讲，其中有一句话令我印象深刻——“一流的研究员发明新问题”。发明有意义、有挑战性的新问题，现实上是一个研究最大的孝敬。但究竟学术领域内人才济济，许多人没有时机发明新问题，以是许多文章致力于回答第二个问题——为什么这个问题仍然值得去研究？

3. 这篇文章致力于证实什么假设？接受过深度科研训练的人都知道全部研究实在都是从科学假设开始的。从 12 年开始，计算机视觉领域的许多研究员认为这是一门实证科学（experimental science），即需要提出假说并通过实验去验证。

4. 有哪些与这篇文章相干的研究？这一领域有哪些要害人物？

各人做研究、读文章时，要相识这个偏向的紧张事情和从事相干研究的要害职员信息，才能把问题的来龙去脉搞清晰。让领域内的人们熟悉你、相识你的事情，你才能逐步地被更多的专家、偕行认可。我一直认为作为一名研究员要足够“八卦”，知道领域内哪些人做什么样的事情。

5. 这篇文章提出的问题解决方案中，焦点孝敬是什么？

6. 实验是如何设计的？计算机视觉研究中，实验设计的紧张性不问可知。但在写 paper 的历程中，实验的体现不是最紧张的，要害是如何通过实验去支持每个假说。

7. 实验是在什么样的数据集基础上运行的？科学研究结果应当是可以量化、可以复现的，读文章的人是否能打仗到文中所用的数据集？

8. 实验结果能否有力地支持假设？如果一篇文章提出的假设并没有被实验或者理论完善支持的话，多半不是一篇好的文章。

9. 这篇文章的孝敬是什么？回答了前面 8 个问题之后，第9个问题的答案也呼之欲出了。你应当试着用自己的语言总结出来。

10. 下一步可以做什么？这是非常要害的一个问题，也决定了你今后能否在科研领域得到乐成。在这篇文章的基础上，我们接下来能做什么？应该做什么？在科学研究的初期，导师会给你偏向上的引导，但作为一名独立的研究员，你应该独立地回答这个问题。

以上就是这十个希望各人回答的问题。本次训练可以领导各人到达批判性阅读的阶段，但要终极到达创造性阅读的阶段，还需要你有“T 字型”的知识结构，即有足够广的知识储备，在某个偏向钻得足够深。我们希望你也能提出自己的“10 个问题”，写出你自己的故事。这种多样性，正是科研领域康健发展的要害。

两位老师的精彩演讲是否令你心潮汹涌、充满劲头呢？“You are how you read”，阅读文章不仅是各人在科研门路上进步的必由之路，也能使我们的心智不停发展，认知模子和，思维方式不停完善。这个暑假，让我们一起在科研之路上乘风破浪吧！

（声明：本文仅代表作者观点，不代表新浪网态度。）

文章要害词：网络文化

用微信扫描二维码分享至挚友和朋友圈

' + _substr(uids[i].name, 0, 14) + '

' + _substr(uids[i].v_reason, 0, 16) + '

淘小铺怎么赚钱 http://www.ldjzfw.com/