artificial intelligence笔记:阅读论文的建议

接触科研,读paper是一件很头疼的事情。从当初用翻译软件两天一篇,到现在平均可以一日七八篇(放假时),我自己也有不小的感悟和进步。本文就来写一下吴恩达对于阅读ML、DL相关方面论文的建议和自己的一些感想,方便参考。


建议

首先要说明的是,这里的建议不是我想出来的,仅仅是对吴恩达提供的建议做搬运及整理。
如果你读到这里,应该也知道这个领域的先驱+巨佬Andrew Ng的大名。吴恩达(Andrew Ng),著名的美籍华裔计算机科学家,曾担任百度首席科学家,任教于Stanford,大家刚入门的时候想必都了解过或者看过由吴恩达老师讲授的斯坦福的经典课程CS229机器学习、CS230深度学习,此外,Andrew Ng还特地在网易云上为中国学生提供了中文字幕的课程(Andrew Ng英语说得比中文溜好多了哈哈)。另外,他还是著名教育平台Coursera的创始人,那里的课程更新鲜更优质,而且还可以锻炼英语能力,旁听即可。

呃放错了,不是上面那张,是这张。

对于如何阅读论文,Andrew Ng的建议是:
不要从头读到尾。相反,需要多次遍历论文。
具体有如下几个注意点:

  1. 阅读文章标题、摘要和图

    通过阅读文章标题、摘要、关键网络架构图,或许还有实验部分,你将能够对论文的概念有一个大致的了解。在深度学习中,有很多研究论文都是将整篇论文总结成一两个图形,而不需要费力地通读全文。尤其是在描述网络架构的时候,作者一般会采用比较通用的格式,读多了就会熟悉起来,比如下面DenseNet的结构:
  2. 读介绍、结论、图,略过其他

    介绍、结论和摘要是作者试图仔细总结自己工作的地方,以便向审稿人阐明为什么他们的论文应该被接受发表。
    此外,略过相关的工作部分(如果可能的话),这部分的目的是突出其他人所做的工作,这些工作在某种程度上与作者的工作有关。因此,阅读它可能是有用的,但如果不熟悉这个主题,有时会很难理解。
  3. 通读全文,但跳过数学部分

    这里我说一下我对于数学部分的处理:一般我会把重要的公式等略读一遍,然后参照着CSDN博客等网站上其他网友的解释与详解进行理解。
  4. 通读全文,但略过没有意义的部分

    Andrew Ng还解释说,当你阅读论文时(即使是最有影响力的论文),你可能也会发现有些部分没什么用,或者没什么意义。因此,如果你读了一篇论文,其中一些内容没有意义(这并不罕见),那么你可以先略读。除非你想要掌握它,那就花更多的时间。确实,当我在阅读ILSVRC、COCO等顶级比赛许多获奖模型的论文时,其中都有对比赛情况的详细结果介绍,我觉得这些部分一定程度上是可以扫读和跳读的。

感悟

目前我阅读过大多数论文的组成一般为Abstract、Introduction、Related Work、Method、Experiment、Conclusion。
可能阅历丰富的研究者能够从Abstract中提炼出比较关键的信息,但我个人认为,一篇文章最关键的是Introduction部分,该部分一般会包括前因后果和文章有哪几个contribution的总结,涵盖了本文解决的问题和一些主要概念和思路。
Related Work主要是对之前论文的分析,相当于是Introduction部分中前因的具体分析,相当于精简版的综述,如果对该领域比较了解的话完全可以跳读,但如果不熟悉该领域的话还是能从中学到很多重要的信息的。
Method部分是对Introduction部分中contribution的具体化,从这里开始会涉及到较多理论的内容,细品还是略读要靠自己拿捏。
Experiment是比较容易忽略的部分,不过有时候会提及一些trick,如果有ablation experiments的话可以重点关注一下。注意,在一些预印论文网站上的占坑论文有可能实验部分不是很完全,这是我们用于判断该篇论文结论是否可靠的依据。
Conclusion其实是Introduction的缩写,如果有未来研究方向的展望的话可以看一下。


分享

关于论文,我之前也做过一些分享,详情可以看看我之前的文章。
deep-learning笔记:开启深度学习热潮——AlexNet一文中,我提到了刚开始阅读英文论文的比较有效的方法。
deep-learning笔记:使网络能够更深——ResNet简介与pytorch实现一文中,我也提供了许多经典模型论文的英文版、中文版、中英对照的链接。
最后要说明的是,本篇文章中Andrew Ng的建议有部分摘自公众号Datawhale的推送文章。我关注了不少这方面的公众号,筛选了几个比较优质的,在今后也会一一放到博客中推荐。


碰到底线咯 后面没有啦

本文标题:artificial intelligence笔记:阅读论文的建议

文章作者:高深远

发布时间:2019年10月07日 - 23:25

最后更新:2020年03月13日 - 16:21

原始链接:https://gsy00517.github.io/artificial-intelligence20191007232512/

许可协议: 署名-非商业性使用-禁止演绎 4.0 国际 转载请保留原文链接及作者。

0%