科研选题与论文的创新点


初级阶段:拿着锤子找钉子,可能会有灌水,硬造问题

但是锤子是基础

之后如何突破瓶颈:

很多时候是,痛点也知道,问题也知道,但解决不了,但知道问题是什么已经成功很多了

学会找特定的setting下的问题

一些别人的看法

1 我的关于科研选题的一些思考

作者:一路向北
链接:https://zhuanlan.zhihu.com/p/671458670
来源:知乎

之后我也一直在思考,其实选题本身也是一个金字塔

  • 塔尖是Resnet,MAE,Diffusion这种可以引起整个CV界大地震的工作,属于基础研究DreamWork,做的人少影响力大,但同时也充满曲折,因为你在开创一种新的范式没有之前的工作可以follow,同时也不一定会做出来。
  • 塔中是一些较为开创性的工作(相较塔尖,但是能做出这一类的工作也同样是值得称赞的),也就是一些挖坑的工作。比方说把transformer引到视觉领域里,把参数高效微调引导视觉领域里,等等。这些工作背后可以引申出更多的相关工作(也就是俗称的填坑)。做出这类工作一般需要敏锐的科研嗅觉,了解其他领域的最新进展;同时还需要对自己的领域相当熟悉,需要知道怎么才能把其他领域的技术引进来。
  • 塔底是一些follow别人工作的研究,做起来更容易(大多数情况都有之前的代码),新手友好。魔改网络,刷点等等。这些工作比较容易上手,但是坏处是你做出来之后关注度比较低,甚至可能因为follow的工作的意义不大而被拒稿。

其实大多数人的科研历程也类似一步步地从塔底走向塔尖的过程。

目前我的目标是既要做一些塔中的工作(锦上添花),也要做一些塔底的工作(雪中送炭)。对应前文叶子要有,花也至少要有一朵拿得出手的。当然在做塔底工作的时候也要尽量做“第二个吃螃蟹的人“。因为一个领域卷烂之后刷点很难,做出来也没有什么人引用你的文章,因为这个领域很难再刷上去了


2 计算机视觉 | 哥大读博五年总结(全)

作者:Mike Shou
链接:https://zhuanlan.zhihu.com/p/338193330
来源:知乎

(1)Phd选题

我觉得这段经历,对新手很有参考价值,很多时候光努力不够,方向更重要。新手如何选博士几年的topic,有两个问题值得思考:

能不能快速上手?有几个简单的评判标准:

  • state-of-the-art的paper有没有开源的代码?目的是你能迅速复现baseline,熟悉整体pipeline(如怎样预处理,后处理),加深对实现和细节的理解
  • 有没有对这个topic有hands-on经验的师兄,或者community里面approachable的前辈?目的是,当你遇到实现上的细节问题,可以及时咨询和得到反馈
  • 这个topic有没有比赛,或者标准的benchmark?目的是,有大家已经定义好的数据,实验setup,评价标准;这样,你有可以直接比较的baseline,outperform baseline的时候也容易被人认可

能不能有大的impact?这里我指的是博士期间的大方向,由一系列单项的工作或者paper构成。单篇paper通常有三种类型:(1)First work:开创了一个topic,比如RCNN于object detection(2)Last work:基本解决了一个topic,比如Faster-RCNN,YoLo于object detection(3)Improve类型,介于First和Last之间的。

Last很难,Improve常见但影响力不够深远,对于新手而言,博士的早期工作,在有能力做出来和有impact之间的trade-off比较好的,估计是First了,不一定非要是第一篇,只要是某个topic里面开创性工作的那一批之一,都是不错的。这个早期工作之后,你会对这个问题哪里要改进,有很清楚的认识,因为improvement room大,也会有很多ideas。同样,早期的时候怎么选这样一个topic呢:相关的比赛是这一两年新开的吗,相关的benchmark是这一两年出来的吗,上面的结果提升空间大吗(现在是20%还是已经80%了)?

(2)单篇Paper选题

前面说的PhD选题是大方向上的,具体到每一篇paper,选择的principle和重点则不太一样。来Facebook后从马爷爷那知道了一个著名的Heilmeier问题系列,是指导老师们申项目的,我觉得稍微改改,便很适用于我们考虑,某一篇paper的选题,合不合适:

  1. What are you trying to do? Articulate your objectives using absolutely no jargon.
  2. How is it done today, and what are the limits of current practice?
  3. Who cares? [Support other’s research? Shape research landscape? Power applications in industry?]
  4. What’s new in your approach and why do you think it will be successful?
  5. If you’re successful, what difference will it make? [e.g. Contributions in theory/modeling? Improve accuracy by 5% on dataset A, B, C…?]
  6. What are the risks and the payoffs? [Further, how would you mitigate the risks? If your proposed method does not work, what could be alternative design? These can end up as discussions such as ablation studies in your paper.]
  7. How much will it cost? [e.g. How many GPUs do your experiments require? How long is each training process? How about data storage?]
  8. How long will it take? [How many hours are you going to work on this per week? When is the submission DDL? Can you make it?]
  9. What are the midterm and final “exams” to check for success?

3 AI论文如何找到创新点

作者:四块二学长

链接:【AI论文如何找到创新点】 https://www.bilibili.com/video/BV1Fa4y1m7Bu/?share_source=copy_web&vd_source=994cbda57e25e37f615fa663eee69db5

来源:哔哩哔哩

创新点来源

  1. 老文章用新框架(深度框架)重新做(强创新)

    传统方法改深度学习方法:明确学习目标,输入输出,损失函数

  2. A+B(蒸馏、NAS、重参数化repvgg)(弱创新)

  3. 输入输出新角度(看实现难度)

  4. 有监督改无监督(强创新)

例如可变形卷积的概念和应用。建议关注该领域的最新概念并寻找结合自己任务的机会。


4.作为审稿人,你什么情况下会选择拒稿?

作者:重剑无锋

链接:作为审稿人,你什么情况下会选择拒稿? - 重剑无锋的回答 - 知乎

来源:知乎

刚好前不久NIPS给我发了top reviewer award就来分享一下我的心得

最主要的判断必须是基于文章本身我认为几个类型

  1. 颠覆了我的认知让人有种脱口而出“卧槽”的冲动我是肯定给8分起跳,至少strong accept,而且我会非常热心defend我的评分,主动说服其他reviewer

    这种work可能两年能有一篇被我审到,要么是告诉我一条崭新的技术路线,要么是打破我固有的观念。

    比如斯坦福有一篇差分隐私的文章,将计算成本为普通训练几十倍的隐私计算压到了2倍,生生打破了我对隐私计算复杂度的理解,即使这篇paper没有任何理论而且不通用(比如无法用在CNN上),我也认为这是本领域spotlight,类似的例子还有transformer一这种打破RNN传统sequential training路线的和adagrad这种第一次把adaptivity引入的文章

  2. 增广了我的知识,让我觉得“我猜也是如此,谢谢你证实了”。大概是weak accept到accept

    可能70%的work都属于这一类,哪怕顶会顶刊绝大多数也是这类work,没有惊喜,但是详实的话也极有价值

    如果说第一类work的贡献是指出了科研未来的方向,那这第二类work的贡献就是降低了未来的不确定性,告诉大家这个方向是对的,可以继续往前走。实验和理论我放这了大家不用浪费资源/人口/算力了

    比如说如果有人做了两层神经网络的收敛性分析,那么做三层的或者把bound收紧就属于这一类,具体点比如NTK理论先搞出来了两层神经网络在MSE loss的GD的收敛,之后Allen Zhu做了极度扎实的框架囊括了crossentropy loss和SGD等新情况。现在citationt也600+还在持续攀升。

    再比如说实验类empirical文章,可能我还没读到具体算法的时候,光看你大致思路我就猜你这个改进大概只能涨一两个点。那么如果你涨了10%,我就送一句卧槽((比如deepmind最近那个差分隐私的paper,没想到data augmentation能涨几十个点),算你第一类文章如果真的就涨了一两个点,那就weak accpet,如果突破了我的猜测一丢丢,比如涨了五个点那就给accept。

  3. 对我的认知没啥影响

    要么是做的老生常谈新瓶装旧酒,要么“新意”纯粹就是模型-数据-任务排列组合。

    这类work我会给borderline,看审稿的期刊会议档次,如果NIPS级我就borderline reject,除非文章很完整很正确,该有的实验和理论都有,唯独缺novelty,那我还是给borderline accept。

  4. 除了让我叹气和疑惑啥也不是

    这类work最近送审的越来越多了,有的存在根本性错误,证明性的实验性的都有

    比如测试集搞成训练集了,比如魔改了常规定义或者performance measure

    比如baseline选了过时的过弱的,有的实验机理描述不清甚至前后矛盾,读完无法理解他做了什么。一般我会给个borderline reject提问题,如果能解答我的疑惑,再调分上去。如果让我更加疑惑那就对不起了,strong reject也是有的。

    当然也有跟文章本身无关的极端情况,比如一稿多投抄袭等学术不端,那不管文章质量多好都必须拒掉这里就比较考验搜商了记得拿到稿子都回去各个数据库比一下。

Note

可能还是得先学会如何做第二类的工作


5.【Café速递】李圣雨:多源融合时空标定/导航定位与科研经历分享

作者:李圣雨

链接:【Café速递】李圣雨:多源融合时空标定/导航定位与科研经历分享

来源:微信公众号

在最后,李圣雨结合自己的科研经历,分享了他对于研究方向和科研的认识。

他指出,科研过程一般分为分为两种路径:一种路径比较有针对性,即一直在导师的指导下,由浅入深地完成各个课题,直到毕业;另一种路径则更加具有挑战性,即导师可能没有足够时间指导,或者导师只指导前期的课题,之后需要自己发现新思路和新课题。针对后者,他讨论了如何确定研究方向的问题。

李圣雨将研究方向大致分为三种,即方法驱动、数据驱动和自驱动。其中,方法驱动难度最大,在缺乏信息时,可以从方法驱动和自驱动入手。

image-20240529162101983

同时,李圣雨还以自己的研究方向和科研经历为例,结合自己的思考,给出了以下建议:

(1)方向选择,可以从老师的研究基础或是开源框架出发,循序渐进地深入研究,避免因跨度过大,直接进入自己和指导老师都不熟悉的领域,从而遇到困难而束手无策的情景。

(2)科研交流,可以积极参加高水平的学术会议研讨,以及相关的同门交流活动,可以取长补短,获得不同视角的建议和帮助。

(3)科研正反馈,漫长而严谨的科研需要适当的正反馈,如论文接收、获得奖学金等,适当的正反馈能够激励研究人员在遇到困难时保持动力和自信心,使研究得以顺利推进。


6. 论文的故事线

作者:Shu Yang(https://github.com/shuyhere)

来源:小红书发的

可以按照下列的故事线总结论文的核心

  1. X (+define X if not obvious) is an important problem
  2. The core challenges are this and that.
  3. Previous work on X has addressed these with Y, but the problems with this are Z.
  4. In this work we do W (?).
  5. This has the following appealing properties and our experiments E show this and that.

文章作者: Hongbo
版权声明: 本博客所有文章除特別声明外,均采用 CC BY 4.0 许可协议。转载请注明来源 Hongbo !
评论
  目录