选自reddit
机器之心编译
参与:*小天、刘晓坤
近日,Reddit上出现了一个颇有争议性的问题,提问者怀疑深度学习的低门槛会破坏这个领域的声誉,业余者的加入甚至会成为深度学习成长的障碍,因为他们会轻率地将自己不成熟的知识和观念传播出去,最终会影响到业界对深度学习的认同。对此,人们从研究者和工程师的对比、技术成熟阶段性、行业标准和个人经验等角度进行了广泛而热烈的讨论。机器之心编译了其中的重点讨论,原文链接请见文末。
问题
长期以来,我看到很多人自封为深度学习专家、奇才,或者诸如此类的称呼。没有机器学习或者深度学习的教育经历或研究背景,他们仅仅安装了tensorflow或keras,然后跑了几段github代码就以为掌握了专业的深度学习知识。接着他们立刻称自己为深度学习专家,撰写博客教程,甚至有胆量教课写书。不久前,我收到了两个人关于深度强化学习一类书的写作计划,他们没有任何在机器学习、深度学习抑或深度强化学习方面的教育经历和工作经验,只是觉得自己已然是专家,不得不写本书出来...
为什么这使我困扰?
这破坏了深度学习的声誉。很多公司无法辨认这些所谓的「专家」。面试官不了解深度学习,对NIPS、ICML等毫不关心,无法正确地评估面试者。因此他们最终雇佣了这些所谓的「专家」,然后当其「深度学习」方案最终失败,面试官得出结论,深度学习毫无价值,就是炒作。随着越来越多的公司遇到这种情况,他们对深度学习更加怀疑。现在业界人士已经半开玩笑地把人工作智能称为人工智障。
你怎么看?你是否同意上述观点?如果你同意,我们该做什么?启动一个深度学习招聘网站吗?
补充:我所谓的低进入门槛并不是指低学历。我指的是你无需掌握足够的机器学习或深度学习知识,便能成功解决一些经典问题;但是对于全新的问题,你确实需要具备专业知识和研究经验。
回答与讨论
NichG:实际情况是,绝大多数公司更倾向于工程师而不是研究者。现在大多数手头工作是把标准技术应用于具体的商业用例上。投资新研究往往得不偿失。
因此大多数情况下,满意于从正确位置复制粘贴正确代码这种工作方式的人才是你真正需要的。当然,除此之外也要知道标准技术什么时候不工作及其原因是什么。
hippomancy:说的好。我司最近组建了一个深度学习团队,包括两名统计学博士、一名机器学习博士和一名博士工程师。统计学家试图构建聪明的分布近似以更好地选择特征。机器学习博士提供解决该问题的前沿对抗性方法,并写好了TensorFlow模型。工程师则写了「fromsklearn.ensembleimportrandom_forest」,因为她知道这很可能工作不错。一天结束之时,统计学家的假设错了,对抗性模型缺乏足够的数据进行训练,但是随机森林一切正常。
BadGoyWithAGun:在绝大多数领域,工程师无需假装成研究者。
automated_reckoning:这很可能是由于工程师实际负责现实世界中事物的运转。最后,研究者由于研究成果拿到钱,工程师由于解决方案拿到钱。
demonFudgePies:作为一个在「四大」工作的人,我认为不仅仅是由于其有更好的服务器,它们还十分明确地让工程师从事工程工作,研究者从事研究工作。研究者被其他知识渊博、有影响力的研究专家聘用,他们知道如何区分所谓的「专家」与专家。
visarga:你无权「保护你的声誉」。人们有权利自由使用AI工具,进行相关写作。如果一个公司不知道如何招聘深度学习人才,只好自食其果。
FermiAnyon:我的问题不同,但是相关。我在这个领域属于半路出家,获得了物理学博士学位,自高中开始一直坚持写代码。近一年来我阅读了手头所有关于机器学习的东西,并拿自己的个人项目练手。虽然我是机器学习新手,但在编程方面很老练。最近我为投简历的事很苦恼,有很多人在这两方面都是新手,他们只是看了一些YouTube视频,也许随便学了些教程,但从没有把技术应用到实际问题上,而我至少有机器学习方面的实操经验。我根据自身情况就说这么多,供面试官参考。
FutureIsMine:深度学习目前很火,任何时候有什么技术火起来的时候,就会有一些自称专家的狂热者出现。这在移动设备领域出现过,在上个世纪90年代Java领域出现过,在大数据领域也出现过。这并不是深度学习的错,只是行业标准尚未树立起来的现象而已。
我并不认为近年大部分当前最佳声明是(如你所说的)不可重现的。每一样事物的成长都需要经历加德纳技术成熟度曲线(gartnerhypecycle),有些领域(比如图像转换)甚至会有多重标准。你所说明的问题其实是,出现了很多视觉化和形象化的AI成果,但实际上要在特定的案例中实现是很困难的。
mszarvas:当前最佳(SOTA)结果不可重现是什么意思,有具体的例子吗?是第三方无法重现,还是用发布的参考代码也无法重现?
我曾经见过即使用发布的代码也不能重现的情况,这使我怀疑大多数的声明结果。但我仍然保持乐观,也许作者只是出现了一些失误。在我看来,这个领域需要树立一些标准,不应该接受任何没有标准差的孤立结果(缺少对比)。孤立结果可能只是异常值而已。
在这样的研究环境下,很多SOTA声明其实都不堪一击。更糟糕的是,视发表这些错误的SOTA声明为正当合理的,会把那些使用正确研究方法的研究者排除在竞争之外。
我们至少应该鼓励以后的论文发表还需要:
发布代码;
发表实验的完整日志。
这两样东西有助于寻找研究中的错误。
jbcraigs:低门槛其实是一件好事,因为产业中不仅需要高级研究员,还需要能将概念实现到日常应用中的工程师。
_MandelBrot:在商业领域中,构建一个真正的学习/数据管道是相当大的挑战。尤其是使用了多个无法访问的旧有IT系统工作的时候,而很多企业服务完全就是这样子的。
torvoraptor:我面试过的大多数PhD都没有做出什么有意思的成果,使他们能和一个彻底了解DL/ML/GenML的工程师相提并论。而理论基础扎实的工程师和有实践能力的PhD都是很罕见的。
PhD过分