竹笋

首页 » 问答 » 灌水 » 科学家吴恩达机器学习训练秘籍第一
TUhjnbcbe - 2023/10/31 17:09:00

1为什么选择机器学习策略

机器学习(machinelearning)是无数重要应用的基础,其包含网络搜索、垃圾邮件检测、语音识别以及产品推荐等内容。假如你和你的团队正在研发一项机器学习应用,并且想要取得较为快速的进展,本书的一些内容将会有所帮助。

案例:建立猫咪图片初创公司

假设你正在建立一家初创公司,该公司将为猫咪爱好者们提供不计其数的猫咪图片。与此同时,你决定使用神经网络(neuralnetwork)技术来构建一套计算机视觉系统,用来识别图片中的猫。

你的团队有许多的改进方案,例如:

获取更多的数据,即收集更多猫的图片收集更加多样化的训练数据集,比如处于不常见位置的猫的图片,颜色奇异的猫的图片,以及使用不同相机参数拍摄的猫的图片通过增加梯度下降(gradientdescent)的迭代次数,使算法训练得久一些尝试一个拥有更多层(layer)/更多隐藏元(hiddenunits)/更多参数(parameters)的,规模更大的神经网络尝试加入正则化(例如L2正则化)改变神经网络的架构(激活函数,隐藏元数量等等)...

如果你能够在以上可能的方向中做出正确的选择,那么你将建立起一个领先的猫咪图片识别平台,并带领你的公司获得成功。但如果你选择了一个糟糕的方向,则可能因此浪费掉几个月甚至数年的开发时间。

2如何使用本书帮助你的团队

完成本书的阅读后,你将对于“如何在机器学习项目中设定一个技术方向”有着深层次的了解,但你的团队成员可能不理解你为何要推荐一个特定的方向。例如你希望你的团队定义一个单值的评估指标,但他们并不赞成你的观点,此时你将如何说服他们?

这正是我决定缩短章节篇幅的原因——这样你就能够将它们打印出来,并在需要之时让你的团队成员选择阅读其中的1至2页即可。

优先级的稍加改变会对团队的生产力产生巨大的影响,我希望你能通过帮助团队进行一些有效的改变,从而成为团队里的超级英雄!

3先修知识与符号标记

如果你已经学习过机器学习课程(例如我在Coursera开设的机器学习MOOC),或者你有着应用监督学习的经验,则能够理解本文的内容。

监督学习(supervisedlearning)是指使用已标记(labeled)的训练样本来学习一个从映射到的函数。监督学习算法主要包括线性回归(linearregression)、对数几率回归(logisticregression,又译作逻辑回归)和神经网络(neuralnetwork)。虽然机器学习的形式有许多种,但当前具备实用价值的大部分机器学习算法都来自于监督学习。

我将经常提及神经网络(和“深度学习”中所提到的一致),但你只需对此有基础的了解就可以阅读后面的内容。

如果对上文提到的一些概念你还不是很熟悉,可以在Coursera观看《机器学习》前三周的课程内容。(课程

1
查看完整版本: 科学家吴恩达机器学习训练秘籍第一