机器学习其实只是“皇帝的新衣”

作者: Cassie Kozyrkov

来源: AI前线

发布日期: 2018-10-26 13:26:16

本文通过简单易懂的方式解释了机器学习的核心概念,指出机器学习的本质其实并不复杂,鼓励读者不要被专业术语吓倒,并通过具体的例子展示了机器学习的工作原理和应用。

机器学习概念其实很简单,不要被听起来高大上的术语名称唬住了!实际上,ML 工程中最难的部分是安装包,其次是让人感到恐怖的数据集,接下来是永无止境修改代码设置的过程。通过本文,你也许会发现机器学习的概念可能是“皇帝的新衣”,它的本质比你想象得简单很多。

下面我们来看看机器学习是如何工作的:机器学习使用数据中的模式来标记事物。它的核心概念实际上非常简单。我们将使用标记葡萄酒是否美味来进行标签示例,并用尽可能简单的方式进行这一过程。ML 不是魔法,没有数据是不可能学会的,所以我得尝点酒。首先需要学习。假设我品尝了 50 种葡萄酒,并将它们的信息可视化,以供参考。每种葡萄酒都有年份和评价分数,还有我们想要学习的特征:Y 代表美味,N 代表不那么美味。

通过选择学习算法,我们可以得到想要的输出类型。机器学习算法的目的是在你的数据中选择一个最合理的位置设置边界。如果你这时候想到画一条线,那么恭喜你,你刚刚发明了一种机器学习算法:感知器。确实,这么简单的东西居然用了这么科幻的名字!所以,请不要被机器学习中的术语吓倒,它通常没有它的名字那样让人感到震撼。

机器学习算法的目标是选择最合理位置设置边界,它根据数据点的位置来决定。通常来说,我们通过优化目标函数达到这一效果。目标函数就像计分棋盘游戏的规则,对它进行优化也就是是找出如何玩,能让你获得最高分数的方法。损失函数就像计分棋盘游戏的规则,优化它就是找出最佳玩法,以使你能得到最好的分数。

如果你喜欢多样性,你会喜欢算法,因为算法太多了。它们的不同之处在于如何尝试不同的位置作为分离边界。当我们确定边界方案时,我们只是选择了我们在标签之间绘制的边界的形状。我们是想要用一条对角线或许多水平/垂直的线,还是灵活的曲线把它们分开?有很多算法可供选择。

一旦确定了分界线,算法就完成了,你从中得到的你一直想要的:所谓模型,只不过是对结果的一个花哨的表达方式,它实际上就是计算机用来将数据转换成决策的指令。下次我再输入一瓶新酒时,它就可以把数据转换成决策结果。如果数据落在蓝色的位上,就称它为蓝色。落在红色位置上,称它为红色。

总而言之,机器学习可能平淡无奇,但你能用它来完成不可思议的事情!它可以帮助你编写自己想不到的代码,让无法描述的过程自动运行。

UUID: 01246826-f862-4ebc-950b-f5433fdf30c0

原始文件名: /home/andie/dev/tudou/annot/AI语料库-20240917-V2/AI语料库/中科院物理所公众号-pdf2txt/2018/中科院物理所_2018-10-26_「转」机器学习其实只是“皇帝的新衣”.txt

是否为广告: 否

处理费用: 0.0047 元