加入收藏 | 设为首页 | 会员中心 | 我要投稿 晋中站长网 (https://www.0354zz.com/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 运营中心 > 网站设计 > 教程 > 正文

Google科学家最新整理,给新手推荐的十篇优秀数据科学文章

发布时间:2019-08-21 07:38:31 所属栏目:教程 来源:skura
导读:作为数据科学的初学者,一些好的文章能够快速带我们入门这一充满了未知和挑战的领域。近日,google 决策智库的主管 Cassie Kozyrkov 整理了十篇给学生们推荐的 优秀 文章。下面这些文章几乎都来自于相同的博客。让我们来看看是哪些文章吧~ #1 理解数据 文
副标题[/!--empirenews.page--]

作为数据科学的初学者,一些好的文章能够快速带我们入门这一充满了未知和挑战的领域。近日,google 决策智库的主管 Cassie Kozyrkov 整理了十篇给学生们推荐的优秀文章。下面这些文章几乎都来自于相同的博客。让我们来看看是哪些文章吧~

Google科学家最新整理,给新手推荐的十篇优秀数据科学文章

#1 理解数据

文章地址:

如果你从网上购买数据集开始你的学习旅程,你就有可能忘记它们从何而来。

Google 科学家最新整理,给新手推荐的十篇<span><span><span><i Google 科学家最新整理,给新手推荐的十篇最佳数据科学文章

如何表示这些并没有一个普遍的规律,食物的重量单位是克,是最好注意的。我们可以选择数量、价格、原产国或其他适合我们要求的商品。

如果你闭上眼睛,你还记得刚才看到的每一个细节吗?我反正不记得了。这就是我们收集数据的原因。如果我们能在头脑中很好地记忆和处理它,就没有必要了。

当我们分析数据时,我们正在访问别人的记忆。

虽然,用手在纸上打草稿也可以,但是当数据量很大的时候,我们最好还是用电脑吧。

我们可以用 excel 处理很多数据。

Google 科学家最新整理,给新手推荐的十篇最佳数据科学文章

当然,你还可以选择 python。

为了加速你的训练,不要只是粘贴魔法单词-尝试改变它们,看看会发生什么。例如,如果您在上面的代码片段中将「真」变为「假」,会发生什么变化?

编程是魔法和乐高之间的交叉点。如果你希望自己能变魔术,那就学着写代码吧。

简而言之,这是一个程序设计:询问互联网如何做一些事情,用你刚学过的神奇单词,看看当你调整它们时会发生什么,然后把它们像乐高积木一样放在一起来完成你的出价。

我们需要进行分析和总结。为此,你还需要了解很多数学知识,如中位数、众数等。这些知识被称为统计学。

Google 科学家最新整理,给新手推荐的十篇最佳数据科学文章

你还需要学习绘图和可视化。通常,直方图和条形图被使用的比较多。

Google 科学家最新整理,给新手推荐的十篇最佳数据科学文章

数据没有什么神奇之处,它只是在记录上比大脑更可靠。一些信息是有用的,有些是误导性的。我们都是数据分析师,一直都是。

#2 向孩子(或你的老板)解释监督学习

文章地址:

既然你知道什么是机器学习,让我们来看看最简单的那种。我的目标是让所有人(几乎)所有年龄段的人都能适应它的基本术语:实例、标签、特性、模型、算法和有监督的学习。

实例

看下面四个例子!

Google 科学家最新整理,给新手推荐的十篇最佳数据科学文章

实例也称为「示例」或「观察」。

数据表

当我们把这些例子放在一张表格上时,它们是什么样子的?每一行都是一个例子。

Google 科学家最新整理,给新手推荐的十篇最佳数据科学文章

这次我们很幸运,每个实例都有一个标签。

标签

标签是正确的答案。这就是我们希望计算机在显示像这样的照片时学会输出的东西,这就是为什么有些人喜欢使用「目标」、「输出」或「响应」这个词的原因。

特征

其他列有什么?像素颜色。与你不同的是,电脑看到的图像都是数字,而不是漂亮的妹子。你看到的是红绿蓝这三种颜色。不相信?尝试将「我的数据表」中的值输入到这个 RGB 颜色控制盘中,看看它给你显示什么颜色。想知道如何从照片中获取像素值吗?看看这个代码。

Google 科学家最新整理,给新手推荐的十篇最佳数据科学文章

你知道什么很酷吗?每次你看一张数码照片,你分析数据,弄清楚存储在一堆数字中的东西。不管你是谁,你已经是一个数据分析师了!

模型与算法

我们的特征将构成模型的基础,计算机将使用它们把像素颜色变成标签。

模型只是「配方」的一个花哨的词。

具体如何做?这就是机器学习算法的工作。

监督学习 

Google 科学家最新整理,给新手推荐的十篇最佳数据科学文章

我想让你成为我的机器学习系统。使用你的大脑,再看一眼实例,做一些学习,你觉得这是什么?

使用你从上面的示例中学习到的内容对该图像进行分类。

Google 科学家最新整理,给新手推荐的十篇最佳数据科学文章

「金发」?是的。你明白了!你刚才做的是监督学习,太棒了!你现在经历了最简单的学习方式。如果你能把你的问题定义为有监督的学习,那是个好主意。其它的更难……所以我们需要使用无监督学习。

总结:如果算法在每个实例中都有正确的标签,那么这将是有监督的学习。稍后,它将使用模型或配方来标记新实例,就像你所做的那样。

#3 无监督学习

文章地址:https://hackernoon.com/unsupervised-learning-demystified-4060eecedeaf?source=post_page-----3bae97d9bb23----------------------

无监督学习听起来像是一种奇特的表达方式,「让孩子们自己学习,不要触摸热烤箱」,但它实际上是一种从你的数据中挖掘灵感和模式的技术。

Google 科学家最新整理,给新手推荐的十篇最佳数据科学文章

什么是无监督学习?

Google 科学家最新整理,给新手推荐的十篇最佳数据科学文章

(编辑:晋中站长网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

热点阅读