Google科学家最新整理,给新手推荐的十篇优秀数据科学文章
TensorFlow 现在很可爱,这是一个游戏规则的改变者,因为它意味着我们这个时代最有力的工具之一刚刚摆脱了大部分人使用的障碍。来自各行各业的技术爱好者最终都有权加入进来,新版本使研究人员和其他积极性很高的人能够接触到他们。 在 TensorFlow 2.0 中,现在默认情况下是预先执行。你甚至可以在上下文中利用图形,这使得调试和原型设计变得容易,而 TensorFlow 运行时则负责性能和扩展。 视频地址: 这是人工智能伟大的一步!升级到新版本是一项艰苦的工作。如果你即将开始将代码库迁移到 2.0,那么你并不孤单——接下来在 Google 上将会有迁移指南,欢迎关注。 #8 统计学家证明统计数据很无聊文章地址: ![]() 这位统计学家即将证明统计数据很无聊。 人口 当你想到「人口」这个词时会想到什么?人,对吧?在我们的训练中,它更像所有的事情。一个群体可以是人、像素、南瓜,或者任何你喜欢的东西。 下面图片中的树是我们这篇文章感兴趣的读者群。 ![]() 因为这是我的人口,我的发现充其量也适用于这些树。 这里有你看不到的树吗?你死定了,无聊,它不是我们人口的一部分。挑一棵树?你也死定了,一样的无聊。 样本 样本是你拥有的数据,总体是你希望拥有的数据。 ![]() 观测 观测是对一个样本中的一个项目进行的测量。 ![]() 统计 统计数据是一种将样本数据拼凑起来的方法。 那么…什么是统计数据?这只是一种将我们现有的数据搞得一团糟的方法。真让人失望!统计和统计的规律是不同的。 ![]() 统计数据令人厌烦的证据假设我们对平均树高感兴趣,这个样本正好是 22.5 米。这个数字对我们有意义吗? 让我们回顾一下我们定下的规则:只有人口才有意义。这个样本是人口吗?不是!因此,我们不感兴趣。我们从一些无聊的树上做了一些无聊的测量,然后我们把这些无聊的测量搞得一团糟……从这个过程中产生的东西也很无聊。 所以我一直在向你们证明你们心里所知道的:统计数据很无聊! 当然,你还要考虑参数、假设等等,进行估算。 你总是需要统计数据其实是一个谎言,实际上你不需要。如果你只是想做出最好的猜测来获得灵感,分析是你最好的选择。抛开这些 P 值,你不需要不必要的压力。 相反,你可以选择遵循以下原则:越多(相关的)数据就越好,你的直觉可以很好地做出最好的猜测,但你不知道这些猜测有多好……所以保持谦虚。 不过,别以为我在刻苦训练。我花了十多年的时间研究统计学,我常常认为我不是完全疯了。 采用统计方法是有用的,它是非常有用的。 你什么时候真正需要它? ![]() 文章地址: 你可能听到的对 P 值的解释是这样的:p值是观察统计数据的概率,前提是假设为空。有点费解吧,让我们用小狗来解释它。 ![]() 设置(犯罪)现场你有一只小狗叫 fido,想象一下回到家,你在厨房里发现了这个: ![]() 让我们开始审判这个把头伸进垃圾桶的嫌疑犯吧! 我们定下一个规则,即不要对 fido 大喊大叫,而相应的无效假设「fido 是无辜的」。如果你对这些概念还是不确定如何建立假设,请阅读本文。 ![]() 描述空假设世界计算 p 值的第一步是深呼吸,然后说,「好吧,fido,我会认为你是无辜的。」 我们在这里所做的是可视化空假设世界,并弄清楚事情在那里是如何工作的,这样我们就可以为它制作一个玩具模型。这就是计算的全部内容。 这个证据让你吃惊吗? 如果 fido 现在不去追垃圾,你会刚刚为它想好了完美的无罪理由。 「如果 fido 是无辜的,这个证据会有多奇怪?」 现在是时候问一个大问题了:这个世界有多大可能会像我们在现实生活中看到的那样,至少会看到一些该死的证据? (编辑:晋中站长网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |