成为技术高手:想更了解自己的偶像么?教你用技术手段挖掘他#92
点击上方“云栖社区”可以订阅哦 摘要 是否在不同的电影中,总是能看到那些熟悉却叫不上名字的演员们,想知道他们之间相互的关系么?本文将带你一步一步地挖掘出他们的关系。想更了解自己的偶像么,那就试试吧。 以下为译文 我最近换了个工作,在入职之前,我看了很多电影来打发闲暇时光。然而,演员之间的联系引起了我的注意。我经常回想,为什么我总能看到他们在一起工作呢?然后,我就使用 IMDB 电影数据库来分析演员之间的关联。 输出结果 需要做的第一件事就是构建可生成网络图的对象。我们有很多库可以完成这件事情,而我选择了sna和network两个库。另外,我推荐包含GGally的GGplot2库可以将网络完美地可视化。我决定对这些进行一层简单的封装来获得我们需要的对象。 现在就可以传递之前导入的按时间排序的数据了。在这次案例中,我使用的数据是2000年到2009年的。 试用GGplot2 的扩展可以很容易地画出交互性好的网络图。下面是一些图中的参数。 输出结果 这个图的密度由我们过滤节点的方法决定。在这个案例中,我们一般用节点的度来过滤,也就是说一个节点和其它节点关联的数量。 输出结果 接下来让我们尝试90年代的动作电影: 输出结果 那么对于80年代以后且评分7.0分以上的电影又是怎样的情况呢?为了方便浏览,我将图着了色。 输出结果 文章原标题《Network Mapping Hollywood actor overlap | Kaggle》, 作者:wouldntyaliktono, 阿里云云栖社区组织翻译,译者:爱小乖 -END- 云栖社区 ID:yunqiinsight 云计算丨互联网架构丨大数据丨机器学习丨运维
(编辑:晋中站长网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |