数据分析师必备的9大技能,大多数人只知道一半
数据分析中的工作最重要的就是数据处理工作,根据我做数据分析的经验,在整个数据分析流程中,用于数据处理的时间往往要占据70%以上,而数据仓库具有集成、稳定、高质量等特点,基于数据仓库为数据分析提供数据,往往能够更加保证数据质量和数据完整性。 ![]() 六、数据挖掘工具 在做数据分析时,数据挖掘软件是其中必不可少的工具之一。它是大多数商业智能计划中的核心应用程序,数据挖掘软件同样也能够从大量数据中提取洞察力。 直接说需要学习的语言:MATLAB、Python、R。 1、MATLAB 虽然偏学术性,但是好上手,上手以后就可以跑一些算法,提高一些信心和学习的乐趣。教材看官方手册的Primer,然后就开始写脚本和函数,如果有看不懂的直接百度、google或者help。 2、Python和R 这两个放在一起,是因为网上关于这两个的争论太多了。我的顺序是首先学python,其次再是R。首先python,先看《Head First Python》,简单易懂,然后是《利用Python进行数据分析》和《机器学习实战》。第一本书主要是利用Python做数据挖掘的,基本提到Python学习都会推荐这本。第二本是理解机器学习的佳作,书中用到的语言就是Python,一边学语言,一边理解机器学习。 ![]() 七、人工智能 严格意义上,人工智能与数据分析有着明显的界限,不属于同一领域,因此这一条是针对大数据分析科学家来说的,当你的分析能力还比较低时,可以略过不看此章。 机器学习、人工智能涵盖的知识层面太广太深,所以会建议采取 problem-based learning 的学习方式,先选定问题,然后找到资源来解问题,再更深入的去了解,解问题过程中,遇到的名词与知识。 ![]() 八、挖掘算法 很多人认为数据挖掘需要掌握复杂高深的算法,需要掌握技术开发,才能把数据挖掘分析做好,实际上并非这样,其实算法并不难,只需要结合实际业务背景、以解决问题为导向就简单很多了,主要包括分类算法,聚类算法,关联分析,连接分析等,是学习数据挖掘必须要掌握的算法基础。 九、编程语言 比如python、r语言、java等等,你该使用哪种语言用于数据分析?恐怕这还得“视情况而定”。 如果你对晦涩的统计运算进行繁重的数据分析工作,那么你不青睐R才怪。如果你跨GPU进行NLP或密集的神经网络处理,那么Python是很好的选择。如果想要一种加固的、面向生产环境的数据流解决方案,又拥有所有重要的操作工具,Java或Scala绝对是出色的选择。 【编辑推荐】
点赞 0 (编辑:晋中站长网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |