21个必知的机器学习开源工具，涵盖5大领域

发布时间：2019-08-03 03:14:06 所属栏目：Windows 来源：读芯术

导读：本文将介绍21个你可能没使用过的机器学习开源工具。每个开源工具都为数据科学家处理数据库提供了不同角度。本文将重点介绍五种机器学习的工具面向非程序员的工具（Ludwig、Orange、KNIME）、模型部署（CoreML、Tensorflow.js）、大数据（Hadoop、Spark）

4. 用于计算机视觉、自然语言处理和音频的开源机器学习工具

SimpleCV: 参与任何计算机视觉项目都必须使用OpenCV。但你有没有考虑过SimpleCV？SimpleCV可供用户访问几个高性能的计算机视觉库，如OpenCV——而不必首先了解位深度、文件格式、颜色空间、缓冲区管理、特征值以及矩阵与位图存储。计算机视觉让项目变得更容易上手。

Tesseract OCR: 你是否曾使用过一些有创意的应用程序，可以使用智能手机的摄像头扫描文件或购物账单，或者只需拍张支票就可以将钱存入银行账户？所有这些应用程序使用的都是OCR，即光学字符识别软件。Tesseract就是这样的OCR引擎，可以识别100多种语言，也可以加以训练识别其他语言。
Detectron: Detectron是Facebook旗下人工智能研究公司的软件系统，它采用了包括Mask R-CNN在内最先进的目标检测算法。Detectron由Python语言编写完成，由Caffe2深度学习框架提供支持。

21个必知的机器学习开源工具，涵盖5大领域

StanfordNLP: StanfordNLP是Python的自然语言分析包。它的闪光点在于其支持70多种人类语言！StanfordNLP还包含可以在以下程序步骤中使用的工具：

—将包含人类语言文本的字符串转换为句子和单词列表

—生成单词的基本形式、词类和形态特征

—逻辑句法结构依赖分析

21个必知的机器学习开源工具，涵盖5大领域

BERT as a Service: 所有的自然语言处理爱好者都应该听说过谷歌的开创性自然语言处理架构——BERT，但可能还没有用过。Bert-as-a-service将BERT作为句子编码器，并通过ZeroMQ将其作为服务器，从而使用户能够仅用两行代码将句子映射为固定长度的表示形式。
Google Magenta: Google Magenta提供了处理源数据（主要是音乐和图像）的实用程序，该数据库使用这些源数据处理机器学习模型，并最终从这些模型中生成新内容。
LibROSA: LibROSA是用于音乐和音频分析的Python语言包。它提供了构建音乐信息检索系统所必需的构建块。当用户在处理诸如语音到文本深度学习等的应用时， LibROSA广泛应用于在音频信号预处理程序环节。

5. 旨在进行强化学习的开源工具

强化学习（RL) 是机器学习的新话题，其目标是培养能够与环境互动并解决复杂任务的智能经纪人，实现机器人、自动驾驶汽车等的实际应用。

强化学习领域的快速发展得益于让智能经纪人玩一些游戏，如经典的Atari console games、传统的围棋游戏，或者让智能经纪人玩电子游戏，如Dota 2 或 Starcraft 2，所有这些游戏都为智能经纪人提供了具有挑战性的环境。在这个环境中，新的算法可以安全、可重复的方式测试想法。以下列举了4个最有利于强化学习的培养环境：

Google Research Football: Google Research Football Environment是一个全新的强化学习环境，其中，智能经纪人旨在掌握世界上最流行的足球运动。这种环境能让用户更好地训练强化学习智能经纪人。
OpenAI Gym: Gym是开发和比较强化学习算法的工具包，可支持教学经纪人从走路到玩乒乓球或弹球之类的游戏。从以下动图中可以看到一个正在学习走路的教学经纪人。

21个必知的机器学习开源工具，涵盖5大领域

Unity ML Agents: The Unity Machine Learning Agents Toolkit（ML-Agents）是开源设备的插件，使游戏和模拟游戏能为智能经纪人训练提供有效环境。通过简单易用的Python API，用户可以使用强化学习、模仿学习、神经进化或其他机器学习方法来训练智能经纪人。

21个必知的机器学习开源工具，涵盖5大领域

Project Malmo: Malmo平台是一个建立在Minecraft之上的复杂人工智能实验平台，旨在支持人工智能领域的基础研究，由微软开发。

当用户进行数据科学和人工智能相关项目时，开放源码是一种可行的方法。本文只是介绍了冰山一角，仍有许多工具可用于处理各种各样的任务，使数据科学家的项目生活更为简便。数据科学家只需知道何处寻找开放源码即可。

21个必知的机器学习开源工具，涵盖5大领域

【编辑推荐】

ClusterShell：一个在集群节点上并行运行命令的好工具
重回榜首的BERT改进版开源了，千块V100、160GB纯文本的大模型
优秀！Github上10个开源免费的后台控制面板你值得拥有！
在Linux上安装NetData性能监控工具
开源大法好，Windows 计算器又添两项新功能

【责任编辑：武晓燕 TEL：（010）68476606】
点赞 0

（编辑：晋中站长网）

【声明】本站内容均来自网络，其相关言论仅代表作者个人观点，不代表本站立场。若无意侵犯到您的权利，请及时与联系站长删除相关内容!

3/3

首页

win10appdata可以删除	win10桌面背景如何换
windows10激活工具永久	win10死机不能动win10