10 个顶尖的 Linux 开源人工智能工具-低调大师

10 个顶尖的 Linux 开源人工智能工具

2017-06-02 826

在这篇文章中，我们将介绍几个顶级的开源 Linux 生态系统的人工智能（AI）工具。目前，AI 是科学和技术中不断进步的领域之一，很多人都在致力于构建软件和硬件来解决诸如医疗，教育，安全，制造业，银行等领域的日常挑战。

下面是一系列旨在并开发成用于支持 AI 的平台，允许你用在 Linux 或可能许多其它的操作系统上。名单排列顺序没有意义。

1.Deep Learning For Java（Deeplearning4j）

Deeplearning4j 是 Java 和 Scala 编程语言的，商业级的，开放源码的，即插即用，分布式的深度学习库。它专为企业相关的应用程序而设计，并在分布式 CPU 和 GPU 的基础上继承了 Hadoop 和 Spark。

DL4J 在 Apache 2.0 许可证下发布，提供 GPU 支持 AWS，并适用于微服务架构。

2.Caffe ——深度学习框架

Caffe 是一个基于速度的模块化和富有表现力的深度学习框架。它在 BSD 2-Clause 许可下发布，并且已经在诸如研究，启动原型，以及视觉、语音及多媒体等工业应用领域支持了若干社区项目。

H20 ——分布式机器学习框架

H20 是一个开源的，快速的，可扩展和分布式的机器学习框架，还有框架配备的算法。它支持更智能的应用程序，如深度学习，梯度 boosting，随机森林，广义线性模型（即逻辑回归，弹性网络）等等。

这是一个面向业务用于决策数据的人工智能工具，它能够让用户使用更快更好的预测模型来绘制来自于他们对数据的见解。

MLlib ——机器学习库

MLlib是一个开源的，易于使用和高性能的机器学习库，作为Apache Soark的一部分而开发。本质上它易于部署，并且可以在现有的 Hadoop 群集和数据上运行。

MLlib 还附带分类、回归、推荐、聚类、生存分析等等的算法集合。重要的是，它可以用于 Python、Java、Scala 和 R 编程语言。

5.Apache Mahout

Mahout 是一个开源框架，设计用于构建可拓展的机器学习应用程序，它有以下三个显著的特点：
提供简单和可扩展的编程工作场所
提供 Scala+ Apache Spark，H20 以及 Apache Flik 的各种预包装算法
包括 Samaras，矢量数学实验带有 R 之类语法的工作场所

6.Open Neural Networks Library（OpenNN）

OpenNN 也是一个用 C ++ 编写的用于深度学习的开源类库，用于煽动神经网络。然而，它只是有经验的 C ++ 程序员和有极高机器学习技能人员的最佳选择。它侧重于深度架构和高性能。

Oryx 2

Oryx 2 是初始 Oryx 项目的延续，是在 Apache Spark 和 Apache Kafka 的基础上作为 lambda 架构的重新架构而开发的，虽然专用于实现实时机器学习。

它是一个应用程序开发和附带某些应用程序用于协同过滤、分类、回归和集群用途的平台。

OpenCyc

OpenCyc 是一个开源门户，面向最大和最全面的通用知识基础和常识推理引擎。它包括大量 Cyc 术语，用一种精确设计的方式排列，在针对应用程序诸如这样的领域：
丰富的领域建模
特定领域的专家系统
文本的理解
语义数据集成以及AI游戏等等。

9.Apache SystemML

SystemML 是用于机器学习非常适合大数据的开源人工智能平台。其主要特点是——运行在 R 和 Python 这样的语法上，专注于大数据并专门针对高层次数学而设计。它是如何工作的在主页上有很好的解释，其中包括明确说明的视频演示。

有几种方法来使用它，包括 Apache Spark、Apache Hadoop、Jupyter 和 Apache Zeppelin。一些显著用途包括汽车，机场交通和社会银行业。

NuPIC

NuPIC 是一个开源框架，用于机器学习的开源框架，基于 Heirarchical Temporary Memory (HTM)，一个新皮层理论。集成了 NuPIC的HTM 程序可实施分析实时的流数据，并且它在那里可学习到现有数据的基于时间的模式，预测即将值以及揭示任何不规则性行为。

它的显著特点包括：
持续在线学习
时空格局
实时流数据
预测和建模
强大的异常检测
分层时间记忆

文章转载自开源中国社区 [http://www.oschina.net]

微信关注我们

原文链接：https://yq.aliyun.com/articles/111264

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

apache开源项目--Ignite

Apache Ignite 内存数组组织框架是一个高性能、集成和分布式的内存计算和事务平台，用于大规模的数据集处理。Ignite 为应用和不同的数据源之间提供一个高性能、分布式内存中数据组织管理的框架。集群计算特性：动态集群 Fork-Join & MapReduce 处理分布式闭包执行负载均衡和容错分布式消息和事件线性可伸缩内存缓存和数据网格关键特性：分布式内存中缓存优雅的伸缩方案高性能分布式内存中事务支持分布式内存队列和其他数据结构 Web 会话集群 Hibernate L2 缓存集成分布式 SQL 联合查询内存数据流：本文转自二郎三郎博客园博客，原文链接：http://www.cnblogs.com/haore147/p/5103006.html，如需转载请自行联系原作者

2017-06-01

742

3. MAPREDUCE原理篇（2） 3.1 mapreduce的shuffle机制 3.1.1 概述： v mapreduce中，map阶段处理的数据如何传递给reduce阶段，是mapreduce框架中最关键的一个流程，这个流程就叫shuffle； vshuffle: 洗牌、发牌——（核心机制：数据分区，排序，缓存） v具体来说：就是将maptask输出的处理结果数据，分发给reducetask，并在分发的过程中，对数据按key进行了分区和排序； 3.1.2 主要流程： Shuffle缓存流程： shuffle是MR处理流程中的一个过程，它的每一个处理步骤是分散在各个map task和reduce task节点上完成的，整体来看，分为3个操作： 1、分区partition 2、Sort根据key排序 3、Combiner进行局部value的合并 3.1.3 详细流程 1、maptask收集我们的map()方法输出的kv对，放到内存缓冲区中 2、从内存缓冲区不断溢出本地磁盘文件，可能会溢出多个文件 3、多个溢出文件会被合并成大的溢出文件 4、在溢出过程中，及合并的过程中，都要调用...

2017-06-02

639

资源下载

更多资源

腾讯云软件源

为解决软件依赖安装时官方源访问速度慢的问题，腾讯云为一些软件搭建了缓存服务。您可以通过使用腾讯云软件源站来提升依赖包的安装速度。为了方便用户自由搭建服务架构，目前腾讯云软件源站支持公网访问和内网访问。

Nacos

Nacos /nɑ:kəʊs/ 是 Dynamic Naming and Configuration Service 的首字母简称，一个易于构建 AI Agent 应用的动态服务发现、配置管理和AI智能体管理平台。Nacos 致力于帮助您发现、配置和管理微服务及AI智能体应用。Nacos 提供了一组简单易用的特性集，帮助您快速实现动态服务发现、服务配置、服务元数据、流量管理。Nacos 帮助您更敏捷和容易地构建、交付和管理微服务平台。

Spring

Spring框架（Spring Framework）是由Rod Johnson于2002年提出的开源Java企业级应用框架，旨在通过使用JavaBean替代传统EJB实现方式降低企业级编程开发的复杂性。该框架基于简单性、可测试性和松耦合性设计理念，提供核心容器、应用上下文、数据访问集成等模块，支持整合Hibernate、Struts等第三方框架，其适用范围不仅限于服务器端开发，绝大多数Java应用均可从中受益。

Rocky Linux

Rocky Linux（中文名：洛基）是由Gregory Kurtzer于2020年12月发起的企业级Linux发行版，作为CentOS稳定版停止维护后与RHEL（Red Hat Enterprise Linux）完全兼容的开源替代方案，由社区拥有并管理，支持x86_64、aarch64等架构。其通过重新编译RHEL源代码提供长期稳定性，采用模块化包装和SELinux安全架构，默认包含GNOME桌面环境及XFS文件系统，支持十年生命周期更新。