搜索[学习]结果-低调大师优秀个人博客

精选列表

搜索[学习]，共10000篇文章

揭秘支付宝中的深度学习引擎：xNN

本文介绍支付宝App中的深度学习引擎——xNN。xNN通过模型和计算框架两个方面的优化，解决了深度学习在移动端落地的一系列问题。

2017-09-27

hbase中的宽表是指很多列较少行，即列多行少的表，一行中的数据量较大，行数少；高表是指很多行较少列，即行多列少，一行中的数据量较少，行数大。 hbase的row key是分布式的索引，也是分片的依据。hbase的row key + column family + column qualifier + timestamp + value 是HFile中数据排列依据。HFile据此，对数据的索引到data block级别，而不是行级别。所以这种key是HFile内部的粗粒度（data block粒度）本地索引的主键。据此，在HBase中使用宽表、高表的优劣总结如下：查询性能：高表更好，因为查询条件都在row key中, 是全局分布式索引的一部分。高表一行中的数据较少。所以查询缓存BlockCache能缓存更多的行，以行数为单位的吞吐量会更高。分片能力：高表分片粒度更细，各个分片的大小更均衡。因为高表一行的数据较少，宽表一行的数据较多。HBase按行来分片。元数据开销：高表元数据开销更大。高表行多，row key多，可能造成region数量也多，- root -、 .meta表数据量更大。过大的元数据开销，可能引起HBase集群的不稳定、master更大的负担（这方面后续再好好总结）。事务能力：宽表事务性更好。HBase对一行的写入（Put）是有事务原子性的，一行的所有列要么全部写入成功，要么全部没有写入。但是多行的更新之间没有事务性保证。数据压缩比：如果我们对一行内的数据进行压缩，宽表能获得更高的压缩比。因为宽表中，一行的数据量较大，往往存在更多相似的二进制字节，有利于提高压缩比。通过压缩，缓解了宽表一行数据量太大，并导致分片大小不均匀的问题。查询时，我们根据row key找到压缩后的数据，进行解压缩。而且解压缩可以通过协处理器（coproesssor）在HBase服务器上做，而不是在业务应用的服务器上做，以充分应用HBase集群的CPU能力。设计表时，可以不绝对追求高表、宽表，而是在两者之间做好平衡。根据查询模式，需要分布式索引、分片、有很高选择度（即能据此查询条件迅速锁定很小范围的一些行）的查询用字段，应该放入row key；能够均匀地划分数据字节数的字段，也应该放入row key，作为分片的依据。选择度较低，并且不需要作为分片依据的查询用字段，放入column family和column qualifier，不放入row key。

2017-09-20

深度学习方法在机器视觉领域的发展

有了深度学习，机器学习才有了许多实际的应用，它还拓展了AI的整体范围。深度学习将任务分拆，使得各种类型的机器辅助变成可能。

2017-09-19

通过自动化机器学习对抗Java恶意软件

但是，通过微软研究团队研发的自动化专家系统和机器学习模型，搭载Windows 10的电脑就可以及时地应对这些威胁。

2017-09-18

专访刘昕博士：深度学习与人工智能

博士阶段主要从事人脸识别与深度学习技术的研究与工业化应用，作为第一主力或并列第一主力获得ICCV 2015 年龄估计竞赛亚军、ICCV 2015 文化事件识别竞赛冠军和 2015 年度阿里巴巴天池大规模图像检索竞赛总决赛冠军

2017-09-03

基于深度学习的智能安防系统结构探讨

最近数年来深度学习算法的快速发展，在各类人工智能问题上的优异表现给智能安防领域带来了新的机遇。在深度学习迅速发展的大背景下，本文就智能安防系统如何采用最新的技术提升产品性能做一些抛砖引玉的探讨。

2017-09-03

私人珍藏，九个开源的顶级深度学习项目

而深度学习无疑又是人工智能的研究热点，那么现在都有哪些最流行的开源深度学习工具? 本文将为您推荐最着名的9个开源顶级深度学习项目。

2017-09-03

Spark将纳入机器学习与GPU

近日，据外媒报道，Spark将纳入机器学习和GPU机制。机器学习大家都不陌生了，GPU加速其实一直是机器学习的得力辅助，CUDA就是我们众所周知的GPU加速套件。

2017-08-31

数据科学和机器学习工具和语言最新动态

文章讲的是数据科学和机器学习工具和语言最新动态，第18届年度KDnuggets软件投票又一次受到了分析、数据科学界和软件生产商的热情参与。与去年相似，约有2900人参与了此次投票。

2017-08-31

国际主流深度学习领域厂商都在忙什么？

文章讲的是国际主流深度学习领域厂商都在忙什么，如果说机器学习的分支中最令人激动的部分当属深度学习，基于深度学习构建的复杂的模式识别系统，提供从自动化语言翻译到图像识别所需的一切功能。

2017-08-31

spring cloud 学习(8) - sleuth & zipkin 调用链跟踪

业务复杂的微服务架构中，往往服务之间的调用关系比较难梳理，一次http请求中，可能涉及到多个服务的调用(eg: service A -> service B -> service C...)，如果想分析各服务间的调用关系，以及各服务的响应耗时，找出有性能瓶颈的服务，这时zipkin就派上用场，它是Twitter公司开源的一个tracing系统，官网地址为：http://zipkin.io/ , spring cloud可以跟它无疑集成。使用步骤：一、微服务方 1.1 添加依赖jar包 compile 'org.springframework.cloud:spring-cloud-starter-bus-kafka' compile 'org.springframework.cloud:spring-cloud-starter-sleuth' compile 'org.springframework.cloud:spring-cloud-sleuth-stream' 注：为了实现tracing数据埋点与采集的解耦，spring cloud引入了message bus（消息总线）的概念，微服务无需关心tracing系统在哪，长什么样，只要向bus总线上扔消息就行，所以引入了bus-kafka以及sleuth-stream。 1.2 application.yml配置 spring: ... cloud: bus: enabled: true stream: default-binder: kafka kafka: binder: brokers: 10.0.1.2,10.0.1.3,10.0.1.4 //kafaka的服务器集群列表 zkNodes: 10.0.1.5,10.0.1.6,10.0.1.7 //zk的服务器集群列表 defaultZkPort: 2181 //zk的端口 defaultBrokerPort: 9092 //kafka的broker端口 ... sleuth: sampler: percentage: 0.2 //采样率 0.2为20% 上面2项配置好就行了，代码不用任何修改，真正的代码零侵入二、zipkin-server zipkin从kafka上接收过来数据后，有4种保存方式：in-memory(保存在内存中)、mysql、cassandra、elasticsearch 个人开发调试的话，推荐用in-memory模式，其它环境不要使用！（注：因为随着收集的数据越来越多，都放在内存中很容易造成OOM） 2.1 mysql 存储 2.1.1 主要jar包依赖 dependencies { ... 关键是下面几个 compile 'org.springframework.cloud:spring-cloud-starter-sleuth' compile 'org.springframework.cloud:spring-cloud-sleuth-zipkin-stream' compile 'org.springframework.cloud:spring-cloud-starter-bus-kafka' compile 'io.zipkin.java:zipkin-server' compile 'io.zipkin.java:zipkin-autoconfigure-ui' compile 'io.zipkin.java:zipkin-autoconfigure-storage-mysql' #mysql的存储 ... 下面几个是spring-boot/cloud的常规项 compile 'org.springframework.boot:spring-boot-starter-actuator' compile 'org.springframework.boot:spring-boot-starter-web' compile 'org.springframework.boot:spring-boot-starter-security' compile 'log4j:log4j:1.2.17' //zipkin的storage jar包，依赖低版本的log4j compile 'org.apache.logging.log4j:log4j-slf4j-impl:2.8.2' compile 'mysql:mysql-connector-java:6.0.5' } 2.1.2 application.yml配置 spring: application: name: zipkin-server datasource: //指定mysql数据源 schema: classpath:/mysql.sql url: jdbc:mysql://192.168.1.2:3306/zipkin?autoReconnect=true&useSSL=false username: root password: *** driver-class-name: com.mysql.cj.jdbc.Driver initialize: true continue-on-error: true sleuth: enabled: false cloud: bus: enabled: true ... stream: default-binder: kafka kafka: binder: brokers: ${kafka.brokers} zkNodes: ${kafka.zkNodes} defaultZkPort: ${kafka.zkPort} defaultBrokerPort: ${kafka.brokerPort} zipkin: storage: type: mysql //配置成mysql存储 2.1.3 main入口代码 @SpringBootApplication(exclude = { MybatisAutoConfiguration.class, RedisAutoConfiguration.class, RedisRepositoriesAutoConfiguration.class}) @EnableZipkinStreamServer public class ZipkinServer { public static void main(String[] args) { SpringApplication.run(ZipkinServer.class, args); } } 注：如果你的项目中依赖了redis,mybatis等其它包，可以参考上面的写法，排除掉这些自动配置，否则的话，不用加那一堆exclude。 2.2 cassandra 2.2.1 依赖jar包注：cassandra和elasticsearch下，可能会遇到zipkin中的dependencies面板无数据，详情见github上的讨论：https://github.com/openzipkin/zipkin-dependencies/issues/22 compile 'org.springframework.boot:spring-boot-starter-data-cassandra' compile('io.zipkin.java:zipkin-autoconfigure-storage-cassandra3:1.29.3') { exclude group: "com.datastax.cassandra", module: "cassandra-driver-core" } compile 'com.datastax.cassandra:cassandra-driver-core:3.1.1' compile 'com.datastax.cassandra:cassandra-driver-mapping:3.1.1' 2.2.2 application.yml spring: data: cassandra: contact-points: localhost port: 9042 keyspace-name: zipkin3 ... zipkin: storage: type: cassandra3 2.3 elasticsearch 2.3.1 依赖jar包 compile 'io.zipkin.dependencies:zipkin-dependencies-elasticsearch:1.7.2' compile 'io.zipkin.java:zipkin-autoconfigure-storage-elasticsearch-http:1.29.2' 2.3.2 application.yml zipkin: storage: type: elasticsearch elasticsearch: cluster: elasticsearch hosts: http://localhost:9200 index: zipkin index-shards: 5 index-replicas: 1

2017-08-26

Spark on Angel：Spark机器学习的核心加速器

然而在机器学习领域，RDD的弱点很快也暴露了。机器学习的核心是迭代和参数更新。

2017-08-20

一篇文章看懂Android学习最佳路线

在Android学习过程中，初学者踩过的坑我也都踩过，我也深深地知道大家在学习过程中最棘手的问题是什么。

2017-08-07

深度学习识别10000物种，手机上的@博物杂志

为了缓解志愿者专家的重担，iNaturalist 团队与康奈尔鸟类实验室（Cornell Lab of Ornithology），Merlin鸟类识别app的开发人员，以及Visipedia图像识别研究项目合作，使用机器学习技术更快地提供高质量的物种识别

2017-08-02

解析深度学习的未来十大趋势

这里是本周我注意到的一些趋势；注意到这些趋势更偏向于深度学习和强化学习（reinforcement learning），因为它们是我在这次论坛中参加的主要部分。

2017-08-01

学习数据分析的“里程碑”是什么？

死于来自深度学习的不明AOE。很长时间内，R本来还和Python并驾齐驱难分高下。

2017-08-01

Spark将机器学习与GPU加速机制纳入自身

Databricks公司通过简化对GPU加速型机器学习方案的访问支持自家云Spark服务。

2017-08-01

NVIDIA令深度学习训练性能翻一番

NVIDIA发布了其 GPU 加速深度学习软件的更新版本，这些软件将令深度学习训练的性能翻一番。

2017-08-01

深度学习那么火，它究竟能做些什么？

其实这就属于深度学习所要解决问题的范畴，但从当前的情况来看，这一问题无疑还没很好的得到处理。

2017-08-01

物联网最大魅力：使物体都具有学习能力

物联网的发展速度非常迅猛，它让原本了无生机的物体通过“联网”获得强大的生命，使物体都具有学习能力，可以感知用户的行为并做出相应地调整，在传感物联网创始人杨剑勇看来，这正是物联网最大魅力所在。

2017-07-31

资源下载

更多资源

Mario

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长，特征是大鼻子、头戴帽子、身穿背带裤，还留着胡子。与他的双胞胎兄弟路易基一起，长年担任任天堂的招牌角色。

Rocky Linux

Rocky Linux（中文名：洛基）是由Gregory Kurtzer于2020年12月发起的企业级Linux发行版，作为CentOS稳定版停止维护后与RHEL（Red Hat Enterprise Linux）完全兼容的开源替代方案，由社区拥有并管理，支持x86_64、aarch64等架构。其通过重新编译RHEL源代码提供长期稳定性，采用模块化包装和SELinux安全架构，默认包含GNOME桌面环境及XFS文件系统，支持十年生命周期更新。

Sublime Text

Sublime Text具有漂亮的用户界面和强大的功能，例如代码缩略图，Python的插件，代码段等。还可自定义键绑定，菜单和工具栏。Sublime Text 的主要功能包括：拼写检查，书签，完整的 Python API ， Goto 功能，即时项目切换，多选择，多窗口等等。Sublime Text 是一个跨平台的编辑器，同时支持Windows、Linux、Mac OS X等操作系统。

WebStorm

WebStorm 是jetbrains公司旗下一款JavaScript 开发工具。目前已经被广大中国JS开发者誉为“Web前端开发神器”、“最强大的HTML5编辑器”、“最智能的JavaScript IDE”等。与IntelliJ IDEA同源，继承了IntelliJ IDEA强大的JS部分的功能。

精选列表

揭秘支付宝中的深度学习引擎：xNN

HBase学习笔记——高表与宽表的选择

深度学习方法在机器视觉领域的发展

通过自动化机器学习对抗Java恶意软件

专访刘昕博士：深度学习与人工智能

基于深度学习的智能安防系统结构探讨

私人珍藏，九个开源的顶级深度学习项目

Spark将纳入机器学习与GPU

数据科学和机器学习工具和语言最新动态

国际主流深度学习领域厂商都在忙什么？

spring cloud 学习(8) - sleuth & zipkin 调用链跟踪

Spark on Angel：Spark机器学习的核心加速器

一篇文章看懂Android学习最佳路线

深度学习识别10000物种，手机上的@博物杂志

解析深度学习的未来十大趋势

学习数据分析的“里程碑”是什么？

Spark将机器学习与GPU加速机制纳入自身

NVIDIA令深度学习训练性能翻一番

深度学习那么火，它究竟能做些什么？

物联网最大魅力：使物体都具有学习能力

资源下载

Mario

Rocky Linux

Sublime Text

WebStorm

欢迎您来访！