-
Flink状态管理和容错机制介绍
作者: 施晓罡 (花名:星罡)导读:本文来自8月11日在北京举行的 Flink Meetup会议,分享来自于施晓罡,目前在阿里大数据团队部从事Blink方面的研发,现在主要负责Blink状态管理和容错相关技术的研发 本文主要内容如下: 有状态的流数据处理; Flink中的状态接口; 状态管理和容错机制实现; 阿里相关工作介绍; 一.有状态的流数据处理 1.1...
时间:2018-10-14点击:291收藏
-
Flink 靠什么征服饿了么工程师?(Flink在饿了么实时计算平台的应用)
title:Flink 靠什么征服饿了么工程师?(Flink在饿了么实时计算平台的应用)author: 易伟平time: 2018/07/26order: 6comment: 本文将为大家展示饿了么大数据平台在实时计算方面所做的工作,以及计算引擎的演变之路,你可以借此了解Storm、Spark、Flink的优缺点。如何选择一个合适的实时计算引擎?Flink凭...
时间:2018-10-14点击:277收藏
-
MapReduce实现与自定义词典文件基于hanLP的中文分词详解
前言: 文本分类任务的第1步,就是对语料进行分词。在单机模式下,可以选择python jieba分词,使用起来较方便。但是如果希望在Hadoop集群上通过mapreduce程序来进行分词,则hanLP更加胜任。 一、使用介绍 hanLP是一个用java语言开发的分词工具, 官网是http://hanlp.com/。 hanLP创建者提供了两种使用方式,一种是...
时间:2018-10-14点击:210收藏
-
hadoop框架结构的说明介绍
近年,随着互联网的发展特别是移动互联网的发展,数据的增长呈现出一种爆炸式的成长势头。单是谷歌的爬虫程序每天下载的网页超过1亿个(2000年数据,)数据的爆炸式增长直接推动了海量数据处理技术的发展。谷歌公司提出的大表、分布式文件系统和分布式计算的三大技术构架,解决了海量数据处理的问题。谷歌公司随即将设计思路开源,发表了具有划时代意义的三篇论文,很快根据谷歌设计...
时间:2018-10-14点击:170收藏
-
hive 0/0,1/0结果
有了这些试验结果,以后就可以放心大胆做各种除法了 select 0/0; null select 1/1; 1.0 select 1/0; null
时间:2018-10-14点击:213收藏
-
Hadoop之父:Doug Cutting
hadoop 生活中,可能所有人都间接用过他的作品,他是Lucene、Nutch 、Hadoop等项目的发起人。是他,把高深莫测的搜索技术形成产品,贡献给普罗大众;还是他,打造了目前在云计算和大数据领域里如日中天的Hadoop。他是某种意义上的盗火者,他就是Doug Cutting。 Doug Cutting 从实习生做起 1985年,Cutting毕业于美...
时间:2018-10-14点击:208收藏
-
谈一谈python中的魔法变量*args和**kwargs
导读 最近看了看github大佬写的代码后,发现自己之前写的代码就是个,没有注释,没有封装,没有可读性。哎,幸亏发现及时,现在正在写一个新的任务,刚好可以好好弄弄架构和代码了 在弄代码期间发现了*args和**kwargs这两个参数大佬们有时候经常用,当然最多的其实是在阅读python自己的源代码的时候最长见了,今天我终于了解清楚它们到底是啥了,大家一起来看...
时间:2018-10-14点击:224收藏
-
NLP学习------HanLP使用实验
在之前的实验中得到了不在词向量里的词与分词结果,结果有500多个词不在词向量里,解决方案就是重新分词,或再追加训练这些词到词向量里。但后者相对麻烦且目前样本量不大。我跟据词向量的作者[6]所使用的分词工具来分词,会比不同工具(jieba)的效果要好,因为都是同一模式的分词,分出来的词应该都会存在于大型语料库中。实验证明思路是对的,最后结果是只有60几个词不在...
时间:2018-10-14点击:216收藏
-
阿里云总监课第二期PPT下载地址
阿里云总监系列课重磅上线!聚焦人工智能、弹性计算、数据库等热门领域,首次集齐12位阿里云技术高管,耗时半年精心打磨,从理论到实践倾囊相授,从零开始绘制技术大牛成长路径。 第二期《如何打造智能语音交互爆款产品?》特邀阿里云资深算法专家鄢志杰,与志杰老师带领的机器智能技术实验室团队共同为大家带来干货分享。 课程简介: 智能语音交互产品的自研门槛究竟有多高? 三大...
时间:2018-10-14点击:242收藏
-
烟沙浮生 | 此间少年(2018-10-15 第五周记)
蝉声陪伴着行云流浪回忆开始后安静遥望远方“诶,同学,刚刚是你吹的笛子吗”“额,嗯,是,怎么了”“好听~吹得我快掉眼泪了。。。”......(来自10.13,收摊前,一个挺有感触的瞬间) 那一刻再次体会到, 乐器这种东西,一拿起来, 别人就有可能透过那抑扬之声, 看到你内心一角幻化而出的世界吧。。 匆匆忙忙,行程紧凑爆肝的一周, 如梦似幻结束了 补坑:周一到周...
时间:2018-10-14点击:183收藏
-
android经典源码,很不错的开源框架
高仿最美应用项目源码 项目介绍 这是仿最美应用开发的基于mvp+rxjava+retrofit的项目,很值得学 github地址: https://github.com/JJOGGER/BeautifulApp Musicoco 完整项目:音乐播放器 项目介绍 功能:通过耳机和通知栏快捷控制音乐播放、创建歌单、本地歌曲搜索、记忆播放、自动切换到夜间模式、定时...
时间:2018-10-14点击:215收藏
-
裸辞后,从Android转战Web前端的学习以及求职之路
在互联网的下半场,想要通过开发出一个APP就去创业,几乎不可能,难的不是开发成本,而是运营成本。 前言 我从Android开发转Web前端开发,没有别的原因,纯粹只是因为兴趣。你所见到的网站开发、手机网页开发、朋友圈里的H5活动页、小程序开发、公众号开发等,它们都是属于Web前端开发的范畴。 关于裸辞 有句话说得好:“裸辞穷半年”。 我为什么要裸辞呢? 首先...
时间:2018-10-14点击:204收藏
点击排行
-
Docker使用Oracle官方镜像安装(12C,18C,19C)
- Springboot2将连接池hikari替换为druid,体验最强大的数据库连接池
- Docker快速安装Oracle11G,搭建oracle11g学习环境
- CentOS8编译安装MySQL8.0.19
- SpringBoot2配置默认Tomcat设置,开启更多高级功能
- MySQL8.0.19开启GTID主从同步CentOS8
- Jdk安装(Linux,MacOS,Windows),包含三大操作系统的最全安装
- CentOS7,8上快速安装Gitea,搭建Git服务器
- SpringBoot2编写第一个Controller,响应你的http请求并返回结果
推荐阅读
最新文章
- SpringBoot2初体验,简单认识spring boot2并且搭建基础工程
- SpringBoot2全家桶,快速入门学习开发网站教程
- Springboot2将连接池hikari替换为druid,体验最强大的数据库连接池
- CentOS7,CentOS8安装Elasticsearch6.8.6
- Eclipse初始化配置,告别卡顿、闪退、编译时间过长
- CentOS8编译安装MySQL8.0.19
- Docker使用Oracle官方镜像安装(12C,18C,19C)
- 2048小游戏-低调大师作品
- CentOS8,CentOS7,CentOS6编译安装Redis5.0.7
- Docker安装Oracle12C,快速搭建Oracle学习环境