搜索[数据脱敏]结果-低调大师优秀个人博客

精选列表

搜索[数据脱敏]，共10000篇文章

大数据增进民生福祉

大数据技术的发展，为增进人类福祉提供了无限机会。在今年的全国两会上，政府工作报告中那句“实现部门间数据共享，让居民和企业少跑腿、好办事、不添堵”的话语，引起了国人的广泛共鸣。

2017-07-02

《大数据算法》一导读

由于其深远的影响和广泛的应用，大数据一直得到IT从业人员的重视，他们对大数据相关理论、技术的学习有着强烈的需求。

2017-06-20

RoboBinding —— Android 数据绑定框架

RoboBinding是一个实现了数据绑定 Presentation Model(MVVM) 模式的Android开源框架。

2017-06-08

R语言数据挖掘导读

由于人们对数据分析领域的兴趣日益增加，所以R语言提供了一个免费且开源的环境，非常适合学习和有效地利用现实世界中的预测建模方案。

2017-05-01

《R语言数据挖掘》——导读

由于人们对数据分析领域的兴趣日益增加，所以R语言提供了一个免费且开源的环境，非常适合学习和有效地利用现实世界中的预测建模方案。

2017-05-01

《大数据导论》一导读

作为Arcitura公司的CEO，Thomas领导研发了国际公认的大数据科学专家认证（BDSCP）、云专家认证（CCP）与SOA专家认证（SOACP）的课程大纲，设立了一系列正式的、与厂商无关的工业认证

2017-05-01

《R语言数据挖掘》----导读

由于人们对数据分析领域的兴趣日益增加，所以R语言提供了一个免费且开源的环境，非常适合学习和有效地利用现实世界中的预测建模方案。

2017-05-01

如何用大数据炒股

我们如今生活在一个数据爆炸的世界里。百度每天响应超过60亿次的搜索请求，日处理数据超过100PB，相当于6000多座中国国家图书馆的书籍信息量总和。新浪微博每天都会发布上亿条微博。

2017-05-01

新加坡大数据经验

大数据正成为推动企业效率提升和管理变革的强大力量，一些企业正利用互联网与物联网等带来的海量数据，通过挖掘、分析与业务应用，赢得优势。它正成为经济繁荣的催化剂，在美国，大数据已经被提到了国家战略的高度。

2017-04-02

Sqoop 数据导入导出实践

Sqoop是一个用来将hadoop和关系型数据库中的数据相互转移的工具，可以将一个关系型数据库(例如：mysql,oracle,等)中的数据导入到hadoop的HDFS中，也可以将HDFS的数据导入到关系型数据库中

2017-03-15

docker技术剖析--数据卷

我们可以在运行时使用-v来声明Volume： docker管理数据的方式有两种： 1、数据卷 2、数据卷容器数据卷是为一个或多个容器专门指定绕过Union File System的目录，为持续性或共享数据提供一些有用的功能

2016-12-22

一、原理分析 Mapreduce的处理过程，由于Mapreduce会在Map~reduce中，将重复的Key合并在一起，所以Mapreduce很容易就去除重复的行。Map无须做任何处理，设置Map中写入context的东西为不作任何处理的行，也就是Map中最初处理的value即可，而Reduce同样无须做任何处理，写入输出文件的东西就是，最初得到的Key。我原来以为是map阶段用了hashmap，根据hash值的唯一性。估计应该不是... Map是输入文件有几行，就运行几次。二、代码 2.1 Mapper package algorithm; import java.io.IOException; import org.apache.hadoop.io.LongWritable; import org.apache.hadoop.io.Text; import org.apache.hadoop.mapreduce.Mapper; public class DuplicateRemoveMapper extends Mapper<LongWritable, Text, Text, Text> { //输入文件是数字不过可能也有字符等所以用Text，不用LongWritable public void map(LongWritable key, Text value, Context context) throws IOException, InterruptedException { context.write(value, new Text());//后面不能是null，否则，空指针 } } 2.2 Reducer package algorithm; import java.io.IOException; import org.apache.hadoop.io.Text; import org.apache.hadoop.mapreduce.Reducer; public class DuplicateRemoveReducer extends Reducer<Text, Text, Text, Text> { public void reduce(Text key, Iterable<Text> value, Context context) throws IOException, InterruptedException { // process values context.write(key, null); //可以出处null } } 2.3 Main package algorithm; import org.apache.hadoop.conf.Configuration; import org.apache.hadoop.fs.Path; import org.apache.hadoop.io.IntWritable; import org.apache.hadoop.io.Text; import org.apache.hadoop.mapreduce.Job; import org.apache.hadoop.mapreduce.lib.input.FileInputFormat; import org.apache.hadoop.mapreduce.lib.output.FileOutputFormat; public class DuplicateMainMR { public static void main(String[] args) throws Exception{ // TODO Auto-generated method stub Configuration conf = new Configuration(); Job job = new Job(conf,"DuplicateRemove"); job.setJarByClass(DuplicateMainMR.class); job.setMapperClass(DuplicateRemoveMapper.class); job.setReducerClass(DuplicateRemoveReducer.class); job.setOutputKeyClass(Text.class); //输出是null，不过不能随意写否则包类型不匹配 job.setOutputValueClass(Text.class); job.setNumReduceTasks(1); //hdfs上写错了文件名 DupblicateRemove 多了个b //hdfs不支持修改操作 FileInputFormat.addInputPath(job, new Path("hdfs://192.168.58.180:8020/ClassicalTest/DupblicateRemove/DuplicateRemove.txt")); FileOutputFormat.setOutputPath(job, new Path("hdfs://192.168.58.180:8020/ClassicalTest/DuplicateRemove/DuplicateRemoveOut")); System.exit(job.waitForCompletion(true) ? 0 : 1); } } 三、输出分析 3.1 输入与输出没啥要对比的....不贴了 3.2 控制台 doop.mapreduce.Job.updateStatus(Job.java:323) INFO - Job job_local4032991_0001 completed successfully DEBUG - PrivilegedAction as:hxsyl (auth:SIMPLE) from:org.apache.hadoop.mapreduce.Job.getCounters(Job.java:765) INFO - Counters: 38 File System Counters FILE: Number of bytes read=560 FILE: Number of bytes written=501592 FILE: Number of read operations=0 FILE: Number of large read operations=0 FILE: Number of write operations=0 HDFS: Number of bytes read=48 HDFS: Number of bytes written=14 HDFS: Number of read operations=13 HDFS: Number of large read operations=0 HDFS: Number of write operations=4 Map-Reduce Framework Map input records=8 Map output records=8 Map output bytes=26 Map output materialized bytes=48 Input split bytes=142 Combine input records=0 Combine output records=0 Reduce input groups=6 Reduce shuffle bytes=48 Reduce input records=8 Reduce output records=6 Spilled Records=16 Shuffled Maps =1 Failed Shuffles=0 Merged Map outputs=1 GC time elapsed (ms)=4 CPU time spent (ms)=0 Physical memory (bytes) snapshot=0 Virtual memory (bytes) snapshot=0 Total committed heap usage (bytes)=457179136 Shuffle Errors BAD_ID=0 CONNECTION=0 IO_ERROR=0 WRONG_LENGTH=0 WRONG_MAP=0 WRONG_REDUCE=0 File Input Format Counters Bytes Read=24 File Output Format Counters Bytes Written=14 DEBUG - PrivilegedAction as:hxsyl (auth:SIMPLE) from:org.apache.hadoop.mapreduce.Job.updateStatus(Job.java:323) DEBUG - stopping client from cache: org.apache.hadoop.ipc.Client@37afeb11 DEBUG - removing client from cache: org.apache.hadoop.ipc.Client@37afeb11 DEBUG - stopping actual client because no more references remain: org.apache.hadoop.ipc.Client@37afeb11 DEBUG - Stopping client DEBUG - IPC Client (521081105) connection to /192.168.58.180:8020 from hxsyl: closed DEBUG - IPC Client (521081105) connection to /192.168.58.180:8020 from hxsyl: stopped, remaining connections 0

2016-12-01

大数据的那些事儿

资源列表：关系数据库管理系统（RDBMS）框架分布式编程分布式文件系统文件数据模型 Key -Map 数据模型键-值数据模型图形数据模型 NewSQL数据库列式数据库时间序列数据库类

2016-09-25

R语言和大数据

MaxCompute产品地址：https://www.aliyun.com/product/odps 安装R语言 R3.3版本会出现各种so不存在的问题，退回去到R3.1版本时候就顺利安装。在安装R环境之前，先安装好中文（如果没有的话图表中显示汉字成框框了）和tcl/tk包(少了这个没法安装sqldf) sudo yum install fonts-chinese tcl tcl-devel tclx tk tk-devel -y 安装中文字体后重新加载 service xfs reload (不过在有台机器上总是失败，后来重启机器OK) sudo service xfs reload 有些包会需要rgl，调用opengl的库，所以还要安装opengl包 sudo yum install mesa-libGLU mesa-libGL

2016-09-21

云数据库 Bmob

/**************************************************************************************** * 云数据库 Bmob

2016-09-13

Spark Streaming 数据接收优化

看这篇文章前，请先移步 Spark Streaming 数据产生与导入相关的内存分析, 文章重点讲的是从Kafka消费到数据进入BlockManager的这条线路的分析。

2016-09-06

iOS - OC 数据持久化

都会碰到数据保存的问题。

2016-08-17

iOS - OC PList 数据存储

前言直接将数据写在代码里面，不是一种合理的做法。如果数据经常改，就要经常翻开对应的代码进行修改，造成代码扩展性低。因此，可以考虑将经常变的数据放在文件中进行存储，程序启动后从文件中读取最新的数据。

2016-08-17

iOS - OC NSKeyedArchiver 数据归档

采用归档的形式来保存数据，该数据对象需要遵守 NSCoding 协议，并且该对象对应的类必须提供 encodeWithCoder: 和 initWithCoder: 方法。

2016-08-17

iOS - OC NSUserDefaults 数据存储

前言 @interface NSUserDefaults : NSObject 用来保存应用程序设置和属性、用户保存的数据。用户再次打开程序或开机后这些数据仍然存在。

2016-08-17

资源下载

更多资源

Nacos

Nacos /nɑ:kəʊs/ 是 Dynamic Naming and Configuration Service 的首字母简称，一个易于构建 AI Agent 应用的动态服务发现、配置管理和AI智能体管理平台。Nacos 致力于帮助您发现、配置和管理微服务及AI智能体应用。Nacos 提供了一组简单易用的特性集，帮助您快速实现动态服务发现、服务配置、服务元数据、流量管理。Nacos 帮助您更敏捷和容易地构建、交付和管理微服务平台。

Rocky Linux

Rocky Linux（中文名：洛基）是由Gregory Kurtzer于2020年12月发起的企业级Linux发行版，作为CentOS稳定版停止维护后与RHEL（Red Hat Enterprise Linux）完全兼容的开源替代方案，由社区拥有并管理，支持x86_64、aarch64等架构。其通过重新编译RHEL源代码提供长期稳定性，采用模块化包装和SELinux安全架构，默认包含GNOME桌面环境及XFS文件系统，支持十年生命周期更新。

Sublime Text

Sublime Text具有漂亮的用户界面和强大的功能，例如代码缩略图，Python的插件，代码段等。还可自定义键绑定，菜单和工具栏。Sublime Text 的主要功能包括：拼写检查，书签，完整的 Python API ， Goto 功能，即时项目切换，多选择，多窗口等等。Sublime Text 是一个跨平台的编辑器，同时支持Windows、Linux、Mac OS X等操作系统。

WebStorm

WebStorm 是jetbrains公司旗下一款JavaScript 开发工具。目前已经被广大中国JS开发者誉为“Web前端开发神器”、“最强大的HTML5编辑器”、“最智能的JavaScript IDE”等。与IntelliJ IDEA同源，继承了IntelliJ IDEA强大的JS部分的功能。

精选列表

大数据增进民生福祉

《大数据算法》一导读

RoboBinding —— Android 数据绑定框架

R语言数据挖掘导读

《R语言数据挖掘》——导读

《大数据导论》一导读

《R语言数据挖掘》----导读

如何用大数据炒股

新加坡大数据经验

Sqoop 数据导入导出实践

docker技术剖析--数据卷

MapReduce实现数据去重

大数据的那些事儿

R语言和大数据

云数据库 Bmob

Spark Streaming 数据接收优化

iOS - OC 数据持久化

iOS - OC PList 数据存储

iOS - OC NSKeyedArchiver 数据归档

iOS - OC NSUserDefaults 数据存储

资源下载

Nacos

Rocky Linux

Sublime Text

WebStorm

欢迎您来访！