首页 文章 精选 留言 我的

精选列表

搜索[数据脱敏],共10000篇文章
优秀的个人博客,低调大师

数据||HDFS的API在JAVA中进行新增、删除、查看目录

1、在HDFS文件系统中新增目录 新增代码 查看结果 2、删除目录 删除代码 查看结果 3、查看目录 代码 执行结果 代码 package com.lizh.hadoop.hdfs; import java.io.File; import java.io.FileInputStream; import java.io.IOException; import org.apache.hadoop.conf.Configuration; import org.apache.hadoop.fs.FSDataInputStream; import org.apache.hadoop.fs.FSDataOutputStream; import org.apache.hadoop.fs.FileStatus; import org.apache.hadoop.fs.FileSystem; import org.apache.hadoop.fs.Path; import org.apache.hadoop.io.IOUtils; public class HdfsApp { public static FileSystem getFileSystem() throws IOException{ Configuration conf = new Configuration(); FileSystem fs = FileSystem.get(conf); return fs; } /** * 利用HDSF的api读取文件内容 * @param path1 */ public static void readFile(String path1) { try { FileSystem fs = getFileSystem(); Path path = new Path(path1); FSDataInputStream in = fs.open(path); IOUtils.copyBytes(in, System.out, 4000, false); } catch (Exception e) { // TODO: handle exception e.printStackTrace(); } } /** * 利用HDFS的api上传文件 */ public static void putFile(){ //把/opt/modules/hadoop-2.5.0/wc.input 内容写入到 /user/beifeng/put-wc.input //write file FileInputStream fisin =null; FSDataOutputStream fsoutstream =null; try { String filename="/user/beifeng/put-wc.input";//文件系统目录 Path inputpath = new Path(filename); FileSystem fs = getFileSystem();//获取文件系统 fsoutstream = fs.create(inputpath); fisin = new FileInputStream(new File("/opt/modules/hadoop-2.5.0/wc.input"));//本地系统目录文件 IOUtils.copyBytes(fisin, fsoutstream, 4000, false); } catch (Exception e) { // TODO: handle exception e.printStackTrace(); }finally{ IOUtils.closeStream(fsoutstream); IOUtils.closeStream(fisin); } } /** * 利用HDFS的api创建目录 */ public static void createDir(String filepath){ try { FileSystem fs = getFileSystem();//获取文件系统 fs.mkdirs(new Path(filepath)); fs.close(); } catch (Exception e) { // TODO: handle exception e.printStackTrace(); } } /** * 删除目录 * @param filepath */ public static void deleteDir(String filepath){ try { FileSystem fs = getFileSystem();//获取文件系统 fs.deleteOnExit(new Path(filepath)); fs.close(); } catch (Exception e) { // TODO: handle exception e.printStackTrace(); } } public static void listDir(){ try { FileSystem fs = getFileSystem();//获取文件系统 FileStatus[] fslarray = fs.listStatus(new Path("/user/beifeng")); for(FileStatus files:fslarray){ System.out.println(files.getPath()); } fs.close(); } catch (Exception e) { // TODO: handle exception e.printStackTrace(); }finally{ } } public static void main(String[] args) throws Exception{ listDir(); } }

优秀的个人博客,低调大师

sklearn.feature_extraction.DictVectorizer将字典格式的数据转换为特征

class sklearn.feature_extraction. DictVectorizer ( dtype=<class ‘numpy.float64’> , separator=’=’ , sparse=True , sort=True ) Transforms lists of feature-value mappings to vectors. This transformer turns lists of mappings (dict-like objects ) of feature names to feature values into Numpy arrays or scipy. sparse matrices(稀疏矩阵) for use with scikit-learn estimators. When feature values are strings, this transformer will do a binary one-hot (aka one-of-K) coding: one boolean-valued feature is constructed for each of the possible string values that the feature can take on. For instance, a feature “f” that can take on the values “ham” and “spam” will become two features in the output, one signifying “f=ham”, the other “f=spam”. However, note that this transformer will only do a binary one-hot encoding when feature values are of type string. If categorical features are represented as numeric values such as int, the DictVectorizer can be followed by OneHotEncoder to complete binary one-hot encoding. Features that do not occur in a sample (mapping) will have a zero value in the resulting array/matrix. Read more in the User Guide . Parameters: dtype : callable, optional The type of feature values. Passed to Numpy array/scipy.sparse matrix constructors as the dtype argument. separator : string, optional Separator string used when constructing new features for one-hot coding. sparse : boolean, optional. Whether transform should produce scipy.sparse matrices. True by default. sort : boolean, optional. Whether feature_names_ and vocabulary_ should be sorted when fitting. True by default. Attributes: vocabulary_ : dict A dictionary mapping feature names to feature indices. feature_names_ : list A list of length n_features containing the feature names (e.g., “f=ham” and “f=spam”).

优秀的个人博客,低调大师

【技术实验】Elasticsearch 做数据库系列之一:表结构定义

Elaticsearch 有非常好的查询性能,以及强大的查询语法。在一定场合下可以替代RDBMS做为OLAP的用途。但是其官方查询语法并不是SQL,而是一种Elasticsearch独创的DSL。主要是两个方面的DSL: Query DSL(https://www.elastic.co/guide/en/elasticsearch/reference/current/query-dsl.html) 相当于SQL里的 WHERE 部分,实现各种各样的过滤文档的方式。 Aggregation DSL (https://www.elastic.co/guide/en/elasticsearch/reference/current/search-aggregations.html) 相当于SQL里的 GROUP BY 部分,实现文档按条件聚合

资源下载

更多资源
Mario

Mario

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长,特征是大鼻子、头戴帽子、身穿背带裤,还留着胡子。与他的双胞胎兄弟路易基一起,长年担任任天堂的招牌角色。

腾讯云软件源

腾讯云软件源

为解决软件依赖安装时官方源访问速度慢的问题,腾讯云为一些软件搭建了缓存服务。您可以通过使用腾讯云软件源站来提升依赖包的安装速度。为了方便用户自由搭建服务架构,目前腾讯云软件源站支持公网访问和内网访问。

Spring

Spring

Spring框架(Spring Framework)是由Rod Johnson于2002年提出的开源Java企业级应用框架,旨在通过使用JavaBean替代传统EJB实现方式降低企业级编程开发的复杂性。该框架基于简单性、可测试性和松耦合性设计理念,提供核心容器、应用上下文、数据访问集成等模块,支持整合Hibernate、Struts等第三方框架,其适用范围不仅限于服务器端开发,绝大多数Java应用均可从中受益。

Rocky Linux

Rocky Linux

Rocky Linux(中文名:洛基)是由Gregory Kurtzer于2020年12月发起的企业级Linux发行版,作为CentOS稳定版停止维护后与RHEL(Red Hat Enterprise Linux)完全兼容的开源替代方案,由社区拥有并管理,支持x86_64、aarch64等架构。其通过重新编译RHEL源代码提供长期稳定性,采用模块化包装和SELinux安全架构,默认包含GNOME桌面环境及XFS文件系统,支持十年生命周期更新。

用户登录
用户注册