[Hadoop]输入路径过滤,通配符与PathFilter
版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/SunnyYoona/article/details/53786397 1. 丢失文件路径过滤 应用场景:我们想查询一个月以来度假的订单数据,但是HDFS中可能因为业务故障,导致某一天的订单数据不存在: FileInputFormat.setInputPaths(job, inputPath); 上述代码在遇到路径不存在的时候会报错。 所以在设置路径之前需要进行一次判断,判断这个路径在HDFS上是否存在,如果存在,使用addInputPath方法添加: FileSystem fileSystem = FileSystem.get(conf); String[] params = inputPath.split(","); for(String path : params){ boolean isExists = fileSystem.exists(new Path(path)); if(isExists){ FileInputFormat.addInputPath(job, new Pat...
