使用SparkSql 读取ES数据
对于大批量数据,查询es时,需要带条件去查询,否则一下查出所有数据数据量会很大 es查询需要编写json格式的DSL查询语句,对于复杂查询,DSL编写起来也分很复杂,所以我们这里使用sparksql,通过编写sql语句,spark将sql语句自动转化为DSL语句来查询es。关于es对spark的支持可参见文档,官网 https://www.elastic.co/guide/en/elasticsearch/hadoop/current/spark.html 废话不多说,上代码 case class people(phone:String) val sparkConf = new SparkConf().setAppName("application-name").setMaster("local[4]") val sc = new SparkContext(sparkConf) val sql = new SQLContext(sc) import sql.implicits._ //配置 val options = Map( "pushdown" -> "true", "es....