您现在的位置是:首页 > 文章详情

通过Spark Streaming从TCP协议中获取实时流数据(scala测试代码)

日期:2018-05-05点击:468

scala的简单实现:


package lab2012 import org.apache.spark._ import org.apache.spark.streaming._ object WaitToGetWordFromTCP { def main(args: Array[String]): Unit = { // Spark Streaming程序以StreamingContext为起点,其内部维持了一个SparkContext的实例。 // 这里我们创建一个带有两个本地线程的StreamingContext,并设置批处理间隔为8秒。 val conf = new SparkConf().setMaster("local[2]").setAppName("NetworkWordCount") val ssc = new StreamingContext(conf, Seconds(1)) // 在一个Spark应用中默认只允许有一个SparkContext,默认地spark-shell已经为我们创建好了 // SparkContext,名为sc。因此在spark-shell中应该以下述方式创建StreamingContext,以 // 避免创建再次创建SparkContext而引起错误: // val ssc = new StreamingContext(sc, Seconds(8)) // 创建一个从TCP连接获取流数据的DStream,其每条记录是一行文本 val lines = ssc.socketTextStream("192.168.88.80", 8048) // 对DStream进行转换,最终得到计算结果 //val res = lines.flatMap(_.split(" ")).map((_, 1)).reduceByKey(_ + _) val res = lines.flatMap(word=>word.split(" ")).map((_, 1)).reduceByKey(_ + _) // 打印该DStream中每个RDD中的前十个元素 res.print() // 执行完上面代码,Spark Streaming并没有真正开始处理数据,而只是记录需在数据上执行的操作。 // 当我们设置好所有需要在数据上执行的操作以后,我们就可以开始真正地处理数据了。如下: ssc.start() // 开始计算 ssc.awaitTermination() // 等待计算终止 //启动后,通过:nc -lk 8048,可以向端口发送字符串,spark可以接受到字符串,并处理 } } 


原文链接:https://yq.aliyun.com/articles/590436
关注公众号

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。

持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。

文章评论

共有0条评论来说两句吧...

文章二维码

扫描即可查看该文章

点击排行

推荐阅读

最新文章