您现在的位置是：首页 > 文章详情

Elastic Stack 实现地理空间数据采集与可视化分析

日期：2020-08-19点击：552收藏

随着人类在不断地探索空间，地理空间数据越来越多。收集信息的速度以及提供位置信息的来源正在迅速增长。政府和商业卫星继续扩张。与GPS一起，它们提供了一系列不同的空间丰富的数据源，包括天气和温度模式，土地使用，土壤化学，减灾和响应，电信等。

移动设备和底层网络将人员，汽车，卡车和大量踏板车变成了位置信息的来源。计算机网络将位置信息嵌入IP地址元数据中，这可以帮助IT管理员在分布式基础架构中为用户提供支持，或者帮助执法部门以及我们的网络运营商找到并阻止坏人。所有这些数据都是令人兴奋的，它激发了每个人内部的创造力来利用它。提出新的问题，构思新的想法，并建立新的期望。这些新事物不容易解决。他们需要以不同格式存储的数据或跨非空间维度（如主题标签或网络域）的相关性存储的数据。尽管专家长期以来拥有执行复杂的地理空间分析的工具，但这些工具并不总是能够完成非传统来源的混合或处理当今数据集规模的任务。现在事情变得更加复杂。Elastic Stack 是一个高效的存储，分析及搜索软件栈。Elastic Stack 正在积极地推动这一进程。为我们提供更多的数据，更多的用途和更多的利益。

准备工作：

我将使用 opensky network API 来获取飞机的飞行信息，并使用 Kibana 来对数据进行展示。

1、开通阿里云 Elasticsearch 1核2G ，免费测试环境
2、开通阿里云 Logstash 2核4G ，免费测试环境

我们通过阿里云控制台，进入阿里云 kibana

Logstash 配置文件

在这个展示中，我们将使用 Logstash 定期地去 opensky network 网站上去抓取数据，并导入到 Elasticsearch 中。Logstash 的配置文件如下：

fligths_logstash.conf

input { http_poller { codec => "json" schedule => { every => "15s" } urls => { url => "https://opensky-network.org/api/states/all" } } } filter { split { field => "states" add_field => { "icao" => "%{[states][0]}" "callsign" => "%{[states][1]}" "origin_country" => "%{[states][2]}" "time_position" => "%{[states][3]}" "last_contact" => "%{[states][4]}" "location" => "%{[states][6]},%{[states][5]}" "baro_altitude" => "%{[states][7]}" "on_ground" => "%{[states][8]}" "velocity" => "%{[states][9]}" "true_track" => "%{[states][10]}" "vertical_rate" => "%{[states][11]}" "geo_altitude" => "%{[states][13]}" "squawk" => "%{[states][14]}" "spi" => "%{[states][15]}" "position_source" => "%{[states][16]}" } } mutate { strip => ["callsign"] rename => { "time" => "request_time" } remove_field => ["states", "@version"] } translate { field => "[position_source]" destination => "position_source" override => "true" dictionary => { "0" => "ADS-B" "1" => "ASTERIX" "2" => "MLAB" } } if [time_position] =~ /^%{*/ { drop { } } if [callsign] =~ /^%{*/ { mutate { remove_field => ["callsign"] } } if [location] =~ /^%{*/ { mutate { remove_field => ["location"] } } if [baro_altitude] =~ /^%{*/ { mutate { remove_field => ["baro_altitude"] } } if [velocity] =~ /^%{*/ { mutate { remove_field => ["velocity"] } } if [true_track] =~ /^%{*/ { mutate { remove_field => ["true_track"] } } if [vertical_rate] =~ /^%{*/ { mutate { remove_field => ["vertical_rate"] } } if [sensors] =~ /^%{*/ { mutate { remove_field => ["sensors"] } } if [geo_altitude] =~ /^%{*/ { mutate { remove_field => ["geo_altitude"] } } if [squawk] =~ /^%{*/ { mutate { remove_field => ["squawk"] } } mutate { convert => { "baro_altitude" => "float" "geo_altitude" => "float" "last_contact" => "integer" "on_ground" => "boolean" "request_time" => "integer" "spi" => "boolean" "squawk" => "integer" "time_position" => "integer" "true_track" => "float" "velocity" => "float" "vertical_rate" => "float" } } } output { stdout { codec => rubydebug } elasticsearch { manage_template => "false" index => "flights" # pipeline => "flights_aircraft_enrichment" hosts => "localhost:9200" } }

从上面的 input 部分我们可以看出来：

input { http_poller { codec => "json" schedule => { every => "15s" } urls => { url => "https://opensky-network.org/api/states/all" } } }

这里，我们使用 http_poller 每隔15秒去抓一次数据.如果大家想知道这个 API https://opensky-network.org/api/states/all 的内容是什么，你可以直接在浏览器的地址栏中输入这个地址，你及可以看出来是什么样的格式的信息。你可以使用工具 http://jsonviewer.stack.hu/ 对这个 JSON 格式的返回信息进行格式化，以便更好地分析它里面的数据。这对在 filter 部分的各个过滤器的使用的理解是非常有帮助的。在 filter 的最后部分，我也对数据的类型进行了转换以便更好地在 Kibana 中进行分析。

为了能够使得我们的 flights 的数据类型和我们转换的数据类型进行很好的匹配，我们必须在 Kibana 中对这个索引定义好它的 mapping：

PUT flights { "mappings": { "properties": { "@timestamp": { "type": "date" }, "baro_altitude": { "type": "float" }, "callsign": { "type": "keyword" }, "geo_altitude": { "type": "float" }, "icao": { "type": "keyword" }, "last_contact": { "type": "long" }, "location": { "type": "geo_point" }, "on_ground": { "type": "boolean" }, "origin_country": { "type": "keyword" }, "position_source": { "type": "keyword" }, "request_time": { "type": "long" }, "spi": { "type": "boolean" }, "squawk": { "type": "long" }, "time_position": { "type": "long" }, "true_track": { "type": "float" }, "velocity": { "type": "float" }, "vertical_rate": { "type": "float" } } } }

在 Kibana 的 Dev Tools 中运行上面的指令，这样我们就创建好了 flights 索引的 mapping。

接下来，我就可以启动通过阿里云控制台，进入Logstash 了。

这时，我们可以在 console 中看到如下的输出：