首页 文章 精选 留言 我的

精选列表

搜索[系统工具],共10000篇文章
优秀的个人博客,低调大师

[转载]易上手的数据挖掘、可视化与机器学习工具: Orange介绍

标签 PostgreSQL , Orange3 , 可视化 , 时空数据 背景 可视化分析会是一个让枯燥的数据说话的快捷途径,降低可视化分析门槛,同时又保留它的编程能力,是非常重要的。 如今数据种类越来越多,除了常见的数值、文本,还有数组、K-V、图像、空间数据、波、基因 等等。对可视化分析软件的要求也越来越高。 原文 http://blog.just4fun.site/Orange-startup.html 之前陆续写过几篇介绍数据挖掘/可视化项目Caravel的文章: caravel系列之安装与入门 caravel系列之简易配置/定制 caravel系列之案例讲解与分析 caravel系列之架构与源码浅析 如今直接去github搜索caravel已经搜不到它了。它最近换了新马甲,改叫superset,至于为何频繁改名(分别叫过Panoramix,Ca

优秀的个人博客,低调大师

elasticSearch数据导入工具logstash-input-jdbc 同步原理及相关问题解读

前言: 基于logstash-input-jdbc较其他插件的稳定性、易用性、版本和ES同步更新的特点,以下研究主要针对 logstash-input-jdbc 展开。 针对logstash-input-jdbc常见的几个疑难问题,部分问题也在git和stackoverflow进行了激烈讨论,以下统一给出验证和解答。 1、logstash-input-jdbc 的同步原理是什么? (1)、对于全量同步依据 配置文件jdbc.sql的sql语句的进行同步。 (2)、对于增量实时同步依据 1)设定的定时策略。 如最小更新间隔每分钟更新一次设定:schedule => “* * * * *”,目前最小更新间隔为1分钟,验证发现,不支持60s以内的秒级更新。 2)设定的sql语句。 如jdbc.sql, 决定同步哪些内容及同步更新的条件。 {"id":10,"name":"10test","@version":"1","@timestamp":"2016-06-29T03:18:00.177Z","type":"132c_type"} 1 2:logstash-input-jdbc 只支持基于时间同步吗? 验证表名:同步更新除了支持根据时间同步外,还支持根据某自增列(如:自增ID)字段的变化进行同步。 上次举例只是举了同步时间变化的例子,设定条件: [root@5b9dbaaa148a logstash_jdbc_test]# cat jdbc.sql_bak select * from cc where cc.modified_at > :sql_last_value 1 2 3 4 5 6 7 实际进一步研究发现,在配置文件中有use_column_value字段决定,是否需要记录某个column 的值,如果 record_last_run 为真,可以自定义我们需要 track 的 column 名称,此时该参数就要为 true. 否则默认 track 的是 timestamp 的值. 举例:以下即是设定以id的变化作为同步条件的。 [root@5b9dbaaa148a logstash_jdbc_test]# cat jdbc_xm.sql select * from cc where cc.id >= :sql_last_value 1 2 3 4 5 6 我们可以指定文件,来记录上次执行到的 tracking_column 字段的值 比如上次数据库有 12 条记录,查询完后该文件中就会有数字 12 这样的记录,下次执行 SQL 查询可以从 13 条处开始. 我们只需要在 SQL 语句中 WHERE MY_ID > :last_sql_value 即可. 其中 :last_sql_value 取得就是该文件中的值(12). last_run_metadata_path => “/etc/logstash/run_metadata.d/my_info” 如: [root@5b9 run_metadata.d]# cat /etc/logstash/run_metadata.d/my_info --- 12 1 2 3 已全局代码搜索,没有触发器trigger相关处理操作。 3:mysql和ES分别存储在两台服务器,且时间不一致,能否实现同步? (1). 设定对于以时间作为判定条件的增量同步,可以以设定的时间为基准点进行同步。 验证发现: 显示的时间戳timestamp为ES上的UTC时间值(不论ES机器是什么时区,都会修改为UTC时间存入ES),显示的modified_at时间值为同步过来的mysql时间值转化为UTC的结果值。 更新的前提是必须满足: cc.modified_at >= :sql_last_value。即如果mysql的时间修改为小于sql_last_value的时刻值,是无法进行同步的。 如: 1 2 [elasticsearch@5b9dbaaa148a run_metadata.d]$ cat my_info --- 2016-06-29 02:19:00.182000000 Z 1 2 3 (2). 对于选定某列作为判定条件(如自增ID),两者(mysql和ES)时间不一致,实际是也可以同步更新的。 验证发现: 测试设定的时间是mysql比ES早一天或者晚一天的时刻值,都可以实现同步更新操作。 4:如何支持实时同步mysql的delete操作到ES中? logstash-input-jdbc插件不支持物理删除的同步更新。详见: http://stackoverflow.com/questions/35813923/sync-postgresql-data-with-elasticsearch/35823497#35823497 https://github.com/logstash-plugins/logstash-input-jdbc/issues/145 解决方案: 同步删除操作改为同步update更新操作实现。 第一步:进行软件删除,而不是物理删除操作。 先不物理删除记录,而是软件删除,即新增一个 flag 列,标识记录是否已经被删除(默认为false,设置为true或者deleted代表已经被删除,业界通用方法),这样,通过已有的同步机制,相同的标记记录该行数据会同步更新到Elasticsearch。 第二步:ES中检索flag标记为true或者deleted的字段信息。 在ES可以执行简单的term查询操作,检索出已经删除的数据信息。 第三步:定时物理删除。 设置定时事件,间隔一段时间物理删除掉mysql和ES中的flag字段标记为true或deleted的记录,即完成物理删除操。 原文网址:http://blog.csdn.net/laoyang360/article/details/51793301

优秀的个人博客,低调大师

百度Android开发工具存漏洞 数千款应用受影响

今日上午消息,百度提供的一个软件开发包(SDK)被曝光存在后门,而黑客可以利用这一后门入侵用户的设备。这一SDK被用在了数千款Android应用中。 趋势科技的信息安全研究人员周二表示,这一SDK名为Moplus。尽管没有公开发布,但这一SDK被集成至超过1.4万个应用,其中只有约4000个应用为百度开发。 趋势科技估计,受影响的应用被超过1亿用户使用。根据该公司的分析,Moplus SDK在用户设备上启动了HTTP服务器。这一服务器没有使用任何验证机制,会接受互联网上任何人的请求。 更糟糕的是,通过向这一隐藏的HTTP服务器发送请求,攻击者可以执行SDK中预定义的命令。这意味着攻击者可以获得位置数据和搜索关键词等敏感信息,并执行新增联系人、上传文件、拨打电话、显示伪造消息,以及安装应用等操作。 在被root的Android设备上,这一SDK允许应用的静默安装。这意味着,用户在没有看到任何确认消息的情况下,应用就可能被安装至设备。实际上,趋势科技的研究人员已经发现了一种蠕虫病毒,利用这一后门安装用户不需要的应用。这一恶意软件名为ANDROIDOS_WORMHOLE.HRXA。 趋势科技表示,从多个方面来看,Moplus漏洞都要比今年早些时候Android Stagefright库中发现的漏洞更严重。利用后一漏洞,攻击者至少需要向用户手机发送恶意的多媒体消息,或是欺骗用户打开恶意链接。而如果希望利用Moplus漏洞,那么攻击者可以扫描整个移动互联网,寻找Moplus HTTP服务器开启的IP地址。 百度已经发布了新版SDK,删除了一些命令。但趋势科技表示,HTTP服务器目前仍会开启,而一些功能仍可能被滥用。 百度一名发言人表示,百度已修复了10月30日报告给该公司的所有信息安全漏洞。“关于趋势科技最新报告的可能存在问题的其余代码,在我们的修复之后已成为无用代码,不会产生影响。” 这名发言人表示,百度没有提供“后门”。而在该公司的下一版应用中,这些未激活代码将会被删除。 不过目前的问题在于,第三方开发者将会在多长时间内用最新SDK去升级自己的应用。趋势科技列出的前20大受影响应用中包括非百度开发的应用,而其中有一些仍在谷歌Play中提供下载。 原文发布时间为:2015-11-03 本文来自云栖社区合作伙伴至顶网,了解相关信息可以关注至顶网。

资源下载

更多资源
Mario

Mario

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长,特征是大鼻子、头戴帽子、身穿背带裤,还留着胡子。与他的双胞胎兄弟路易基一起,长年担任任天堂的招牌角色。

Nacos

Nacos

Nacos /nɑ:kəʊs/ 是 Dynamic Naming and Configuration Service 的首字母简称,一个易于构建 AI Agent 应用的动态服务发现、配置管理和AI智能体管理平台。Nacos 致力于帮助您发现、配置和管理微服务及AI智能体应用。Nacos 提供了一组简单易用的特性集,帮助您快速实现动态服务发现、服务配置、服务元数据、流量管理。Nacos 帮助您更敏捷和容易地构建、交付和管理微服务平台。

Rocky Linux

Rocky Linux

Rocky Linux(中文名:洛基)是由Gregory Kurtzer于2020年12月发起的企业级Linux发行版,作为CentOS稳定版停止维护后与RHEL(Red Hat Enterprise Linux)完全兼容的开源替代方案,由社区拥有并管理,支持x86_64、aarch64等架构。其通过重新编译RHEL源代码提供长期稳定性,采用模块化包装和SELinux安全架构,默认包含GNOME桌面环境及XFS文件系统,支持十年生命周期更新。

WebStorm

WebStorm

WebStorm 是jetbrains公司旗下一款JavaScript 开发工具。目前已经被广大中国JS开发者誉为“Web前端开发神器”、“最强大的HTML5编辑器”、“最智能的JavaScript IDE”等。与IntelliJ IDEA同源,继承了IntelliJ IDEA强大的JS部分的功能。

用户登录
用户注册