首页 文章 精选 留言 我的

精选列表

搜索[工具库],共10000篇文章
优秀的个人博客,低调大师

Jackson对字符串和对象进行转换操作工具

直接公开代码 import com.fasterxml.jackson.databind.JavaType; import com.fasterxml.jackson.databind.ObjectMapper; import java.util.List; public class ObjectandObjetUtils<T> { public static final ObjectMapper OBJECT_MAPPER = new ObjectMapper(); public T objetcMapperT(Object object,Class<T> valueType) throws Exception { return OBJECT_MAPPER.readValue(OBJECT_MAPPER.writeValueAsString(object),valueType); } public T stringMapperT(String string,Class<T> valueType) throws Exception { return OBJECT_MAPPER.readValue(string,valueType); } public List<T> objetcMapperTList(Object object,Class<T> valueType) throws Exception { JavaType javaType =OBJECT_MAPPER.getTypeFactory().constructParametricType(List.class,valueType); return OBJECT_MAPPER.readValue(OBJECT_MAPPER.writeValueAsString(object),javaType); } public List<T> stringMapperTList(String string,Class<T> valueType) throws Exception { JavaType javaType =OBJECT_MAPPER.getTypeFactory().constructParametricType(List.class,valueType); return OBJECT_MAPPER.readValue(string,javaType); } }

优秀的个人博客,低调大师

python人工智能机器人工具书籍: Python Robotics Projects - 2018

简介 利用Python的强大功能构建DIY机器人项目 主要特点•设计,构建和激发协作机器人•建立高端机器人项目,如定制的个人Jarvis•利用Python和ROS的强大功能进行DIY机器人项目 图书说明 机器人技术是一个快速发展的行业。多项调查表明,在过去的6年中,该领域的投资增加了十倍,到2020年将成为一个价值1000亿美元的部门。机器人在所有行业都很普遍,它们都将成为我们国内生活的一部分 。本书首先介绍配置机械手控制器的安装和基本步骤。然后,您将继续设置环境以将Python与机器人控制器一起使用。您将深入研究简单的机器人项目,例如宠物喂养机器人,以及更复杂的项目,例如机器学习启用的家庭自动化系统(Jarvis),基于视觉处理的机器人和使用Python的自驱动机器人车辆。 在本书的最后,您将了解如何使用Python构建智能机器人。 你会学

优秀的个人博客,低调大师

自然语言处理工具hanlp关键词提取图解TextRank算法

看一个博主(亚当-adam)的关于hanlp关键词提取算法TextRank的文章,还是非常好的一篇实操经验分享,分享一下给各位需要的朋友一起学习一下! TextRank是在Google的PageRank算法启发下,针对文本里的句子设计的权重算法,目标是自动摘要。它利用投票的原理,让每一个单词给它的邻居(术语称窗口)投赞成票,票的权重取决于自己的票数。这是一个“先有鸡还是先有蛋”的悖论,PageRank采用矩阵迭代收敛的方式解决了这个悖论。本博文通过hanlp关键词提取的一个Demo,并通过图解的方式来讲解TextRank的算法。 1//长句子 2String content = "程序员(英文Programmer)是从事程序开发、维护的专业人员。" + 3"一般将程序员分为程序设计人员和程序编码人员," + 4"但两者的界限并不非常清楚,特别是在中国。" + 5"软件从业人员分为初级程序员、高级程序员、系统" + 6"分析员和项目经理四大类。"; 最后提取的关键词是:[程序员, 程序, 分为, 人员, 软件] 下面来分析为什么会提取出这5个关键词 第一步:分词 把content 通过一个的分词算法进行分词,这里采用的是Viterbi算法也就是HMM算法。分词后(当然首先应把停用词、标点、副词之类的去除)的结果是: [程序员, 英文, Programmer, 从事, 程序, 开发, 维护, 专业, 人员, 程序员, 分为, 程序, 设计, 人员, 程序, 编码, 人员, 界限, 并不, 非常, 清楚, 特别是在, 中国, 软件, 从业人员, 分为, 程序员, 高级, 程序员, 系统分析员, 项目经理, 四大] 第二步:构造窗口 hanlp的实现代码如下: Map<String, Set<String>> words = new TreeMap<String, Set<String>>(); Queue<String> que = new LinkedList<String>(); for (String w : wordList) { if (!words.containsKey(w)) { words.put(w, new TreeSet<String>()); } // 复杂度O(n-1) if (que.size() >= 5) { que.poll(); } for (String qWord : que) { if (w.equals(qWord)) { continue; } //既然是邻居,那么关系是相互的,遍历一遍即可 words.get(w).add(qWord); words.get(qWord).add(w); } que.offer(w); } 这个代码的功能是为分个词构造窗口,这个词前后各四个词就是这个词的窗口,如词分词后一个词出现了多次,像[程序员],那就是把每次出现取一次窗口,然后把各次结果合并去重,最后结果是:程序员=[Programmer, 专业, 中国, 人员, 从业人员, 从事, 分为, 四大, 开发, 程序, 系统分析员, 维护, 英文, 设计, 软件, 项目经理, 高级]。最后形成的窗口: 1 Map<String, Set<String>> words = 2 3 {Programmer=[从事, 开发, 程序, 程序员, 维护, 英文], 专业=[人员, 从事, 分为, 开发, 程序, 程序员, 维护], 中国=[从业人员, 分为, 并不, 清楚, 特别是在, 程序员, 软件, 非常], 人员=[专业, 分为, 并不, 开发, 清楚, 界限, 程序, 程序员, 维护, 编码, 设计, 非常], 从业人员=[中国, 分为, 清楚, 特别是在, 程序员, 软件, 高级], 从事=[Programmer, 专业, 开发, 程序, 程序员, 维护, 英文], 分为=[专业, 中国, 人员, 从业人员, 特别是在, 程序, 程序员, 系统分析员, 维护, 设计, 软件, 高级], 四大=[程序员, 系统分析员, 项目经理, 高级], 并不=[中国, 人员, 清楚, 特别是在, 界限, 程序, 编码, 非常], 开发=[Programmer, 专业, 人员, 从事, 程序, 程序员, 维护, 英文], 清楚=[中国, 人员, 从业人员, 并不, 特别是在, 界限, 软件, 非常], 特别是在=[中国, 从业人员, 分为, 并不, 清楚, 界限, 软件, 非常], 界限=[人员, 并不, 清楚, 特别是在, 程序, 编码, 非常], 程序=[Programmer, 专业, 人员, 从事, 分为, 并不, 开发, 界限, 程序员, 维护, 编码, 英文, 设计], 程序员=[Programmer, 专业, 中国, 人员, 从业人员, 从事, 分为, 四大, 开发, 程序, 系统分析员, 维护, 英文, 设计, 软件, 项目经理, 高级], 系统分析员=[分为, 四大, 程序员, 项目经理, 高级], 维护=[Programmer, 专业, 人员, 从事, 分为, 开发, 程序, 程序员], 编码=[人员, 并不, 界限, 程序, 设计, 非常], 英文=[Programmer, 从事, 开发, 程序, 程序员], 设计=[人员, 分为, 程序, 程序员, 编码], 软件=[中国, 从业人员, 分为, 清楚, 特别是在, 程序员, 非常, 高级], 非常=[中国, 人员, 并不, 清楚, 特别是在, 界限, 编码, 软件], 项目经理=[四大, 程序员, 系统分析员, 高级], 高级=[从业人员, 分为, 四大, 程序员, 系统分析员, 软件, 项目经理]} 第三步:迭代投票 每个词最后的投票得分由这个词的窗口进行多次迭代投票决定,迭代的结束条件就是大于最大迭代次数这里是200次,或者两轮之前某个词的权重小于某一值这里是0.001f。看下代码: Map<String, Float> score = new HashMap<String, Float>(); //依据TF来设置初值 for (Map.Entry<String, Set<String>> entry : words.entrySet()){ score.put(entry.getKey(),sigMoid(entry.getValue().size())); } System.out.println(score); for (int i = 0; i < max_iter; ++i) { Map<String, Float> m = new HashMap<String, Float>(); float max_diff = 0; for (Map.Entry<String, Set<String>> entry : words.entrySet()) { String key = entry.getKey(); Set<String> value = entry.getValue(); m.put(key, 1 - d); for (String element : value) { int size = words.get(element).size(); if (key.equals(element) || size == 0) continue; m.put(key, m.get(key) + d / size * (score.get(element) == null ? 0 : score.get(element))); } max_diff = Math.max(max_diff, Math.abs(m.get(key) - (score.get(key) == null ? 0 : score.get(key)))); } score = m; if (max_diff <= min_diff) break; } System.out.println(score); return score; } 投票的原理拿Programmer=[从事, 开发, 程序, 程序员, 维护, 英文],这个词来说明,Programmer最后的得分是由[从事, 开发, 程序, 程序员, 维护, 英文],这6个词依次投票决定的,每个词投出去的分数是和他本身的权重相关的。 1、投票开始前每个词初始化了一个权重,score.put(entry.getKey(),sigMoid(entry.getValue().size())),这个权重是0到1之间,公式是 1 //value是每个词窗口的大小 2public static float sigMoid(float value) { 3return (float)(1d/(1d+Math.exp(-value))); 4} 这个函数的公式和图像如下,因为value一定是大于0的,所以sigMod值属于(0,1) 初始化后的分词是:{特别是在=0.99966466, 程序员=0.99999994, 编码=0.99752736, 四大=0.98201376, 英文=0.9933072, 非常=0.99966466, 界限=0.99908894, 系统分析员=0.9933072, 从业人员=0.99908894, 程序=0.99999774, 专业=0.99908894, 项目经理=0.98201376, 设计=0.9933072, 从事=0.99908894, Programmer=0.99752736, 软件=0.99966466, 人员=0.99999386, 清楚=0.99966466, 中国=0.99966466, 开发=0.99966466, 并不=0.99966466, 高级=0.99908894, 分为=0.99999386, 维护=0.99966466} 进行迭代投票,第一轮投票,[Programmer, 专业, 中国, 人员, 从业人员, 从事, 分为, 四大, 开发, 程序, 系统分析员, 维护, 英文, 设计, 软件, 项目经理, 高级]依给次*程序员*投票,得分如下: [Programmer]给[程序员]投票后,[]程序员]的得分: [专业]给[程序员]投票 这样[Programmer, 专业, 中国, 人员, 从业人员, 从事, 分为, 四大, 开发, 程序, 系统分析员, 维护, 英文, 设计, 软件, 项目经理, 高级]依次给[程序员]投票,投完票后,再给其它的词进行投票,本轮结束后,判断是否达到最大迭代次数200或两轮之间分数差值小于0.001,如果满足则结束,否则继续进行迭代。 最后的投票得分是:{特别是在=1.0015739, 程序员=2.0620303, 编码=0.78676623, 四大=0.6312981, 英文=0.6835063, 非常=1.0018439, 界限=0.88890904, 系统分析员=0.74232763, 从业人员=0.8993066, 程序=1.554001, 专业=0.88107216, 项目经理=0.6312981, 设计=0.6702926, 从事=0.9027207, Programmer=0.7930236, 软件=1.0078223, 人员=1.4288887, 清楚=0.9998723, 中国=0.99726284, 开发=1.0065585, 并不=0.9968608, 高级=0.9673803, 分为=1.4548829, 维护=0.9946941},分数最高的关键词就是要提取的关键词

优秀的个人博客,低调大师

自然语言处理工具hanlp自定义词汇添加图解

过程分析 1.添加新词需要确定无缓存文件,否则无法使用成功,因为词典会优先加载缓存文件 2.再确认缓存文件不在时,打开本地词典按照格式添加自定义词汇。 3.调用分词函数重新生成缓存文件,这时会报一个找不到缓存文件的异常,不用管,因为加载词典进入内存是会优先加载缓存,缓存不在当然会报异常,然后加载词典生成缓存文件,最后处理字符进行分词就会发现新添加的词汇可以进行分词了。 操作过程图解: 1、有缓存文件的情况下: 1 System.out.println(HanLP.segment("张三丰在一起我也不知道你好一个心眼儿啊,一半天欢迎使用HanLP汉语处理包!" +"接下来请从其他Demo中体验HanLP丰富的功能~")) 2 3 //首次编译运行时,HanLP会自动构建词典缓存,请稍候…… 4 //[张/q, 三丰/nz, 在/p, 一起/s, 我/rr, 也/d, 不/d, 知道/v, 你好/vl, 一个心眼儿/nz, 啊/y, ,/w, 一半天/nz, 欢迎/v, 使用/v, HanLP/nx, 汉语/gi, 处理/vn, 包/v, !/w, 接下来/vl, 请/v, 从/p, 其他/rzv, Demo/nx, 中/f, 体验/v, HanLP/nx, 丰富/a, 的/ude1, 功能/n, ~/nx] 5 6 1. 打开用户词典–添加 ‘张三丰在一起’ 为一个 nz词性的新词 2.2 原始缓存文件下运行–会发现不成功,没有把 ‘张三丰在一起’ 分词一个nz词汇 1 System.out.println(HanLP.segment("张三丰在一起我也不知道你好一个心眼儿啊,一半天欢迎使用HanLP汉语处理包!" +"接下来请从其他Demo中体验HanLP丰富的功能~")) 2 3 //首次编译运行时,HanLP会自动构建词典缓存,请稍候…… 4 //[张/q, 三丰/nz, 在/p, 一起/s, 我/rr, 也/d, 不/d, 知道/v, 你好/vl, 一个心眼儿/nz, 啊/y, ,/w, 一半天/nz, 欢迎/v, 使用/v, HanLP/nx, 汉语/gi, 处理/vn, 包/v, !/w, 接下来/vl, 请/v, 从/p, 其他/rzv, Demo/nx, 中/f, 体验/v, HanLP/nx, 丰富/a, 的/ude1, 功能/n, ~/nx] 5 3.1 删除缓存文件 bin 3.2 再次运行程序,此时会报错—无法找到缓存文件 1 System.out.println(HanLP.segment("张三丰在一起我也不知道你好一个心眼儿啊,一半天欢迎使用HanLP汉语处理包!" +"接下来请从其他Demo中体验HanLP丰富的功能~")); 2 3 /**首次编译运行时,HanLP会自动构建词典缓存,请稍候…… 4 十月 19, 2018 6:12:49 下午 com.hankcs.hanlp.corpus.io.IOUtil readBytes 5 WARNING: 读取D:/datacjy/hanlp/data/dictionary/custom/CustomDictionary.txt.bin时发生异常java.io.FileNotFoundException: D:\datacjy\hanlp\data\dictionary\custom\CustomDictionary.txt.bin (系统找不到指定的文件。) 找不到缓存文件 6 7 8 [张三丰在一起/nz, 我/rr, 也/d, 不/d, 知道/v, 你好/vl, 一个心眼儿/nz, 啊/y, ,/w, 一半天/nz, 欢迎/v, 使用/v, HanLP/nx, 汉语/gi, 处理/vn, 包/v, !/w, 接下来/vl, 请/v, 从/p, 其他/rzv, Demo/nx, 中/f, 体验/v, HanLP/nx, 丰富/a, 的/ude1, 功能/n, ~/nx] 9 10 */

优秀的个人博客,低调大师

技术篇-HBase 2.0 之修复工具 HBCK2 运维指南

概述 目前社区已经发布了 HBase 的 2.0 版本,很多公司都希望去尝试新版本上的新功 能,但是不得不面对的问题就是当集群出了问题应该如何解决。在之前的 HBase版本中,我们可以依赖 hbck 来帮助检查问题和修复问题,在新的版本上我们应 该如何去处理呢?HBASE-19121[1]给了我们答案——HBCK2。HBCK2 目前发布 了 1.0 版本,还在一直开发中,感兴趣的同学看看这个 issue 1. WHY HBCK2由于之前的 hbck(hbck-1)是会直接去向 region server 或者 hdfs 发送请求进行修 复,而在 HBase 2.0 版本上集群内部操作全部都被挪到了 procedure v2(下文都称 为 procedure)上进行处理。因为所有的命令都是经过 master 来协调处理,所以在修复时也需

优秀的个人博客,低调大师

HBase指南 | HBase 2.0之修复工具HBCK2运维指南

目前社区已经发布了HBase的2.0版本,很多公司都希望去尝试新版本上的新功能,但是不得不面对的问题就是当集群出了问题应该如何解决。 在之前的HBase版本中,我们可以依赖hbck来帮助检查问题和修复问题,在新的版本上我们应该如何去处理呢?HBASE-19121[1]给了我们答案——HBCK2。 HBCK2目前发布了1.0版本,还在一直开发中,感兴趣的同学看看这个issue。 由于之前的hbck(hbck-1)是会直接去向region server或者hdfs发送请求进行修复,而在HBase 2.0版本上集群内部操作全部都被挪到了procedure v2(下文都称为procedure)上进行处理。 因为所有的命令都是经过master来协调处理,所以在修复时也需要通过master进行修复。否则反而可能导致更严重的不一致问题。所以hbck-1

优秀的个人博客,低调大师

你可能没用过这个统计工具

CPS广告是一种按销售计费的新型广告模式,即按广告被点击之后实际销售产品的数量来收费的一种方式。用户每完成一次交易,网站主就会获得相应的佣金,它与CPA都是在一定程度上避免了广告主的风险,为广告主带来较大的利益。 但每个推广渠道所产生的效益,广告主往往难以精准把握,尤其在投放了大量渠道之后,整体统计每个渠道付费效果更加难以实现。这里就要使用openinstall,它能为海量小渠道提供精准的统计分析,支持 Android 和 iOS 平台,实现免分包、免填码、实时展示、防刷量、渠道效果分析等功能,实现多种统计需求。 下面详细介绍一下openinstall的具体功能: 一、渠道数据 首先登录openinstall官网https://www.openinstall.io/cpsChannel.html, 登录应用后台,可以查看渠道报表,报表能实时统计各种CPS付费效果,渠道编号、渠道名、CPS渠道效果点都由管理者自定义生成。此外,报表兼具独立渠道链接、生成独立报表、分享数据等操作,同时数据能实时更新、实时排重,精准度和防作弊方面也能得到保障。 二、免渠道分包 在openinstall的应用管理后台,仅需创建CPS渠道链接,推广时在渠道上分发相应CPS渠道链接即可,甚至允许批量创建,理论上允许创建无数个小渠道。这种渠道链接的统计形式,能大大缩减人工打包分包的繁琐流程,渠道包造成的统计误差和抓包现象也将得到解决。 三、渠道管理 创建渠道后,将自动生成相应的渠道二维码和推广链接,收集到的具体渠道数据可以到渠道报表中查看(参考上面第一张效果图),还可随时导出单独渠道包(包括Excel表格)。 四、添加自定义效果点 在效果点管理里,App结合自定义效果点上传付费效果点数据(如:付费、点击、订单等),可以在openinstall后台直接查看付费效果统计(参考上面第一张效果图),并导出相应渠道包。 有了如此详细的渠道报表,CPS渠道数据尽在掌握,用户付费效果和广告效果都能得到有效监控。此外,openinstall还能实现免填邀请码精准匹配邀请关系的功能,感兴趣的话可以登录官网了解最新动态。 openinstall官网:https://www.openinstall.io

资源下载

更多资源
Mario

Mario

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长,特征是大鼻子、头戴帽子、身穿背带裤,还留着胡子。与他的双胞胎兄弟路易基一起,长年担任任天堂的招牌角色。

腾讯云软件源

腾讯云软件源

为解决软件依赖安装时官方源访问速度慢的问题,腾讯云为一些软件搭建了缓存服务。您可以通过使用腾讯云软件源站来提升依赖包的安装速度。为了方便用户自由搭建服务架构,目前腾讯云软件源站支持公网访问和内网访问。

Rocky Linux

Rocky Linux

Rocky Linux(中文名:洛基)是由Gregory Kurtzer于2020年12月发起的企业级Linux发行版,作为CentOS稳定版停止维护后与RHEL(Red Hat Enterprise Linux)完全兼容的开源替代方案,由社区拥有并管理,支持x86_64、aarch64等架构。其通过重新编译RHEL源代码提供长期稳定性,采用模块化包装和SELinux安全架构,默认包含GNOME桌面环境及XFS文件系统,支持十年生命周期更新。

Sublime Text

Sublime Text

Sublime Text具有漂亮的用户界面和强大的功能,例如代码缩略图,Python的插件,代码段等。还可自定义键绑定,菜单和工具栏。Sublime Text 的主要功能包括:拼写检查,书签,完整的 Python API , Goto 功能,即时项目切换,多选择,多窗口等等。Sublime Text 是一个跨平台的编辑器,同时支持Windows、Linux、Mac OS X等操作系统。

用户登录
用户注册