首页 文章 精选 留言 我的

精选列表

搜索[工具模块],共10000篇文章
优秀的个人博客,低调大师

python人工智能机器人工具书籍: Python Robotics Projects - 2018

简介 利用Python的强大功能构建DIY机器人项目 主要特点•设计,构建和激发协作机器人•建立高端机器人项目,如定制的个人Jarvis•利用Python和ROS的强大功能进行DIY机器人项目 图书说明 机器人技术是一个快速发展的行业。多项调查表明,在过去的6年中,该领域的投资增加了十倍,到2020年将成为一个价值1000亿美元的部门。机器人在所有行业都很普遍,它们都将成为我们国内生活的一部分 。本书首先介绍配置机械手控制器的安装和基本步骤。然后,您将继续设置环境以将Python与机器人控制器一起使用。您将深入研究简单的机器人项目,例如宠物喂养机器人,以及更复杂的项目,例如机器学习启用的家庭自动化系统(Jarvis),基于视觉处理的机器人和使用Python的自驱动机器人车辆。 在本书的最后,您将了解如何使用Python构建智能机器人。 你会学

优秀的个人博客,低调大师

自然语言处理工具hanlp关键词提取图解TextRank算法

看一个博主(亚当-adam)的关于hanlp关键词提取算法TextRank的文章,还是非常好的一篇实操经验分享,分享一下给各位需要的朋友一起学习一下! TextRank是在Google的PageRank算法启发下,针对文本里的句子设计的权重算法,目标是自动摘要。它利用投票的原理,让每一个单词给它的邻居(术语称窗口)投赞成票,票的权重取决于自己的票数。这是一个“先有鸡还是先有蛋”的悖论,PageRank采用矩阵迭代收敛的方式解决了这个悖论。本博文通过hanlp关键词提取的一个Demo,并通过图解的方式来讲解TextRank的算法。 1//长句子 2String content = "程序员(英文Programmer)是从事程序开发、维护的专业人员。" + 3"一般将程序员分为程序设计人员和程序编码人员," + 4"但两者的界限并不非常清楚,特别是在中国。" + 5"软件从业人员分为初级程序员、高级程序员、系统" + 6"分析员和项目经理四大类。"; 最后提取的关键词是:[程序员, 程序, 分为, 人员, 软件] 下面来分析为什么会提取出这5个关键词 第一步:分词 把content 通过一个的分词算法进行分词,这里采用的是Viterbi算法也就是HMM算法。分词后(当然首先应把停用词、标点、副词之类的去除)的结果是: [程序员, 英文, Programmer, 从事, 程序, 开发, 维护, 专业, 人员, 程序员, 分为, 程序, 设计, 人员, 程序, 编码, 人员, 界限, 并不, 非常, 清楚, 特别是在, 中国, 软件, 从业人员, 分为, 程序员, 高级, 程序员, 系统分析员, 项目经理, 四大] 第二步:构造窗口 hanlp的实现代码如下: Map<String, Set<String>> words = new TreeMap<String, Set<String>>(); Queue<String> que = new LinkedList<String>(); for (String w : wordList) { if (!words.containsKey(w)) { words.put(w, new TreeSet<String>()); } // 复杂度O(n-1) if (que.size() >= 5) { que.poll(); } for (String qWord : que) { if (w.equals(qWord)) { continue; } //既然是邻居,那么关系是相互的,遍历一遍即可 words.get(w).add(qWord); words.get(qWord).add(w); } que.offer(w); } 这个代码的功能是为分个词构造窗口,这个词前后各四个词就是这个词的窗口,如词分词后一个词出现了多次,像[程序员],那就是把每次出现取一次窗口,然后把各次结果合并去重,最后结果是:程序员=[Programmer, 专业, 中国, 人员, 从业人员, 从事, 分为, 四大, 开发, 程序, 系统分析员, 维护, 英文, 设计, 软件, 项目经理, 高级]。最后形成的窗口: 1 Map<String, Set<String>> words = 2 3 {Programmer=[从事, 开发, 程序, 程序员, 维护, 英文], 专业=[人员, 从事, 分为, 开发, 程序, 程序员, 维护], 中国=[从业人员, 分为, 并不, 清楚, 特别是在, 程序员, 软件, 非常], 人员=[专业, 分为, 并不, 开发, 清楚, 界限, 程序, 程序员, 维护, 编码, 设计, 非常], 从业人员=[中国, 分为, 清楚, 特别是在, 程序员, 软件, 高级], 从事=[Programmer, 专业, 开发, 程序, 程序员, 维护, 英文], 分为=[专业, 中国, 人员, 从业人员, 特别是在, 程序, 程序员, 系统分析员, 维护, 设计, 软件, 高级], 四大=[程序员, 系统分析员, 项目经理, 高级], 并不=[中国, 人员, 清楚, 特别是在, 界限, 程序, 编码, 非常], 开发=[Programmer, 专业, 人员, 从事, 程序, 程序员, 维护, 英文], 清楚=[中国, 人员, 从业人员, 并不, 特别是在, 界限, 软件, 非常], 特别是在=[中国, 从业人员, 分为, 并不, 清楚, 界限, 软件, 非常], 界限=[人员, 并不, 清楚, 特别是在, 程序, 编码, 非常], 程序=[Programmer, 专业, 人员, 从事, 分为, 并不, 开发, 界限, 程序员, 维护, 编码, 英文, 设计], 程序员=[Programmer, 专业, 中国, 人员, 从业人员, 从事, 分为, 四大, 开发, 程序, 系统分析员, 维护, 英文, 设计, 软件, 项目经理, 高级], 系统分析员=[分为, 四大, 程序员, 项目经理, 高级], 维护=[Programmer, 专业, 人员, 从事, 分为, 开发, 程序, 程序员], 编码=[人员, 并不, 界限, 程序, 设计, 非常], 英文=[Programmer, 从事, 开发, 程序, 程序员], 设计=[人员, 分为, 程序, 程序员, 编码], 软件=[中国, 从业人员, 分为, 清楚, 特别是在, 程序员, 非常, 高级], 非常=[中国, 人员, 并不, 清楚, 特别是在, 界限, 编码, 软件], 项目经理=[四大, 程序员, 系统分析员, 高级], 高级=[从业人员, 分为, 四大, 程序员, 系统分析员, 软件, 项目经理]} 第三步:迭代投票 每个词最后的投票得分由这个词的窗口进行多次迭代投票决定,迭代的结束条件就是大于最大迭代次数这里是200次,或者两轮之前某个词的权重小于某一值这里是0.001f。看下代码: Map<String, Float> score = new HashMap<String, Float>(); //依据TF来设置初值 for (Map.Entry<String, Set<String>> entry : words.entrySet()){ score.put(entry.getKey(),sigMoid(entry.getValue().size())); } System.out.println(score); for (int i = 0; i < max_iter; ++i) { Map<String, Float> m = new HashMap<String, Float>(); float max_diff = 0; for (Map.Entry<String, Set<String>> entry : words.entrySet()) { String key = entry.getKey(); Set<String> value = entry.getValue(); m.put(key, 1 - d); for (String element : value) { int size = words.get(element).size(); if (key.equals(element) || size == 0) continue; m.put(key, m.get(key) + d / size * (score.get(element) == null ? 0 : score.get(element))); } max_diff = Math.max(max_diff, Math.abs(m.get(key) - (score.get(key) == null ? 0 : score.get(key)))); } score = m; if (max_diff <= min_diff) break; } System.out.println(score); return score; } 投票的原理拿Programmer=[从事, 开发, 程序, 程序员, 维护, 英文],这个词来说明,Programmer最后的得分是由[从事, 开发, 程序, 程序员, 维护, 英文],这6个词依次投票决定的,每个词投出去的分数是和他本身的权重相关的。 1、投票开始前每个词初始化了一个权重,score.put(entry.getKey(),sigMoid(entry.getValue().size())),这个权重是0到1之间,公式是 1 //value是每个词窗口的大小 2public static float sigMoid(float value) { 3return (float)(1d/(1d+Math.exp(-value))); 4} 这个函数的公式和图像如下,因为value一定是大于0的,所以sigMod值属于(0,1) 初始化后的分词是:{特别是在=0.99966466, 程序员=0.99999994, 编码=0.99752736, 四大=0.98201376, 英文=0.9933072, 非常=0.99966466, 界限=0.99908894, 系统分析员=0.9933072, 从业人员=0.99908894, 程序=0.99999774, 专业=0.99908894, 项目经理=0.98201376, 设计=0.9933072, 从事=0.99908894, Programmer=0.99752736, 软件=0.99966466, 人员=0.99999386, 清楚=0.99966466, 中国=0.99966466, 开发=0.99966466, 并不=0.99966466, 高级=0.99908894, 分为=0.99999386, 维护=0.99966466} 进行迭代投票,第一轮投票,[Programmer, 专业, 中国, 人员, 从业人员, 从事, 分为, 四大, 开发, 程序, 系统分析员, 维护, 英文, 设计, 软件, 项目经理, 高级]依给次*程序员*投票,得分如下: [Programmer]给[程序员]投票后,[]程序员]的得分: [专业]给[程序员]投票 这样[Programmer, 专业, 中国, 人员, 从业人员, 从事, 分为, 四大, 开发, 程序, 系统分析员, 维护, 英文, 设计, 软件, 项目经理, 高级]依次给[程序员]投票,投完票后,再给其它的词进行投票,本轮结束后,判断是否达到最大迭代次数200或两轮之间分数差值小于0.001,如果满足则结束,否则继续进行迭代。 最后的投票得分是:{特别是在=1.0015739, 程序员=2.0620303, 编码=0.78676623, 四大=0.6312981, 英文=0.6835063, 非常=1.0018439, 界限=0.88890904, 系统分析员=0.74232763, 从业人员=0.8993066, 程序=1.554001, 专业=0.88107216, 项目经理=0.6312981, 设计=0.6702926, 从事=0.9027207, Programmer=0.7930236, 软件=1.0078223, 人员=1.4288887, 清楚=0.9998723, 中国=0.99726284, 开发=1.0065585, 并不=0.9968608, 高级=0.9673803, 分为=1.4548829, 维护=0.9946941},分数最高的关键词就是要提取的关键词

优秀的个人博客,低调大师

自然语言处理工具hanlp自定义词汇添加图解

过程分析 1.添加新词需要确定无缓存文件,否则无法使用成功,因为词典会优先加载缓存文件 2.再确认缓存文件不在时,打开本地词典按照格式添加自定义词汇。 3.调用分词函数重新生成缓存文件,这时会报一个找不到缓存文件的异常,不用管,因为加载词典进入内存是会优先加载缓存,缓存不在当然会报异常,然后加载词典生成缓存文件,最后处理字符进行分词就会发现新添加的词汇可以进行分词了。 操作过程图解: 1、有缓存文件的情况下: 1 System.out.println(HanLP.segment("张三丰在一起我也不知道你好一个心眼儿啊,一半天欢迎使用HanLP汉语处理包!" +"接下来请从其他Demo中体验HanLP丰富的功能~")) 2 3 //首次编译运行时,HanLP会自动构建词典缓存,请稍候…… 4 //[张/q, 三丰/nz, 在/p, 一起/s, 我/rr, 也/d, 不/d, 知道/v, 你好/vl, 一个心眼儿/nz, 啊/y, ,/w, 一半天/nz, 欢迎/v, 使用/v, HanLP/nx, 汉语/gi, 处理/vn, 包/v, !/w, 接下来/vl, 请/v, 从/p, 其他/rzv, Demo/nx, 中/f, 体验/v, HanLP/nx, 丰富/a, 的/ude1, 功能/n, ~/nx] 5 6 1. 打开用户词典–添加 ‘张三丰在一起’ 为一个 nz词性的新词 2.2 原始缓存文件下运行–会发现不成功,没有把 ‘张三丰在一起’ 分词一个nz词汇 1 System.out.println(HanLP.segment("张三丰在一起我也不知道你好一个心眼儿啊,一半天欢迎使用HanLP汉语处理包!" +"接下来请从其他Demo中体验HanLP丰富的功能~")) 2 3 //首次编译运行时,HanLP会自动构建词典缓存,请稍候…… 4 //[张/q, 三丰/nz, 在/p, 一起/s, 我/rr, 也/d, 不/d, 知道/v, 你好/vl, 一个心眼儿/nz, 啊/y, ,/w, 一半天/nz, 欢迎/v, 使用/v, HanLP/nx, 汉语/gi, 处理/vn, 包/v, !/w, 接下来/vl, 请/v, 从/p, 其他/rzv, Demo/nx, 中/f, 体验/v, HanLP/nx, 丰富/a, 的/ude1, 功能/n, ~/nx] 5 3.1 删除缓存文件 bin 3.2 再次运行程序,此时会报错—无法找到缓存文件 1 System.out.println(HanLP.segment("张三丰在一起我也不知道你好一个心眼儿啊,一半天欢迎使用HanLP汉语处理包!" +"接下来请从其他Demo中体验HanLP丰富的功能~")); 2 3 /**首次编译运行时,HanLP会自动构建词典缓存,请稍候…… 4 十月 19, 2018 6:12:49 下午 com.hankcs.hanlp.corpus.io.IOUtil readBytes 5 WARNING: 读取D:/datacjy/hanlp/data/dictionary/custom/CustomDictionary.txt.bin时发生异常java.io.FileNotFoundException: D:\datacjy\hanlp\data\dictionary\custom\CustomDictionary.txt.bin (系统找不到指定的文件。) 找不到缓存文件 6 7 8 [张三丰在一起/nz, 我/rr, 也/d, 不/d, 知道/v, 你好/vl, 一个心眼儿/nz, 啊/y, ,/w, 一半天/nz, 欢迎/v, 使用/v, HanLP/nx, 汉语/gi, 处理/vn, 包/v, !/w, 接下来/vl, 请/v, 从/p, 其他/rzv, Demo/nx, 中/f, 体验/v, HanLP/nx, 丰富/a, 的/ude1, 功能/n, ~/nx] 9 10 */

优秀的个人博客,低调大师

技术篇-HBase 2.0 之修复工具 HBCK2 运维指南

概述 目前社区已经发布了 HBase 的 2.0 版本,很多公司都希望去尝试新版本上的新功 能,但是不得不面对的问题就是当集群出了问题应该如何解决。在之前的 HBase版本中,我们可以依赖 hbck 来帮助检查问题和修复问题,在新的版本上我们应 该如何去处理呢?HBASE-19121[1]给了我们答案——HBCK2。HBCK2 目前发布 了 1.0 版本,还在一直开发中,感兴趣的同学看看这个 issue 1. WHY HBCK2由于之前的 hbck(hbck-1)是会直接去向 region server 或者 hdfs 发送请求进行修 复,而在 HBase 2.0 版本上集群内部操作全部都被挪到了 procedure v2(下文都称 为 procedure)上进行处理。因为所有的命令都是经过 master 来协调处理,所以在修复时也需

优秀的个人博客,低调大师

HBase指南 | HBase 2.0之修复工具HBCK2运维指南

目前社区已经发布了HBase的2.0版本,很多公司都希望去尝试新版本上的新功能,但是不得不面对的问题就是当集群出了问题应该如何解决。 在之前的HBase版本中,我们可以依赖hbck来帮助检查问题和修复问题,在新的版本上我们应该如何去处理呢?HBASE-19121[1]给了我们答案——HBCK2。 HBCK2目前发布了1.0版本,还在一直开发中,感兴趣的同学看看这个issue。 由于之前的hbck(hbck-1)是会直接去向region server或者hdfs发送请求进行修复,而在HBase 2.0版本上集群内部操作全部都被挪到了procedure v2(下文都称为procedure)上进行处理。 因为所有的命令都是经过master来协调处理,所以在修复时也需要通过master进行修复。否则反而可能导致更严重的不一致问题。所以hbck-1

优秀的个人博客,低调大师

你可能没用过这个统计工具

CPS广告是一种按销售计费的新型广告模式,即按广告被点击之后实际销售产品的数量来收费的一种方式。用户每完成一次交易,网站主就会获得相应的佣金,它与CPA都是在一定程度上避免了广告主的风险,为广告主带来较大的利益。 但每个推广渠道所产生的效益,广告主往往难以精准把握,尤其在投放了大量渠道之后,整体统计每个渠道付费效果更加难以实现。这里就要使用openinstall,它能为海量小渠道提供精准的统计分析,支持 Android 和 iOS 平台,实现免分包、免填码、实时展示、防刷量、渠道效果分析等功能,实现多种统计需求。 下面详细介绍一下openinstall的具体功能: 一、渠道数据 首先登录openinstall官网https://www.openinstall.io/cpsChannel.html, 登录应用后台,可以查看渠道报表,报表能实时统计各种CPS付费效果,渠道编号、渠道名、CPS渠道效果点都由管理者自定义生成。此外,报表兼具独立渠道链接、生成独立报表、分享数据等操作,同时数据能实时更新、实时排重,精准度和防作弊方面也能得到保障。 二、免渠道分包 在openinstall的应用管理后台,仅需创建CPS渠道链接,推广时在渠道上分发相应CPS渠道链接即可,甚至允许批量创建,理论上允许创建无数个小渠道。这种渠道链接的统计形式,能大大缩减人工打包分包的繁琐流程,渠道包造成的统计误差和抓包现象也将得到解决。 三、渠道管理 创建渠道后,将自动生成相应的渠道二维码和推广链接,收集到的具体渠道数据可以到渠道报表中查看(参考上面第一张效果图),还可随时导出单独渠道包(包括Excel表格)。 四、添加自定义效果点 在效果点管理里,App结合自定义效果点上传付费效果点数据(如:付费、点击、订单等),可以在openinstall后台直接查看付费效果统计(参考上面第一张效果图),并导出相应渠道包。 有了如此详细的渠道报表,CPS渠道数据尽在掌握,用户付费效果和广告效果都能得到有效监控。此外,openinstall还能实现免填邀请码精准匹配邀请关系的功能,感兴趣的话可以登录官网了解最新动态。 openinstall官网:https://www.openinstall.io

优秀的个人博客,低调大师

【最佳实践】如何通过OSSimport工具将线下数据迁移至金融云OSS?

1. 当前存在的问题: 金融云由于等保要求,不能直接将闪电立方设备寄送到金融云机房。因此,我们还不能通过闪电立方的方式直接迁移数据至金融云OSS。但是金融云提供了另外一种类型的Bucket-金融云公网Bucket。金融云公网Bucket类似于公共云,能够被互联网直接访问。因此,是否可以借助于金融云公网OSS进行中转? 2.总体思路: 由于金融云内网只能在金融云内部访问。外部互联网无法访问。但是金融云公网Bucket类似于与公共云的OSS,允许VPC以及经典网络以及互联网访问。因此我们的思路是在金融云内部搭建1个ECS服务。该ECS服务是能够访问金融云内网Bucket,同时该ECS也是能够访问金融云公网OSS。注意:金融云的ECS可以直接访问互联网,但是互联网的end user是不能直接访问金融云内部ECS的。需要通过SLB中转。 此处我们

优秀的个人博客,低调大师

[雪峰磁针石博客]python工具库介绍-requests:人性化的HTTP

Requests是Python基于Apache2 Licensed许可证的人性化HTTP库。 Python标准库中urllib2提供了不少HTTP 功能,但API不系统。它有点过时,完成最简单的任务也需要大量工作。 下面我们用实例演示访问github。 >>> import requests >>> r = requests.get('https://api.github.com/user', auth=('ouyangchongwu@test.com', 'password')) >>> r.status_code 200 >>> r.headers['content-type'] 'application/json; charset=utf-8' >>> r.encoding 'utf-8' >>> r.text u'{"login":"oychw",...}' >>> r.json() {u'disk_usage': 176, u'private_gists': 0, ...} Requests为Python处理了所有HTTP/1.1操作, 与Web服务的无缝集成。不需要为URL手动添加查询字符串或POST数据进行表单处理。基于urllib3, 能自动处理Keep-alive和HTTP连接池。 特点: 国际化域名和 URLs Keep-Alive & 连接池 持久的 Cookie 会话 类浏览器的SSL认证 基本/摘要式的身份认证 优雅的键/值 Cookie 自动解压 Unicode响应体 多段文件上传 连接超时 支持 .netrc 适用于 Python 2.6—3.4 线程安全 用户手册 简介 Requests关注PEP 20的部分: Beautiful is better than ugly.(美丽优于丑陋) Explicit is better than implicit.(明确优于含糊) Simple is better than complex.(简单优于复杂) Complex is better than complicated.(复杂优于繁琐) Readability counts.(可读性) 安装 安装: 推荐:pip install requests,其次:easy_install requests 最新代码: git clone git://github.com/kennethreitz/requests.git 下载tar.gz包:curl -OL https://github.com/kennethreitz/requests/tarball/master 下载zip包:curl -OL https://github.com/kennethreitz/requests/zipball/master 源码安装:python setup.py install 快速入门 发送请求: 下面获取Github的公共时间线,并在httpbin演示其他HTTP操作: >>> import requests >>> r = requests.get('https://github.com/timeline.json') >>> r = requests.post("http://httpbin.org/post") >>> r = requests.put("http://httpbin.org/put") >>> r = requests.delete("http://httpbin.org/delete") >>> r = requests.head("http://httpbin.org/get") >>> r = requests.options("http://httpbin.org/get") 在URL中传递参数 URL的查询字符串(query string)例如, httpbin.org/get?key=val,在Requests可以用字典的形式构建。比如传递key1=value1和key2=value2到 httpbin.org/get: >>> import requests >>> payload = {'key1': 'value1', 'key2': 'value2'} >>> r = requests.get("http://httpbin.org/get", params=payload) >>> print(r.url) http://httpbin.org/get?key2=value2&key1=value1 >>> payload = {'key1': 'value1', 'key2[]': ['value2', 'value3']} >>> r = requests.get("http://httpbin.org/get", params=payload) >>> print(r.url) http://httpbin.org/get?key1=value1&key2%5B%5D=value2&key2%5B%5D=value3 注意字典里值为None的键会忽略。上面第2个例子访问的是http://httpbin.org/get?key1=value1&key2[]=value2&key2[]=value3 。注意key后面需要添加中括号对。 响应 >>> import requests >>> r = requests.get('https://api.github.com/events') >>> r.text >>> u'[{"id":"2636319727","type":"PullRequestReviewCommentEvent","actor":{"id":1148601,"login":"i ...}] >>> r.encoding 'utf-8' >>> r.encoding = 'ISO-8859-1' Requests会自动解码服务器的返回。大多数unicode字符集都能无缝解码。请求发出时Requests会基于响应的HTTP头部推测响应的编码。同时还可以设置和查询编码。改变编码后,访问 r.text 将会使用 r.encoding 。 二进制响应 r.content可以以字节的方式显示响应。 >>> r.content b'[{"repository":{"open_issues":0,"url":"https://github.com/... 传输格式gzip和deflate会自动转码。处理图片实例: >>> from PIL import Image >>> from StringIO import StringIO >>> i = Image.open(StringIO(r.content)) Json响应 Requests内置了JSON解码器: >>> import requests >>> r = requests.get('https://github.com/timeline.json') >>> r.json() {u'documentation_url': u'https://developer.github.com/v3/activity/events/#list-public-events', u'message': u"Hello there, wayfaring stranger. If you're reading this then you probably didn't see our blog post a couple of years back announcing that this API would go away: http://git.io/17AROg Fear not, you should be able to get what you need from the shiny new Events API instead."} JSON解码失败时r.json 就会抛出异常。例如, 401 (Unauthorized) , ValueError: No JSON object could be decoded等。 原始响应 极端的情况下需要查看服务器的原始套接字响应,请求时设置 stream=True: >>> import requests >>> r = requests.get('https://api.github.com/events', stream=True) >>> r.raw <urllib3.response.HTTPResponse object at 0x7f807dd6f4d0> >>> r.raw.read(10) '\x1f\x8b\x08\x00\x00\x00\x00\x00\x00\x03' 通常需要存为文件: with open(filename, 'wb') as fd: for chunk in r.iter_content(chunk_size): fd.write(chunk) Response.iter_content 能减少直接使用Response.raw的大量处理,下载流时尤其推荐。 自定义头 >>> import requests >>> import json >>> url = 'https://api.github.com/some/endpoint' >>> payload = {'some': 'data'} >>> headers = {'content-type': 'application/json'} >>> r = requests.post(url, data=json.dumps(payload), headers=headers) 更加复杂的POST请求 表单直接以字典形式发送: >>> import requests >>> payload = {'key1': 'value1', 'key2': 'value2'} >>> r = requests.post("http://httpbin.org/post", data=payload) >>> print(r.text) { "args": {}, "data": "", "files": {}, "form": { "key1": "value1", "key2": "value2" }, "headers": { "Accept": "*/*", "Accept-Encoding": "gzip, deflate, compress", "Content-Length": "23", "Content-Type": "application/x-www-form-urlencoded", "Host": "httpbin.org", "User-Agent": "python-requests/2.2.1 CPython/2.7.6 Linux/3.13.0-53-generic" }, "json": null, "origin": "119.122.150.177", "url": "http://httpbin.org/post" } string则会被直接发布出去。Github API v3中接受编码为JSON的POST/PATCH数据 >>> import requests >>> import json >>> url = 'https://api.github.com/some/endpoint' >>> payload = {'some': 'data'} >>> r = requests.post(url, data=json.dumps(payload)) POST复杂编码的文件 >>> import requests >>> url = 'http://httpbin.org/post' >>> files = {'file': open('/home/andrew/test.xls', 'rb')} >>> r = requests.post(url, files=files) >>> url = 'http://httpbin.org/post' >>> r.text u'{\n "args": {}, \n "data": "", \n "files": {\n ... "url": "http://httpbin.org/post"\n}\n' 可以显式地设置文件名,文件类型和请求头: >>> import requests >>> files = {'file': ('report.xls', open('/home/andrew/test.xls', 'rb'), 'application/vnd.ms-excel', {'Expires': '0'})} >>> url = 'http://httpbin.org/post' >>> r = requests.post(url, files=files) >>> r.text u'{\n "args": {}, \n "data": ""..."url": "http://httpbin.org/post"\n}\n' 还可以直接用文字代替文件: >>> import requests >>> url = 'http://httpbin.org/post' >>> files = {'file': ('report.csv', 'some,data,to,send\nanother,row,to,send\n')} >>> r = requests.post(url, files=files) >>> r.text u'{\n "args": {}, \n "data": "", \n "files": {\n ... "json": null, \n "origin": "14.153.22.104", \n "url": "http://httpbin.org/post"\n}\n' multipart/form-data不支持特别大的文件,建议使用requests-toolbelt,参考:toolbelt 响应状态码 >>> import requests >>> r = requests.get('http://httpbin.org/get') >>> r.status_code 200 >>> r.status_code == requests.codes.ok True >>> bad_r = requests.get('http://httpbin.org/status/404') >>> bad_r.status_code 404 >>> bad_r.raise_for_status() >>> r.raise_for_status() 上面的requests.codes.ok是内置的状态码查询对象。可以使用 Response.raise_for_status()跑出失败请求(4XX客户端错误或5XX服务器异常),我们可以通过 Response.raise_for_status() 来抛出异常。r的返回为200,所以返回None,不产生异常。 响应头 >>> r.headers {'content-length': '275', 'server': 'nginx', 'connection': 'keep-alive', 'access-control-allow-credentials': 'true', 'date': 'Tue, 10 Mar 2015 08:21:36 GMT', 'access-control-allow-origin': '*', 'content-type': 'application/json'} >>> r.headers['Content-Type'] 'application/json' >>> r.headers.get('content-type') 'application/json' 根据 RFC 2616,HTTP头部不区分大小写。根据RFC 7230,接收方会对服务端对同一key的不同value进行组合。 Cookies 可以访问响应中包含的Cookie: >>> import requests >>> url = 'http://automationtesting.sinaapp.com/login' >>> r = requests.get(url) >>> r.cookies.keys() ['saeut', 'trac_form_token', 'trac_session'] >>> r.cookies['saeut'] 'CkMPGlT+tfQiXS9uGYviAg==' 使用cookies参数可以发送你的cookies到服务器: >>> import requests >>> url = 'http://httpbin.org/cookies' >>> cookies = dict(cookies_are='working') >>> r = requests.get(url, cookies=cookies) >>> r.text u'{\n "cookies": {\n "cookies_are": "working"\n }\n}\n' 重定向与请求历史 默认对HEAD以外其他所有动作进行位置重定向。Response.history可以看到重定向的记录。 >>> import requests >>> r = requests.get('http://github.com') >>> r.url u'https://github.com/' >>> r.status_code 200 >>> r.history [<Response [301]>] GET, OPTIONS, POST, PUT, PATCH 或者 DELETE可以通过allow_redirects参数禁用重定向,这个设置对HEAD也生效: >>> import requests >>> r = requests.get('http://github.com', allow_redirects=False) >>> r.status_code 301 >>> r.history [] >>> r = requests.head('http://github.com', allow_redirects=True) >>> r.url u'https://github.com/' >>> r.history [<Response [301]>] 超时 超时告诉requests在经过timeout参数的秒之后停止等待响应: >>> import requests >>> requests.get('http://github.com', timeout=0.1) Traceback (most recent call last): File "<stdin>", line 1, in <module> File "/usr/lib/python2.7/dist-packages/requests/api.py", line 55, in get return request('get', url, **kwargs) File "/usr/lib/python2.7/dist-packages/requests/api.py", line 44, in request return session.request(method=method, url=url, **kwargs) File "/usr/lib/python2.7/dist-packages/requests/sessions.py", line 455, in request resp = self.send(prep, **send_kwargs) File "/usr/lib/python2.7/dist-packages/requests/sessions.py", line 558, in send r = adapter.send(request, **kwargs) File "/usr/lib/python2.7/dist-packages/requests/adapters.py", line 387, in send raise Timeout(e) requests.exceptions.Timeout: (<urllib3.connectionpool.HTTPConnectionPool object at 0x7f807dd6f050>, 'Connection to github.com timed out. (connect timeout=0.1)') >>> 注: 超时不是对整个响应下载的时间限制, 而且指定时间没有收到服务器返回就抛出异常。 错误与异常 ConnectionError:网络问题(如DNS失败、拒绝连接等)。 HTTPError: 比较罕见的无效HTTP响应时。 Timeout:请求超时。 TooManyRedirects:超过了设定的最大重定向次数。 requests.exceptions.RequestException是所有具体异常的基类。 高级用法 Session对象 Session对象能够跨请求保持参数,Session实例发出的所有请求共享cookies。 Session对象具有主Requests API的所有方法。 >>> s = requests.Session() >>> s.get('http://httpbin.org/cookies/set/sessioncookie/123456789') <Response [200]> >>> r = s.get("http://httpbin.org/cookies") >>> print(r.text) { "cookies": { "sessioncookie": "123456789" } } Session也可为request方法提供缺省数据,添加属性即可: >>> import requests >>> s = requests.Session() >>> s.auth = ('user', 'pass') >>> s.headers.update({'x-test': 'true'}) >>> s.get('http://httpbin.org/headers', headers={'x-test2': 'true'}) <Response [200]> 传递给request方法的字典都会与已有session层的值合并。方法层的参数会覆盖会话的参数。在方法层参数中将键值设置为None,会被自动忽略key。参考: session api 请求(Request)和响应(Response)对象 requests.get()等请求主要做两件的事情。一为构建Request 对象。二为收到服务器响应时产生Response 对象。Response对象包含服务器返回和原来的 Request 对象。 >>> import requests >>> r = requests.get('http://en.wikipedia.org/wiki/Monty_Python') >>> r.headers {'content-length': '67559', ...} >>> r.request.headers {'Connection': 'keep-alive', 'Accept-Encoding': ...} 预请求 当从API或会话调用接收Response对象时,request属性实际上是PreparedRequest。如果你需要修改body或header,可以如下方式进行处理: from requests import Request, Session s = Session() req = Request('GET', url, data=data, headers=header ) prepped = req.prepare() # do something with prepped.body # do something with prepped.headers resp = s.send(prepped, stream=stream, verify=verify, proxies=proxies, cert=cert, timeout=timeout ) print(resp.status_code) 这里没有对Request对象进行特殊处理,而是修改PreparedRequest对象。然后用requests.* 或Session.*.发送。 上述代码没有Request Session。Session层状态,如cookie不会使用。用Session.prepare_request()替换Request.prepare()即可增加状态支持: from requests import Request, Session s = Session() req = Request('GET', url, data=data headers=headers ) prepped = s.prepare_request(req) # do something with prepped.body # do something with prepped.headers resp = s.send(prepped, stream=stream, verify=verify, proxies=proxies, cert=cert, timeout=timeout ) print(resp.status_code) SSL证书验证 使用 verify 参数可以像web浏览器一样为HTTPS请求验证SSL证书: 参考资料 讨论qq群144081101 591302926 567351477 钉钉群21745728 requests英文文档 requests-docs-cn.readthedocs.org docs.python-requests.org/en/latest/ HTTP相关python库 本文最新版本地址 本文涉及的python测试开发库 谢谢点赞! 本文相关海量书籍下载

优秀的个人博客,低调大师

使用工具Source Monitor测量您Java代码的环复杂度

代码的环复杂度(Cyclomatic complexity,有时也翻译成圈复杂度)是一种代码复杂度的衡量标准,在1976年由Thomas J. McCabe, Sr. 提出。 来看看计算公式。 代码环复杂度 = E − N + 2 E = 程序控制流图中边的个数 N = 程序控制流图中点的个数 很容易得出这样的结论:代码环复杂度越高,越容易出bug。 可以想象如果需要开发人员自己去把一段代码的控制流图画出来,然后去数图中边和点的个数,这种做法效率太低了也容易出错。 好消息是,有一款名为Source Monitor的免费软件,能够帮我们来度量Java代码的环复杂度。当然这款软件也支持C++和C#。 为了说明如何使用这款软件,我写了一段简单的Java代码。 package test; import java.util.ArrayList; public class monthTool { static ArrayList<String> monthCollection = new ArrayList<String>(); public static void main(String[] args) { monthTool tool = new monthTool(); tool.printV1(1); tool.printV2(2); tool.printV1(0); tool.printV2(-1); tool.printV3(3); tool.printV3(13); } public monthTool(){ monthCollection.add("Invalid"); monthCollection.add("January"); monthCollection.add("Febrary"); monthCollection.add("March"); monthCollection.add("April"); monthCollection.add("May"); monthCollection.add("June"); monthCollection.add("July"); monthCollection.add("August"); monthCollection.add("September"); monthCollection.add("October"); monthCollection.add("November"); monthCollection.add("December"); } public void printV1(int month){ System.out.println("Month is: " + getMonthNameV1(month)); } public void printV2(int month){ if( month >= 1 && month <= 12) System.out.println("Month is: " + getMonthNameV2(month)); else System.out.println("Please specify a valid month"); } public void printV3(int month) { System.out.println("Month is: " + getMonthNameV3(month)); } public String getMonthNameV2(int month){ if( month == 1) return "January"; else if( month == 2) return "Febrary"; else if( month == 3) return "March"; else if( month == 4) return "April"; else if( month == 5) return "May"; else if( month == 6) return "June"; else if( month == 7) return "July"; else if( month == 8) return "August"; else if( month == 9) return "September"; else if( month == 10) return "October"; else if( month == 11) return "November"; else if( month == 12) return "December"; else return "Invalid"; } public String getMonthNameV1(int month){ switch (month){ case 1: return "January"; case 2: return "Febrary"; case 3: return "March"; case 4: return "April"; case 5: return "May"; case 6: return "June"; case 7: return "July"; case 8: return "August"; case 9: return "September"; case 10: return "October"; case 11: return "November"; case 12: return "December"; default: return "Invalid"; } } public String getMonthNameV3(int month){ try { return monthCollection.get(month); } catch (java.lang.IndexOutOfBoundsException e){ return "Invalid"; } } } 其中我用了三种不同的方式实现了同一个逻辑,将一个代表月份的整数转成了月份名称。 下面是Source Monitor的具体用法。 1. 创建一个新的项目: 这里能看到所有Source Monitor支持的编程语言。 2. 指定您本地的Java项目文件地址: 3. 指定您的Java项目文件夹内,您希望SourceMonitor计算哪些Java文件的环复杂度。 4. 点OK,就可以开始扫描啦。 很快Source Monitor就将我们指定的Java文件的环复杂度计算完毕。点击菜单“Display Method Metrics”来查看结果: 从环复杂度扫描结果能看出,明显第三种从月份名称集合里通过ArrayList自带的get方法取得月份名称是最优的解法——环复杂度仅为2。 也可以通过图表的方式更直观得看到方法的环复杂度比较: X轴的值代表每个方法的环复杂度,Y轴代表这些环复杂度的不同值出现的次数。 比如下图的意思是,环复杂度为1的方法(X轴刻度为1的节点)共有4个(Y轴刻度为4),环复杂度为2的方法(X轴刻度为2的节点)有1个(Y轴刻度为1)。以此类推。 要获取更多Jerry的原创技术文章,请关注公众号"汪子熙"或者扫描下面二维码:

资源下载

更多资源
Mario

Mario

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长,特征是大鼻子、头戴帽子、身穿背带裤,还留着胡子。与他的双胞胎兄弟路易基一起,长年担任任天堂的招牌角色。

Nacos

Nacos

Nacos /nɑ:kəʊs/ 是 Dynamic Naming and Configuration Service 的首字母简称,一个易于构建 AI Agent 应用的动态服务发现、配置管理和AI智能体管理平台。Nacos 致力于帮助您发现、配置和管理微服务及AI智能体应用。Nacos 提供了一组简单易用的特性集,帮助您快速实现动态服务发现、服务配置、服务元数据、流量管理。Nacos 帮助您更敏捷和容易地构建、交付和管理微服务平台。

Spring

Spring

Spring框架(Spring Framework)是由Rod Johnson于2002年提出的开源Java企业级应用框架,旨在通过使用JavaBean替代传统EJB实现方式降低企业级编程开发的复杂性。该框架基于简单性、可测试性和松耦合性设计理念,提供核心容器、应用上下文、数据访问集成等模块,支持整合Hibernate、Struts等第三方框架,其适用范围不仅限于服务器端开发,绝大多数Java应用均可从中受益。

WebStorm

WebStorm

WebStorm 是jetbrains公司旗下一款JavaScript 开发工具。目前已经被广大中国JS开发者誉为“Web前端开发神器”、“最强大的HTML5编辑器”、“最智能的JavaScript IDE”等。与IntelliJ IDEA同源,继承了IntelliJ IDEA强大的JS部分的功能。

用户登录
用户注册