搜索[工具模块]结果-低调大师优秀个人博客

精选列表

搜索[工具模块]，共10000篇文章

python人工智能机器人工具书籍: Python Robotics Projects - 2018

简介利用Python的强大功能构建DIY机器人项目主要特点•设计，构建和激发协作机器人•建立高端机器人项目，如定制的个人Jarvis•利用Python和ROS的强大功能进行DIY机器人项目图书说明机器人技术是一个快速发展的行业。多项调查表明，在过去的6年中，该领域的投资增加了十倍，到2020年将成为一个价值1000亿美元的部门。机器人在所有行业都很普遍，它们都将成为我们国内生活的一部分。本书首先介绍配置机械手控制器的安装和基本步骤。然后，您将继续设置环境以将Python与机器人控制器一起使用。您将深入研究简单的机器人项目，例如宠物喂养机器人，以及更复杂的项目，例如机器学习启用的家庭自动化系统（Jarvis），基于视觉处理的机器人和使用Python的自驱动机器人车辆。在本书的最后，您将了解如何使用Python构建智能机器人。你会学

2019-02-24

自然语言处理工具hanlp关键词提取图解TextRank算法

看一个博主（亚当-adam）的关于hanlp关键词提取算法TextRank的文章，还是非常好的一篇实操经验分享，分享一下给各位需要的朋友一起学习一下！ TextRank是在Google的PageRank算法启发下，针对文本里的句子设计的权重算法，目标是自动摘要。它利用投票的原理，让每一个单词给它的邻居（术语称窗口）投赞成票，票的权重取决于自己的票数。这是一个“先有鸡还是先有蛋”的悖论，PageRank采用矩阵迭代收敛的方式解决了这个悖论。本博文通过hanlp关键词提取的一个Demo，并通过图解的方式来讲解TextRank的算法。 1//长句子 2String content = "程序员(英文Programmer)是从事程序开发、维护的专业人员。" + 3"一般将程序员分为程序设计人员和程序编码人员，" + 4"但两者的界限并不非常清楚，特别是在中国。" + 5"软件从业人员分为初级程序员、高级程序员、系统" + 6"分析员和项目经理四大类。"; 最后提取的关键词是：[程序员, 程序, 分为, 人员, 软件] 下面来分析为什么会提取出这５个关键词第一步：分词把content 通过一个的分词算法进行分词，这里采用的是Viterbi算法也就是HMM算法。分词后（当然首先应把停用词、标点、副词之类的去除）的结果是： [程序员, 英文, Programmer, 从事, 程序, 开发, 维护, 专业, 人员, 程序员, 分为, 程序, 设计, 人员, 程序, 编码, 人员, 界限, 并不, 非常, 清楚, 特别是在, 中国, 软件, 从业人员, 分为, 程序员, 高级, 程序员, 系统分析员, 项目经理, 四大] 第二步：构造窗口 hanlp的实现代码如下： Map<String, Set<String>> words = new TreeMap<String, Set<String>>(); Queue<String> que = new LinkedList<String>(); for (String w : wordList) { if (!words.containsKey(w)) { words.put(w, new TreeSet<String>()); } // 复杂度O(n-1) if (que.size() >= 5) { que.poll(); } for (String qWord : que) { if (w.equals(qWord)) { continue; } //既然是邻居,那么关系是相互的,遍历一遍即可 words.get(w).add(qWord); words.get(qWord).add(w); } que.offer(w); } 这个代码的功能是为分个词构造窗口，这个词前后各四个词就是这个词的窗口，如词分词后一个词出现了多次，像[程序员]，那就是把每次出现取一次窗口，然后把各次结果合并去重，最后结果是：程序员=[Programmer, 专业, 中国, 人员, 从业人员, 从事, 分为, 四大, 开发, 程序, 系统分析员, 维护, 英文, 设计, 软件, 项目经理, 高级]。最后形成的窗口： 1 Map<String, Set<String>> words = 2 3 {Programmer=[从事, 开发, 程序, 程序员, 维护, 英文], 专业=[人员, 从事, 分为, 开发, 程序, 程序员, 维护], 中国=[从业人员, 分为, 并不, 清楚, 特别是在, 程序员, 软件, 非常], 人员=[专业, 分为, 并不, 开发, 清楚, 界限, 程序, 程序员, 维护, 编码, 设计, 非常], 从业人员=[中国, 分为, 清楚, 特别是在, 程序员, 软件, 高级], 从事=[Programmer, 专业, 开发, 程序, 程序员, 维护, 英文], 分为=[专业, 中国, 人员, 从业人员, 特别是在, 程序, 程序员, 系统分析员, 维护, 设计, 软件, 高级], 四大=[程序员, 系统分析员, 项目经理, 高级], 并不=[中国, 人员, 清楚, 特别是在, 界限, 程序, 编码, 非常], 开发=[Programmer, 专业, 人员, 从事, 程序, 程序员, 维护, 英文], 清楚=[中国, 人员, 从业人员, 并不, 特别是在, 界限, 软件, 非常], 特别是在=[中国, 从业人员, 分为, 并不, 清楚, 界限, 软件, 非常], 界限=[人员, 并不, 清楚, 特别是在, 程序, 编码, 非常], 程序=[Programmer, 专业, 人员, 从事, 分为, 并不, 开发, 界限, 程序员, 维护, 编码, 英文, 设计], 程序员=[Programmer, 专业, 中国, 人员, 从业人员, 从事, 分为, 四大, 开发, 程序, 系统分析员, 维护, 英文, 设计, 软件, 项目经理, 高级], 系统分析员=[分为, 四大, 程序员, 项目经理, 高级], 维护=[Programmer, 专业, 人员, 从事, 分为, 开发, 程序, 程序员], 编码=[人员, 并不, 界限, 程序, 设计, 非常], 英文=[Programmer, 从事, 开发, 程序, 程序员], 设计=[人员, 分为, 程序, 程序员, 编码], 软件=[中国, 从业人员, 分为, 清楚, 特别是在, 程序员, 非常, 高级], 非常=[中国, 人员, 并不, 清楚, 特别是在, 界限, 编码, 软件], 项目经理=[四大, 程序员, 系统分析员, 高级], 高级=[从业人员, 分为, 四大, 程序员, 系统分析员, 软件, 项目经理]} 第三步：迭代投票每个词最后的投票得分由这个词的窗口进行多次迭代投票决定，迭代的结束条件就是大于最大迭代次数这里是200次，或者两轮之前某个词的权重小于某一值这里是0.001f。看下代码： Map<String, Float> score = new HashMap<String, Float>(); //依据TF来设置初值 for (Map.Entry<String, Set<String>> entry : words.entrySet()){ score.put(entry.getKey(),sigMoid(entry.getValue().size())); } System.out.println(score); for (int i = 0; i < max_iter; ++i) { Map<String, Float> m = new HashMap<String, Float>(); float max_diff = 0; for (Map.Entry<String, Set<String>> entry : words.entrySet()) { String key = entry.getKey(); Set<String> value = entry.getValue(); m.put(key, 1 - d); for (String element : value) { int size = words.get(element).size(); if (key.equals(element) || size == 0) continue; m.put(key, m.get(key) + d / size * (score.get(element) == null ? 0 : score.get(element))); } max_diff = Math.max(max_diff, Math.abs(m.get(key) - (score.get(key) == null ? 0 : score.get(key)))); } score = m; if (max_diff <= min_diff) break; } System.out.println(score); return score; } 投票的原理拿Programmer=[从事, 开发, 程序, 程序员, 维护, 英文]，这个词来说明，Programmer最后的得分是由[从事, 开发, 程序, 程序员, 维护, 英文]，这６个词依次投票决定的，每个词投出去的分数是和他本身的权重相关的。１、投票开始前每个词初始化了一个权重，score.put(entry.getKey(),sigMoid(entry.getValue().size()))，这个权重是0到１之间，公式是 1 //value是每个词窗口的大小 2public static float sigMoid(float value) { 3return (float)(1d/(1d+Math.exp(-value))); 4} 这个函数的公式和图像如下,因为value一定是大于０的，所以sigMod值属于(0,1) 初始化后的分词是：{特别是在=0.99966466, 程序员=0.99999994, 编码=0.99752736, 四大=0.98201376, 英文=0.9933072, 非常=0.99966466, 界限=0.99908894, 系统分析员=0.9933072, 从业人员=0.99908894, 程序=0.99999774, 专业=0.99908894, 项目经理=0.98201376, 设计=0.9933072, 从事=0.99908894, Programmer=0.99752736, 软件=0.99966466, 人员=0.99999386, 清楚=0.99966466, 中国=0.99966466, 开发=0.99966466, 并不=0.99966466, 高级=0.99908894, 分为=0.99999386, 维护=0.99966466} 进行迭代投票，第一轮投票，[Programmer, 专业, 中国, 人员, 从业人员, 从事, 分为, 四大, 开发, 程序, 系统分析员, 维护, 英文, 设计, 软件, 项目经理, 高级]依给次*程序员*投票，得分如下： [Programmer]给[程序员]投票后，[]程序员]的得分: [专业]给[程序员]投票这样[Programmer, 专业, 中国, 人员, 从业人员, 从事, 分为, 四大, 开发, 程序, 系统分析员, 维护, 英文, 设计, 软件, 项目经理, 高级]依次给[程序员]投票，投完票后，再给其它的词进行投票，本轮结束后，判断是否达到最大迭代次数200或两轮之间分数差值小于0.001，如果满足则结束，否则继续进行迭代。最后的投票得分是：{特别是在=1.0015739, 程序员=2.0620303, 编码=0.78676623, 四大=0.6312981, 英文=0.6835063, 非常=1.0018439, 界限=0.88890904, 系统分析员=0.74232763, 从业人员=0.8993066, 程序=1.554001, 专业=0.88107216, 项目经理=0.6312981, 设计=0.6702926, 从事=0.9027207, Programmer=0.7930236, 软件=1.0078223, 人员=1.4288887, 清楚=0.9998723, 中国=0.99726284, 开发=1.0065585, 并不=0.9968608, 高级=0.9673803, 分为=1.4548829, 维护=0.9946941}，分数最高的关键词就是要提取的关键词

2019-02-19

中文自然语言处理工具HanLP源码包的下载使用记录

解压以后，里面有一个hanlp.properties文件将这个文件分别拷贝到解压以后的源代码target/classes和target-classes目录下最后用ide打开源代码，我使用的ide工具是

2019-02-14

[python作业AI毕业设计博客]selenium工具python快速入门１简介

它是一组软件工具，每种工具都有不同的方法来支持测试自动化。 Selenium3.

2019-02-12

自然语言处理工具hanlp自定义词汇添加图解

过程分析 1.添加新词需要确定无缓存文件，否则无法使用成功，因为词典会优先加载缓存文件 2.再确认缓存文件不在时，打开本地词典按照格式添加自定义词汇。 3.调用分词函数重新生成缓存文件，这时会报一个找不到缓存文件的异常，不用管，因为加载词典进入内存是会优先加载缓存，缓存不在当然会报异常，然后加载词典生成缓存文件，最后处理字符进行分词就会发现新添加的词汇可以进行分词了。操作过程图解： 1、有缓存文件的情况下: 1 System.out.println(HanLP.segment("张三丰在一起我也不知道你好一个心眼儿啊，一半天欢迎使用HanLP汉语处理包！" +"接下来请从其他Demo中体验HanLP丰富的功能~")) 2 3 //首次编译运行时，HanLP会自动构建词典缓存，请稍候…… 4 //[张/q, 三丰/nz, 在/p, 一起/s, 我/rr, 也/d, 不/d, 知道/v, 你好/vl, 一个心眼儿/nz, 啊/y, ，/w, 一半天/nz, 欢迎/v, 使用/v, HanLP/nx, 汉语/gi, 处理/vn, 包/v, ！/w, 接下来/vl, 请/v, 从/p, 其他/rzv, Demo/nx, 中/f, 体验/v, HanLP/nx, 丰富/a, 的/ude1, 功能/n, ~/nx] 5 6 1.Â 打开用户词典–添加 ‘张三丰在一起’ 为一个 nz词性的新词 2.2 原始缓存文件下运行–会发现不成功，没有把 ‘张三丰在一起’ 分词一个nz词汇 1 System.out.println(HanLP.segment("张三丰在一起我也不知道你好一个心眼儿啊，一半天欢迎使用HanLP汉语处理包！" +"接下来请从其他Demo中体验HanLP丰富的功能~")) 2 3 //首次编译运行时，HanLP会自动构建词典缓存，请稍候…… 4 //[张/q, 三丰/nz, 在/p, 一起/s, 我/rr, 也/d, 不/d, 知道/v, 你好/vl, 一个心眼儿/nz, 啊/y, ，/w, 一半天/nz, 欢迎/v, 使用/v, HanLP/nx, 汉语/gi, 处理/vn, 包/v, ！/w, 接下来/vl, 请/v, 从/p, 其他/rzv, Demo/nx, 中/f, 体验/v, HanLP/nx, 丰富/a, 的/ude1, 功能/n, ~/nx] 5 3.1 删除缓存文件 bin 3.2 再次运行程序，此时会报错—无法找到缓存文件 1 System.out.println(HanLP.segment("张三丰在一起我也不知道你好一个心眼儿啊，一半天欢迎使用HanLP汉语处理包！" +"接下来请从其他Demo中体验HanLP丰富的功能~")); 2 3 /**首次编译运行时，HanLP会自动构建词典缓存，请稍候…… 4 十月 19, 2018 6:12:49 下午 com.hankcs.hanlp.corpus.io.IOUtil readBytes 5 WARNING: 读取D:/datacjy/hanlp/data/dictionary/custom/CustomDictionary.txt.bin时发生异常java.io.FileNotFoundException: D:\datacjy\hanlp\data\dictionary\custom\CustomDictionary.txt.bin (系统找不到指定的文件。) 找不到缓存文件 6 7 8 [张三丰在一起/nz, 我/rr, 也/d, 不/d, 知道/v, 你好/vl, 一个心眼儿/nz, 啊/y, ，/w, 一半天/nz, 欢迎/v, 使用/v, HanLP/nx, 汉语/gi, 处理/vn, 包/v, ！/w, 接下来/vl, 请/v, 从/p, 其他/rzv, Demo/nx, 中/f, 体验/v, HanLP/nx, 丰富/a, 的/ude1, 功能/n, ~/nx] 9 10 */

2019-01-26

技术篇-HBase 2.0 之修复工具 HBCK2 运维指南

概述目前社区已经发布了 HBase 的 2.0 版本，很多公司都希望去尝试新版本上的新功能，但是不得不面对的问题就是当集群出了问题应该如何解决。在之前的 HBase版本中，我们可以依赖 hbck 来帮助检查问题和修复问题，在新的版本上我们应该如何去处理呢?HBASE-19121[1]给了我们答案——HBCK2。HBCK2 目前发布了 1.0 版本，还在一直开发中，感兴趣的同学看看这个 issue 1. WHY HBCK2由于之前的 hbck(hbck-1)是会直接去向 region server 或者 hdfs 发送请求进行修复，而在 HBase 2.0 版本上集群内部操作全部都被挪到了 procedure v2(下文都称为 procedure)上进行处理。因为所有的命令都是经过 master 来协调处理，所以在修复时也需

2019-01-10

HBase指南 | HBase 2.0之修复工具HBCK2运维指南

目前社区已经发布了HBase的2.0版本，很多公司都希望去尝试新版本上的新功能，但是不得不面对的问题就是当集群出了问题应该如何解决。在之前的HBase版本中，我们可以依赖hbck来帮助检查问题和修复问题，在新的版本上我们应该如何去处理呢？HBASE-19121[1]给了我们答案——HBCK2。 HBCK2目前发布了1.0版本，还在一直开发中，感兴趣的同学看看这个issue。由于之前的hbck(hbck-1)是会直接去向region server或者hdfs发送请求进行修复，而在HBase 2.0版本上集群内部操作全部都被挪到了procedure v2(下文都称为procedure)上进行处理。因为所有的命令都是经过master来协调处理，所以在修复时也需要通过master进行修复。否则反而可能导致更严重的不一致问题。所以hbck-1

2018-12-27

你可能没用过这个统计工具

CPS广告是一种按销售计费的新型广告模式，即按广告被点击之后实际销售产品的数量来收费的一种方式。用户每完成一次交易，网站主就会获得相应的佣金，它与CPA都是在一定程度上避免了广告主的风险，为广告主带来较大的利益。但每个推广渠道所产生的效益，广告主往往难以精准把握，尤其在投放了大量渠道之后，整体统计每个渠道付费效果更加难以实现。这里就要使用openinstall，它能为海量小渠道提供精准的统计分析，支持 Android 和 iOS 平台，实现免分包、免填码、实时展示、防刷量、渠道效果分析等功能，实现多种统计需求。下面详细介绍一下openinstall的具体功能：一、渠道数据首先登录openinstall官网https://www.openinstall.io/cpsChannel.html，登录应用后台，可以查看渠道报表，报表能实时统计各种CPS付费效果，渠道编号、渠道名、CPS渠道效果点都由管理者自定义生成。此外，报表兼具独立渠道链接、生成独立报表、分享数据等操作，同时数据能实时更新、实时排重，精准度和防作弊方面也能得到保障。二、免渠道分包在openinstall的应用管理后台，仅需创建CPS渠道链接，推广时在渠道上分发相应CPS渠道链接即可，甚至允许批量创建，理论上允许创建无数个小渠道。这种渠道链接的统计形式，能大大缩减人工打包分包的繁琐流程，渠道包造成的统计误差和抓包现象也将得到解决。三、渠道管理创建渠道后，将自动生成相应的渠道二维码和推广链接，收集到的具体渠道数据可以到渠道报表中查看（参考上面第一张效果图），还可随时导出单独渠道包（包括Excel表格）。四、添加自定义效果点在效果点管理里，App结合自定义效果点上传付费效果点数据（如：付费、点击、订单等），可以在openinstall后台直接查看付费效果统计（参考上面第一张效果图），并导出相应渠道包。有了如此详细的渠道报表，CPS渠道数据尽在掌握，用户付费效果和广告效果都能得到有效监控。此外，openinstall还能实现免填邀请码精准匹配邀请关系的功能，感兴趣的话可以登录官网了解最新动态。 openinstall官网：https://www.openinstall.io

2018-12-11

[雪峰磁针石博客]python包管理工具：Conda和pip比较

python测试开发项目实战-目录 python工具书籍下载-持续更新 python 3.7极速入门教程 - 目录 Conda和pip通常被认为几乎完全相同。

2018-12-03

dba+工具：PT-kill重构版，慢SQL报警及扼杀利器

微信报警功能 * * 环境准备: * shell> yum install -y php-process php php-mysql * */ 概述原生Percona版PT-kill(Perl)工具只是单纯地

2018-11-28

JVM性能调优监控工具jps、jstack、jmap、jhat、jstat、hprof使用详解

本文将对一些常用的JVM性能调优监控工具进行介绍，希望能起抛砖引玉之用。而且这些监控、调优工具的使用，无论你是运维、开发、测试，都是必须掌握的。

2018-11-15

[雪峰磁针石博客]2018最佳selenium工具书籍汇总下载(持续更新)

作者建议网络抓取作为任何数据科学家的强大工具，因为许多数据科学项目都是从获得适当的数据集开始的。作者探讨了HTTP，HTML和CSS的核心概念，以提供坚实的基础。

2018-11-04

业界 | 为什么Jupyter是数据科学家们实战工具的首选？

Jupyter 是一款免费、开源的交互式 web 工具。研究人员可以利用该工具将软件代码、计算输出、解释文本和多媒体资源组合在一个文档中。

2018-11-04

Facebook 开源了一整套重要的 Linux 内核组件与工具！

近日，Facebook 开源了一套解决重要计算集群管理问题的 Linux 内核组件和相关工具，这些项目覆盖了资源控制、资源利用、工作负载隔离、负载均衡、测量和监控等方面：BPF、Btrfs、Netconsd

2018-11-02

【最佳实践】如何通过OSSimport工具将线下数据迁移至金融云OSS?

1. 当前存在的问题：金融云由于等保要求，不能直接将闪电立方设备寄送到金融云机房。因此，我们还不能通过闪电立方的方式直接迁移数据至金融云OSS。但是金融云提供了另外一种类型的Bucket-金融云公网Bucket。金融云公网Bucket类似于公共云，能够被互联网直接访问。因此，是否可以借助于金融云公网OSS进行中转？ 2.总体思路：由于金融云内网只能在金融云内部访问。外部互联网无法访问。但是金融云公网Bucket类似于与公共云的OSS，允许VPC以及经典网络以及互联网访问。因此我们的思路是在金融云内部搭建1个ECS服务。该ECS服务是能够访问金融云内网Bucket，同时该ECS也是能够访问金融云公网OSS。注意：金融云的ECS可以直接访问互联网，但是互联网的end user是不能直接访问金融云内部ECS的。需要通过SLB中转。此处我们

2018-10-23

[雪峰磁针石博客]python工具库介绍-requests：人性化的HTTP

Requests是Python基于Apache2 Licensed许可证的人性化HTTP库。 Python标准库中urllib2提供了不少HTTP 功能，但API不系统。它有点过时，完成最简单的任务也需要大量工作。下面我们用实例演示访问github。 >>> import requests >>> r = requests.get('https://api.github.com/user', auth=('ouyangchongwu@test.com', 'password')) >>> r.status_code 200 >>> r.headers['content-type'] 'application/json; charset=utf-8' >>> r.encoding 'utf-8' >>> r.text u'{"login":"oychw",...}' >>> r.json() {u'disk_usage': 176, u'private_gists': 0, ...} Requests为Python处理了所有HTTP/1.1操作，与Web服务的无缝集成。不需要为URL手动添加查询字符串或POST数据进行表单处理。基于urllib3, 能自动处理Keep-alive和HTTP连接池。特点：国际化域名和 URLs Keep-Alive & 连接池持久的 Cookie 会话类浏览器的SSL认证基本/摘要式的身份认证优雅的键/值 Cookie 自动解压 Unicode响应体多段文件上传连接超时支持 .netrc 适用于 Python 2.6—3.4 线程安全用户手册简介 Requests关注PEP 20的部分： Beautiful is better than ugly.(美丽优于丑陋) Explicit is better than implicit.(明确优于含糊) Simple is better than complex.(简单优于复杂) Complex is better than complicated.(复杂优于繁琐) Readability counts.(可读性) 安装安装：推荐：pip install requests，其次：easy_install requests 最新代码： git clone git://github.com/kennethreitz/requests.git 下载tar.gz包：curl -OL https://github.com/kennethreitz/requests/tarball/master 下载zip包：curl -OL https://github.com/kennethreitz/requests/zipball/master 源码安装：python setup.py install 快速入门发送请求：下面获取Github的公共时间线，并在httpbin演示其他HTTP操作： >>> import requests >>> r = requests.get('https://github.com/timeline.json') >>> r = requests.post("http://httpbin.org/post") >>> r = requests.put("http://httpbin.org/put") >>> r = requests.delete("http://httpbin.org/delete") >>> r = requests.head("http://httpbin.org/get") >>> r = requests.options("http://httpbin.org/get") 在URL中传递参数 URL的查询字符串(query string)例如， httpbin.org/get?key=val，在Requests可以用字典的形式构建。比如传递key1=value1和key2=value2到 httpbin.org/get: >>> import requests >>> payload = {'key1': 'value1', 'key2': 'value2'} >>> r = requests.get("http://httpbin.org/get", params=payload) >>> print(r.url) http://httpbin.org/get?key2=value2&key1=value1 >>> payload = {'key1': 'value1', 'key2[]': ['value2', 'value3']} >>> r = requests.get("http://httpbin.org/get", params=payload) >>> print(r.url) http://httpbin.org/get?key1=value1&key2%5B%5D=value2&key2%5B%5D=value3 注意字典里值为None的键会忽略。上面第２个例子访问的是http://httpbin.org/get?key1=value1&key2[]=value2&key2[]=value3 。注意key后面需要添加中括号对。响应 >>> import requests >>> r = requests.get('https://api.github.com/events') >>> r.text >>> u'[{"id":"2636319727","type":"PullRequestReviewCommentEvent","actor":{"id":1148601,"login":"i ...}] >>> r.encoding 'utf-8' >>> r.encoding = 'ISO-8859-1' Requests会自动解码服务器的返回。大多数unicode字符集都能无缝解码。请求发出时Requests会基于响应的HTTP头部推测响应的编码。同时还可以设置和查询编码。改变编码后，访问 r.text 将会使用 r.encoding 。二进制响应 r.content可以以字节的方式显示响应。 >>> r.content b'[{"repository":{"open_issues":0,"url":"https://github.com/... 传输格式gzip和deflate会自动转码。处理图片实例： >>> from PIL import Image >>> from StringIO import StringIO >>> i = Image.open(StringIO(r.content)) Json响应 Requests内置了JSON解码器: >>> import requests >>> r = requests.get('https://github.com/timeline.json') >>> r.json() {u'documentation_url': u'https://developer.github.com/v3/activity/events/#list-public-events', u'message': u"Hello there, wayfaring stranger. If you're reading this then you probably didn't see our blog post a couple of years back announcing that this API would go away: http://git.io/17AROg Fear not, you should be able to get what you need from the shiny new Events API instead."} JSON解码失败时r.json 就会抛出异常。例如， 401 (Unauthorized) ， ValueError: No JSON object could be decoded等。原始响应极端的情况下需要查看服务器的原始套接字响应，请求时设置 stream=True： >>> import requests >>> r = requests.get('https://api.github.com/events', stream=True) >>> r.raw <urllib3.response.HTTPResponse object at 0x7f807dd6f4d0> >>> r.raw.read(10) '\x1f\x8b\x08\x00\x00\x00\x00\x00\x00\x03' 通常需要存为文件: with open(filename, 'wb') as fd: for chunk in r.iter_content(chunk_size): fd.write(chunk) Response.iter_content 能减少直接使用Response.raw的大量处理，下载流时尤其推荐。自定义头 >>> import requests >>> import json >>> url = 'https://api.github.com/some/endpoint' >>> payload = {'some': 'data'} >>> headers = {'content-type': 'application/json'} >>> r = requests.post(url, data=json.dumps(payload), headers=headers) 更加复杂的POST请求表单直接以字典形式发送： >>> import requests >>> payload = {'key1': 'value1', 'key2': 'value2'} >>> r = requests.post("http://httpbin.org/post", data=payload) >>> print(r.text) { "args": {}, "data": "", "files": {}, "form": { "key1": "value1", "key2": "value2" }, "headers": { "Accept": "*/*", "Accept-Encoding": "gzip, deflate, compress", "Content-Length": "23", "Content-Type": "application/x-www-form-urlencoded", "Host": "httpbin.org", "User-Agent": "python-requests/2.2.1 CPython/2.7.6 Linux/3.13.0-53-generic" }, "json": null, "origin": "119.122.150.177", "url": "http://httpbin.org/post" } string则会被直接发布出去。Github API v3中接受编码为JSON的POST/PATCH数据 >>> import requests >>> import json >>> url = 'https://api.github.com/some/endpoint' >>> payload = {'some': 'data'} >>> r = requests.post(url, data=json.dumps(payload)) POST复杂编码的文件 >>> import requests >>> url = 'http://httpbin.org/post' >>> files = {'file': open('/home/andrew/test.xls', 'rb')} >>> r = requests.post(url, files=files) >>> url = 'http://httpbin.org/post' >>> r.text u'{\n "args": {}, \n "data": "", \n "files": {\n ... "url": "http://httpbin.org/post"\n}\n' 可以显式地设置文件名，文件类型和请求头: >>> import requests >>> files = {'file': ('report.xls', open('/home/andrew/test.xls', 'rb'), 'application/vnd.ms-excel', {'Expires': '0'})} >>> url = 'http://httpbin.org/post' >>> r = requests.post(url, files=files) >>> r.text u'{\n "args": {}, \n "data": ""..."url": "http://httpbin.org/post"\n}\n' 还可以直接用文字代替文件： >>> import requests >>> url = 'http://httpbin.org/post' >>> files = {'file': ('report.csv', 'some,data,to,send\nanother,row,to,send\n')} >>> r = requests.post(url, files=files) >>> r.text u'{\n "args": {}, \n "data": "", \n "files": {\n ... "json": null, \n "origin": "14.153.22.104", \n "url": "http://httpbin.org/post"\n}\n' multipart/form-data不支持特别大的文件，建议使用requests-toolbelt，参考：toolbelt 响应状态码 >>> import requests >>> r = requests.get('http://httpbin.org/get') >>> r.status_code 200 >>> r.status_code == requests.codes.ok True >>> bad_r = requests.get('http://httpbin.org/status/404') >>> bad_r.status_code 404 >>> bad_r.raise_for_status() >>> r.raise_for_status() 上面的requests.codes.ok是内置的状态码查询对象。可以使用 Response.raise_for_status()跑出失败请求(4XX客户端错误或5XX服务器异常)，我们可以通过 Response.raise_for_status() 来抛出异常。r的返回为200，所以返回None，不产生异常。响应头 >>> r.headers {'content-length': '275', 'server': 'nginx', 'connection': 'keep-alive', 'access-control-allow-credentials': 'true', 'date': 'Tue, 10 Mar 2015 08:21:36 GMT', 'access-control-allow-origin': '*', 'content-type': 'application/json'} >>> r.headers['Content-Type'] 'application/json' >>> r.headers.get('content-type') 'application/json' 根据 RFC 2616，HTTP头部不区分大小写。根据RFC 7230，接收方会对服务端对同一key的不同value进行组合。 Cookies 可以访问响应中包含的Cookie: >>> import requests >>> url = 'http://automationtesting.sinaapp.com/login' >>> r = requests.get(url) >>> r.cookies.keys() ['saeut', 'trac_form_token', 'trac_session'] >>> r.cookies['saeut'] 'CkMPGlT+tfQiXS9uGYviAg==' 使用cookies参数可以发送你的cookies到服务器: >>> import requests >>> url = 'http://httpbin.org/cookies' >>> cookies = dict(cookies_are='working') >>> r = requests.get(url, cookies=cookies) >>> r.text u'{\n "cookies": {\n "cookies_are": "working"\n }\n}\n' 重定向与请求历史默认对HEAD以外其他所有动作进行位置重定向。Response.history可以看到重定向的记录。 >>> import requests >>> r = requests.get('http://github.com') >>> r.url u'https://github.com/' >>> r.status_code 200 >>> r.history [<Response [301]>] GET, OPTIONS, POST, PUT, PATCH 或者 DELETE可以通过allow_redirects参数禁用重定向，这个设置对HEAD也生效: >>> import requests >>> r = requests.get('http://github.com', allow_redirects=False) >>> r.status_code 301 >>> r.history [] >>> r = requests.head('http://github.com', allow_redirects=True) >>> r.url u'https://github.com/' >>> r.history [<Response [301]>] 超时超时告诉requests在经过timeout参数的秒之后停止等待响应: >>> import requests >>> requests.get('http://github.com', timeout=0.1) Traceback (most recent call last): File "<stdin>", line 1, in <module> File "/usr/lib/python2.7/dist-packages/requests/api.py", line 55, in get return request('get', url, **kwargs) File "/usr/lib/python2.7/dist-packages/requests/api.py", line 44, in request return session.request(method=method, url=url, **kwargs) File "/usr/lib/python2.7/dist-packages/requests/sessions.py", line 455, in request resp = self.send(prep, **send_kwargs) File "/usr/lib/python2.7/dist-packages/requests/sessions.py", line 558, in send r = adapter.send(request, **kwargs) File "/usr/lib/python2.7/dist-packages/requests/adapters.py", line 387, in send raise Timeout(e) requests.exceptions.Timeout: (<urllib3.connectionpool.HTTPConnectionPool object at 0x7f807dd6f050>, 'Connection to github.com timed out. (connect timeout=0.1)') >>> 注: 超时不是对整个响应下载的时间限制, 而且指定时间没有收到服务器返回就抛出异常。错误与异常 ConnectionError：网络问题(如DNS失败、拒绝连接等)。 HTTPError: 比较罕见的无效HTTP响应时。 Timeout：请求超时。 TooManyRedirects：超过了设定的最大重定向次数。 requests.exceptions.RequestException是所有具体异常的基类。高级用法 Session对象 Session对象能够跨请求保持参数，Session实例发出的所有请求共享cookies。 Session对象具有主Requests API的所有方法。 >>> s = requests.Session() >>> s.get('http://httpbin.org/cookies/set/sessioncookie/123456789') <Response [200]> >>> r = s.get("http://httpbin.org/cookies") >>> print(r.text) { "cookies": { "sessioncookie": "123456789" } } Session也可为request方法提供缺省数据，添加属性即可: >>> import requests >>> s = requests.Session() >>> s.auth = ('user', 'pass') >>> s.headers.update({'x-test': 'true'}) >>> s.get('http://httpbin.org/headers', headers={'x-test2': 'true'}) <Response [200]> 传递给request方法的字典都会与已有session层的值合并。方法层的参数会覆盖会话的参数。在方法层参数中将键值设置为None，会被自动忽略key。参考： session api 请求(Request)和响应(Response)对象 requests.get()等请求主要做两件的事情。一为构建Request 对象。二为收到服务器响应时产生Response 对象。Response对象包含服务器返回和原来的 Request 对象。 >>> import requests >>> r = requests.get('http://en.wikipedia.org/wiki/Monty_Python') >>> r.headers {'content-length': '67559', ...} >>> r.request.headers {'Connection': 'keep-alive', 'Accept-Encoding': ...} 预请求当从API或会话调用接收Response对象时，request属性实际上是PreparedRequest。如果你需要修改body或header，可以如下方式进行处理： from requests import Request, Session s = Session() req = Request('GET', url, data=data, headers=header ) prepped = req.prepare() # do something with prepped.body # do something with prepped.headers resp = s.send(prepped, stream=stream, verify=verify, proxies=proxies, cert=cert, timeout=timeout ) print(resp.status_code) 这里没有对Request对象进行特殊处理，而是修改PreparedRequest对象。然后用requests.* 或Session.*.发送。上述代码没有Request Session。Session层状态，如cookie不会使用。用Session.prepare_request()替换Request.prepare()即可增加状态支持： from requests import Request, Session s = Session() req = Request('GET', url, data=data headers=headers ) prepped = s.prepare_request(req) # do something with prepped.body # do something with prepped.headers resp = s.send(prepped, stream=stream, verify=verify, proxies=proxies, cert=cert, timeout=timeout ) print(resp.status_code) SSL证书验证使用 verify 参数可以像web浏览器一样为HTTPS请求验证SSL证书: 参考资料讨论qq群144081101 591302926 567351477 钉钉群21745728 requests英文文档 requests-docs-cn.readthedocs.org docs.python-requests.org/en/latest/ HTTP相关python库本文最新版本地址本文涉及的python测试开发库谢谢点赞！本文相关海量书籍下载

2018-10-14

AutoMl及NAS概述：更有效地设计神经网络模型工具

随着人工智能的迅速发展，深度学习工具箱也发生比较大的变化，从之前受欢迎的Caffe到Tensorflow等框架，好的深度学习框架能够帮助开发人员快速且高效地开发出相应的任务模型，完成相关的任务。

2018-09-13

GIT: 分布式开发代码管理工具使用命令大全

代码管理工具： GIT 什么是GIT？

2018-08-28

使用JDK自带的工具jstack找出造成运行程序死锁的原因

实际上，JDK已经给Java程序员提供了强大的死锁分析工具，能够直接分析一个正在运行的并且处于死锁状态的应用，并给出具体是哪一行Java代码引起的死锁。

2018-08-25

使用工具Source Monitor测量您Java代码的环复杂度

代码的环复杂度(Cyclomatic complexity，有时也翻译成圈复杂度)是一种代码复杂度的衡量标准，在1976年由Thomas J. McCabe, Sr. 提出。来看看计算公式。代码环复杂度 = E − N + 2 E = 程序控制流图中边的个数 N = 程序控制流图中点的个数很容易得出这样的结论：代码环复杂度越高，越容易出bug。可以想象如果需要开发人员自己去把一段代码的控制流图画出来，然后去数图中边和点的个数，这种做法效率太低了也容易出错。好消息是，有一款名为Source Monitor的免费软件，能够帮我们来度量Java代码的环复杂度。当然这款软件也支持C++和C#。为了说明如何使用这款软件，我写了一段简单的Java代码。 package test; import java.util.ArrayList; public class monthTool { static ArrayList<String> monthCollection = new ArrayList<String>(); public static void main(String[] args) { monthTool tool = new monthTool(); tool.printV1(1); tool.printV2(2); tool.printV1(0); tool.printV2(-1); tool.printV3(3); tool.printV3(13); } public monthTool(){ monthCollection.add("Invalid"); monthCollection.add("January"); monthCollection.add("Febrary"); monthCollection.add("March"); monthCollection.add("April"); monthCollection.add("May"); monthCollection.add("June"); monthCollection.add("July"); monthCollection.add("August"); monthCollection.add("September"); monthCollection.add("October"); monthCollection.add("November"); monthCollection.add("December"); } public void printV1(int month){ System.out.println("Month is: " + getMonthNameV1(month)); } public void printV2(int month){ if( month >= 1 && month <= 12) System.out.println("Month is: " + getMonthNameV2(month)); else System.out.println("Please specify a valid month"); } public void printV3(int month) { System.out.println("Month is: " + getMonthNameV3(month)); } public String getMonthNameV2(int month){ if( month == 1) return "January"; else if( month == 2) return "Febrary"; else if( month == 3) return "March"; else if( month == 4) return "April"; else if( month == 5) return "May"; else if( month == 6) return "June"; else if( month == 7) return "July"; else if( month == 8) return "August"; else if( month == 9) return "September"; else if( month == 10) return "October"; else if( month == 11) return "November"; else if( month == 12) return "December"; else return "Invalid"; } public String getMonthNameV1(int month){ switch (month){ case 1: return "January"; case 2: return "Febrary"; case 3: return "March"; case 4: return "April"; case 5: return "May"; case 6: return "June"; case 7: return "July"; case 8: return "August"; case 9: return "September"; case 10: return "October"; case 11: return "November"; case 12: return "December"; default: return "Invalid"; } } public String getMonthNameV3(int month){ try { return monthCollection.get(month); } catch (java.lang.IndexOutOfBoundsException e){ return "Invalid"; } } } 其中我用了三种不同的方式实现了同一个逻辑，将一个代表月份的整数转成了月份名称。下面是Source Monitor的具体用法。 1. 创建一个新的项目：这里能看到所有Source Monitor支持的编程语言。 2. 指定您本地的Java项目文件地址： 3. 指定您的Java项目文件夹内，您希望SourceMonitor计算哪些Java文件的环复杂度。 4. 点OK，就可以开始扫描啦。很快Source Monitor就将我们指定的Java文件的环复杂度计算完毕。点击菜单“Display Method Metrics”来查看结果：从环复杂度扫描结果能看出，明显第三种从月份名称集合里通过ArrayList自带的get方法取得月份名称是最优的解法——环复杂度仅为2。也可以通过图表的方式更直观得看到方法的环复杂度比较： X轴的值代表每个方法的环复杂度，Y轴代表这些环复杂度的不同值出现的次数。比如下图的意思是，环复杂度为1的方法（X轴刻度为1的节点)共有4个(Y轴刻度为4），环复杂度为2的方法（X轴刻度为2的节点）有1个（Y轴刻度为1）。以此类推。要获取更多Jerry的原创技术文章，请关注公众号"汪子熙"或者扫描下面二维码:

2018-08-24

资源下载

更多资源

Mario

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长，特征是大鼻子、头戴帽子、身穿背带裤，还留着胡子。与他的双胞胎兄弟路易基一起，长年担任任天堂的招牌角色。

Nacos

Nacos /nɑ:kəʊs/ 是 Dynamic Naming and Configuration Service 的首字母简称，一个易于构建 AI Agent 应用的动态服务发现、配置管理和AI智能体管理平台。Nacos 致力于帮助您发现、配置和管理微服务及AI智能体应用。Nacos 提供了一组简单易用的特性集，帮助您快速实现动态服务发现、服务配置、服务元数据、流量管理。Nacos 帮助您更敏捷和容易地构建、交付和管理微服务平台。

Spring

Spring框架（Spring Framework）是由Rod Johnson于2002年提出的开源Java企业级应用框架，旨在通过使用JavaBean替代传统EJB实现方式降低企业级编程开发的复杂性。该框架基于简单性、可测试性和松耦合性设计理念，提供核心容器、应用上下文、数据访问集成等模块，支持整合Hibernate、Struts等第三方框架，其适用范围不仅限于服务器端开发，绝大多数Java应用均可从中受益。

WebStorm

WebStorm 是jetbrains公司旗下一款JavaScript 开发工具。目前已经被广大中国JS开发者誉为“Web前端开发神器”、“最强大的HTML5编辑器”、“最智能的JavaScript IDE”等。与IntelliJ IDEA同源，继承了IntelliJ IDEA强大的JS部分的功能。