Github一周热门项目总结:自然语言处理Python库spaCy最热!
【大咖・来了 第7期】10月24日晚8点观看《智能导购对话机器人实践》
过去一周,Github上最热门的项目当属自然语言处理Python库spaCy,该项目最近更新到了2.0版本。SpaCy是一个基于自然语言处理研究创建的开源项目,目的是最终将其用于真实的产品和解决方案。2.0版本增加了几个新功能,包括新的神经网络模型,支持更多的语言和改进的文档。
SpaCy的作者Matthew Honnibal在发行说明中写道,新版本通过***的深度学习技术对spaCy进行了更新,并使得在可扩展的云计算工作流程中运行spaCy变得更加容易。
新版本包含了13种神经网络模型,可用于七种以上语言。它还增加了对八种新语言(英语,德语,西班牙语,葡萄牙语,法语,意大利语,荷兰语和多语言NER)的Alpha标记化支持。它使用bloom嵌入策略来支持小表中的大型词汇表。核心神经网络模型具有词性标签,依赖标签和命名实体,小型模型将仅具有上下文特定的标记向量,而中等模型将具有词向量。
对于这个版本,大部分使用指南,API文档和代码示例都被重写了。该文档包含有关自定义处理管道,可视化工具,培训教程,单词向量和基于规则的匹配信息。现在有一个spaCy 101指南,其中包含重要概念的解释和说明以及库的特色总结。
自从一个星期前更新到2.0版以来,已经发布了2.0.3版以解决一些bug,甚至通过添加视频,更新培训提示和建议等部分来进一步更新文档。
Github上周其他五大热门项目(根据Trending排行榜得出,感兴趣可直接在Github中搜索项目名称获取详细信息):
-
Git flight rules:使用Git的程序员指南。如果事情出错,开发人员可以通过该项目看看可以做什么。
-
State of the art result for machine learning problems:正如名称所述,SoTA可以解决所有机器学习问题。
-
Node best practices:Node.js***实践列表
-
JS code to SVG flowchart:用于将JS代码转换成SVG流程图的可视化库。
-
Tensorflow:机器学习开源软件库。
低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
AI时代的云端智能计算
【大咖・来了 第7期】10月24日晚8点观看《智能导购对话机器人实践》 人工智能对计算力的需求是弹性可扩展的,既需要高峰值的需求承压,也需要在日常使用时进行调控。针对这一特点,基于云端进行AI研发正变得越来越流行。如今,人工智能已经应用于语音识别、图像处理等多个领域,甚至击败了围棋九段柯洁,这种进步是难以置信的。而这一系列成绩的背后,是海量数据的积累与学习,在没有云的时代,是无法想象的。 腾讯董事会主席兼CEO马化腾曾表示,企业向云端迁移的速度在加快,未来很可能超过传统数据中心。但是,云还处于初始阶段,电力时代最终出现了计算机,而人工智能有望成为云时代像计算机一样的关键产物。 人工智能涉及的领域非常广泛,工业、航天、商业都有应用,并且已经深入人们的生活,打开手机中的Cortana或者Siri就能看到它。 当然,云计算的意义从来不是计算本身,而是背后的服务,体现在对大数据的使用。2020年,全球大数据市场的规模将达到570亿,通过对数据的处理和分析,人工智能也进入了高速发展期,从而推动了各行各业的智慧化。医疗、金融、农业、零售等领域的数字化成为主要议题,这也反映了智慧计算+传统产业所迸发...
- 下一篇
美国加速推进新超算Summit:拉IBM+NV反击国产神威
【大咖・来了 第7期】10月24日晚8点观看《智能导购对话机器人实践》 上周更新的超算500强名单,中国继续霸占TOP2,同时系统总量达到202台,实现对美国143台的反超。 其中,广为人知的领头羊神威·太湖之光四连冠,***计算性能93.0PFlops(每秒9.3亿亿次浮点计算)。 第三名瑞士的Piz Daint(代恩特峰),美国连续两次未入围前三甲,且这次日本的Gyoukou(晓光)杀到第四,美国的Titan(泰坦,AMD皓龙+NV加速卡)被挤到了第五名。 据TOMH报道,为了证明自己的实力,美国将借助“The Summit(顶点)”超级计算机实现对我国神威的逆袭。 TheSummit设计计算能力达到200 PetaFLOPS,也就是神威的2倍,Titan的11倍。 具体的配置参数上,The Summit基于IBM的Power Systems AC922做节点,每个节点搭载2个Power9处理器和6张NVIDIA GV100显卡,总共设计约4600个节点。 Power9处理器依然是IBM的自研高性能微架构,80亿个晶体管,24个物理核心,每个核心承载4个加速线程,也就是96线程。支...
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- Eclipse初始化配置,告别卡顿、闪退、编译时间过长
- Docker安装Oracle12C,快速搭建Oracle学习环境
- SpringBoot2配置默认Tomcat设置,开启更多高级功能
- Windows10,CentOS7,CentOS8安装MongoDB4.0.16
- CentOS7编译安装Gcc9.2.0,解决mysql等软件编译问题
- Mario游戏-低调大师作品
- SpringBoot2整合Redis,开启缓存,提高访问速度
- SpringBoot2整合Thymeleaf,官方推荐html解决方案
- 2048小游戏-低调大师作品
- CentOS7编译安装Cmake3.16.3,解决mysql等软件编译问题