首页 文章 精选 留言 我的
优秀的个人博客,低调大师

微信关注我们

原文链接:https://www.oschina.net/news/103735/twitter-fixes-bug-exposing-private-tweets

转载内容版权归作者及来源网站所有!

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

准确率创新高,北大开源中文分词工具包 pkuseg

北京大学近日开源了一个全新的中文分词工具包 pkuseg ,相比于现有的同类开源工具,pkuseg 大幅提高了分词的准确率。 pkuseg 由北大语言计算与机器学习研究组研制推出,具备如下特性: 高分词准确率。相比于其他的分词工具包,pkuseg 在不同领域的数据上都大幅提高了分词的准确度。根据项目文档给出的测试结果,pkuseg 分别在示例数据集( MSRA 和CTB8 )上降低了 79.33% 和 63.67% 的分词错误率。 多领域分词。研究组训练了多种不同领域的分词模型。根据待分词的领域特点,用户可以自由地选择不同的模型。 支持用户自训练模型。支持用户使用全新的标注数据进行训练。 性能对比 在 Linux 环境下,各工具在新闻数据 (MSRA) 和混合型文本 (CTB8) 数据上的准确率测试情况如下: 预训练模型 分词模式下,用户需要加载预训练好的模型。我们提供了三种在不同类型数据上训练得到的模型,根据具体需要,用户可以选择不同的预训练模型。以下是对预训练模型的说明: MSRA : 在 MSRA(新闻语料)上训练的模型。新版本代码采用的是此模型。下载地址 CTB8 : 在 CT...

Hacker News 2018 年度报告出炉

在介绍 Hacker News 2018 的年度报告之前,我们先来简单的了解一下这个网站。从名字不难看出,这是一个面向 Hacker(引申至广义的开发者)提供资讯的网站。总的来说,可以将 Hacker News 看做是一个面向全球开发者的内容聚合平台,持续为众多程序员和创业者提供优质的内容。Hacker News 由保罗·格雷厄姆(《黑客与画家》的作者)联合建立的创业孵化器 Y Combinator 创建。 目前 Hacker News 2018 的年度报告已经发布。从这份年度报告中,我们不妨看看全球的开发者都在关注什么。 先上一张 Hacker News 最新的首页截图,感受一下万年不改的上世纪风格 UI ↓↓↓ Hacker News 2018 年度总数据概览 官方表示,Hacker News 在 2018 年产生了超过 250 万个帖子,讨论了 30 多万个不同的主题,新增了 5 万多名新用户,而用户贡献的评论也高达 220 多万。 2018年8月21日是去年最活跃的一天,当天总共发布了 18412 个帖子;而每周二是最活跃的工作日,官方统计的结果显示全年的每周二累计总共发布了 ...

相关文章

发表评论

资源下载

更多资源
Oracle

Oracle

Oracle Database,又名Oracle RDBMS,或简称Oracle。是甲骨文公司的一款关系数据库管理系统。它是在数据库领域一直处于领先地位的产品。可以说Oracle数据库系统是目前世界上流行的关系数据库管理系统,系统可移植性好、使用方便、功能强,适用于各类大、中、小、微机环境。它是一种高效率、可靠性好的、适应高吞吐量的数据库方案。

Apache Tomcat

Apache Tomcat

Tomcat是Apache 软件基金会(Apache Software Foundation)的Jakarta 项目中的一个核心项目,由Apache、Sun 和其他一些公司及个人共同开发而成。因为Tomcat 技术先进、性能稳定,而且免费,因而深受Java 爱好者的喜爱并得到了部分软件开发商的认可,成为目前比较流行的Web 应用服务器。

Eclipse

Eclipse

Eclipse 是一个开放源代码的、基于Java的可扩展开发平台。就其本身而言,它只是一个框架和一组服务,用于通过插件组件构建开发环境。幸运的是,Eclipse 附带了一个标准的插件集,包括Java开发工具(Java Development Kit,JDK)。

JDK

JDK

JDK是 Java 语言的软件开发工具包,主要用于移动设备、嵌入式设备上的java应用程序。JDK是整个java开发的核心,它包含了JAVA的运行环境(JVM+Java系统类库)和JAVA工具。