首页 文章 精选 留言 我的

文章列表

共 97898 篇
hanlp自然语言处理包的人名识别代码解析

hanlp自然语言处理包的人名识别代码解析

HanLP发射矩阵词典nr.txt中收录单字姓氏393个。袁义达在《中国的三大姓氏是如何统计出来的》文献中指出:当代中国100个常见姓氏中,集中了全国人口的87%,根据这一数据我们只保留nr.txt中的100个常见词语的姓氏角色,其他词语去掉其姓氏角色状态。过滤后,nr.txt中具有姓氏角色的单字共计97个。 列于下表:丁 万 乔 于 任 何 余 侯 傅 冯...

用大白话告诉你 :Java 后端到底是在做什么?

用大白话告诉你 :Java 后端到底是在做什么?

阅读本文大概需要 6 分钟。 作者:黄小斜 新手程序员通常会走入一个误区,就是认为学习了一门语言,就可以称为是某某语言工程师了。但事实上真的是这样吗?其实并非如此。 今天我们就来聊一聊,Java 开发工程师到底开发的是什么东西。准确点来说,Java后端到底在做什么? 大家都知道 Java 是一门后端语言,后端指的就是服务端,服务端代码一般运行在服务器上,通常...

Spring常见的十大错误,78%的老程序员都踩过这些坑!

Spring常见的十大错误,78%的老程序员都踩过这些坑!

首先我们来看一下,Spring常见错误有那些1.太过关注底2.内部结构 “泄露”3.缺乏关注点分离4.缺乏异常处理或处理不当5.多线程处理不当6.不使用基于注解的验证7.(依旧)使用基于xml的配置8.忽略 profile9.无法接受依赖项注入10.缺乏测试,或测试不当 接下来就一一介绍这些常见的错误1. 错误一:太过关注底层我们正在解决这个常见错误,是因为...

日志服务数据加工最佳实践: 使用搜索映射做高级数据富化

日志服务数据加工最佳实践: 使用搜索映射做高级数据富化

普通映射 vs 搜索映射 典型映射方式不能满足富化需求时, 可以使用搜索映射, 搜索映射与传统方式映射的区别在于匹配方式不同. 普通映射方式 一般映射使用文本完全匹配方式来映射, 例如NGNIX日志中, 需要将状态码转换为一个文本表示: 状态码 文本 200 成功 300 跳转 400 请求错误 500 服务器错误 下面规则调用e_dict_map将字段st...

日志服务数据加工最佳实践: 从RDS-MySQL拉取数据做富化

日志服务数据加工最佳实践: 从RDS-MySQL拉取数据做富化

概述 使用全局富化函数做富化时, 需要传递一个字典或者表格结构做富化. 参考构建字典与表格做数据富化的各种途径比较. 本篇介绍从使用资源函数res_rds_mysql从RDS-MySQL拉取数据的做富化的详细实践.关于res_rds_mysql的参数说明, 参考这里. 背景 这里我们在RDS中存放用户信息表格userinfo. 原始数据库表中内容: id p...

日志服务数据加工最佳实践: 加工多层数组对象嵌套的复杂JSON

日志服务数据加工最佳实践: 加工多层数组对象嵌套的复杂JSON

本实践案例主要是从多层数组对象嵌套的场景,向读者介绍如何使用LOG DSL解决工作中的具体需求。 需求 这里以一个复杂的包括多层数组嵌套的对象举例, 希望可以将users下的每个对象中的login_histories的每个登录信息都拆成一个登录事件. 原始日志举例 __source__: 1.2.3.4 __topic__: content:{ "users...

日志服务数据加工最佳实践: 多子键为数组的复杂JSON加工

日志服务数据加工最佳实践: 多子键为数组的复杂JSON加工

加工需求 统计类日志形式 程序构建的日志经常会以一种统计性质的JSON格式写入, 通常其包含一个基础信息, 以及多个子健为数组的形式. 例如一个服务器每隔1分钟写入一条日志, 包含当前信息状态, 以及相关服务器和客户端节点的统计状态信息. 样例: __source__: 1.2.3.4 __topic__: content:{ "service": "sea...

日志服务数据加工最佳实践: 特定格式文本的加工

日志服务数据加工最佳实践: 特定格式文本的加工

本部分实践案例主要是根据在实际工作中的工单需求产生。接下来将从工单需求,加工编排(解决方案)等几个方面给读者解答如何使用LOG DSL编排解决任务需求。 场景:非标准JSON对象转JSON展开 需要对收集的dict数据进行二次嵌套展开操作。解决方案是先将dict数据转成json数据,然后使用e_json函数进行展开即可。 原始日志 在控制台收集到的日志格式是...

日志服务数据加工最佳实践: 解析syslog各种标准格式

日志服务数据加工最佳实践: 解析syslog各种标准格式

概况 syslog是一种工业标准的协议,可用来记录设备的日志。在UNIX系统,路由器、交换机等网络设备中,系统日志(System Log)记录系统中任何时间发生的大小事件。管理者可以通过查看系统记录,随时掌握系统状况。UNIX的系统日志是通过syslogd这个进程记录系统有关事件记录,也可以记录应用程序运作事件。通过适当的配置,还可以实现运行syslog协议...

日志服务数据加工最佳实践: 跨账号多源logstore数据汇总

日志服务数据加工最佳实践: 跨账号多源logstore数据汇总

概述 在跨账号同Region下的不同logstore之间操作数据并汇总数据. 日志服务数据目前支持多源logstore汇总到一个目标的方式是通过对每一个源logstore配置一份数据加工任务来实现的. 注意 目前数据加工仅支持同Region下分发 原始日志 """ 账号1的logstore中的日志 Prject区域:英国(伦敦) Project名称:Proj...

日志服务数据加工最佳实践: 跨账号多目标logstore数据分发

日志服务数据加工最佳实践: 跨账号多目标logstore数据分发

概述 数据分发主要包含两种方法:跨账号多目标Logstore的分发和动态目标Logstore的分发, 其特点如下表. 需要时也可以合并两种方法. 注意 目前数据加工仅支持同Region下分发 方法 优点 缺点 配置多个目标Logstore 支持不同账号(AK)的目标Logstore 多个目标时, 配置与使用较为繁琐. 目标一般在代码中静态指定. 目前最多20...

资源下载

更多资源
腾讯云软件源

腾讯云软件源

为解决软件依赖安装时官方源访问速度慢的问题,腾讯云为一些软件搭建了缓存服务。您可以通过使用腾讯云软件源站来提升依赖包的安装速度。为了方便用户自由搭建服务架构,目前腾讯云软件源站支持公网访问和内网访问。

Spring

Spring

Spring框架(Spring Framework)是由Rod Johnson于2002年提出的开源Java企业级应用框架,旨在通过使用JavaBean替代传统EJB实现方式降低企业级编程开发的复杂性。该框架基于简单性、可测试性和松耦合性设计理念,提供核心容器、应用上下文、数据访问集成等模块,支持整合Hibernate、Struts等第三方框架,其适用范围不仅限于服务器端开发,绝大多数Java应用均可从中受益。

Rocky Linux

Rocky Linux

Rocky Linux(中文名:洛基)是由Gregory Kurtzer于2020年12月发起的企业级Linux发行版,作为CentOS稳定版停止维护后与RHEL(Red Hat Enterprise Linux)完全兼容的开源替代方案,由社区拥有并管理,支持x86_64、aarch64等架构。其通过重新编译RHEL源代码提供长期稳定性,采用模块化包装和SELinux安全架构,默认包含GNOME桌面环境及XFS文件系统,支持十年生命周期更新。

Sublime Text

Sublime Text

Sublime Text具有漂亮的用户界面和强大的功能,例如代码缩略图,Python的插件,代码段等。还可自定义键绑定,菜单和工具栏。Sublime Text 的主要功能包括:拼写检查,书签,完整的 Python API , Goto 功能,即时项目切换,多选择,多窗口等等。Sublime Text 是一个跨平台的编辑器,同时支持Windows、Linux、Mac OS X等操作系统。

用户登录
用户注册