Paperless-ngx —— 开源文档管理系统
Paperless-ngx 是一个社区支持的开源文档管理系统,可将你的物理文档转换为可搜索的在线档案,从而减少纸张的使用。该软件旨在使“无纸化”变得更容易。
特性
- 使用标签、通讯录、类型等组织和索引扫描的文档。
- 对你的文档执行 OCR,将可选择的文本添加到仅图像文档中,并向你的文档添加标签、通讯录和文档类型。
- 支持 PDF 文档、图像、纯文本文件和 Office 文档(Word、Excel、Powerpoint 和 LibreOffice 等效项)。
- Office 文档支持是可选的,由 Apache Tika 提供(参阅配置)
- 无纸化将你的文档直接存储在磁盘上。文件名和文件夹采用无纸化管理,格式可自由配置。
- 单页应用程序前端。
- 包括一个显示基本统计数据并具有文档上传功能的仪表板。
- 按标签、通讯录、类型等进行过滤。
- 可以保存自定义视图并将其显示在仪表板上。
- 全文搜索可帮助你找到所需内容。
- 自动完成会建议文档中的相关单词。
- 结果按与你的搜索查询的相关性排序。
- 突出显示可以显示文档的哪些部分与查询匹配。
- 搜索类似文档(“更多类似内容”)
- 电子邮件处理:无纸化添加来自你的电子邮件帐户的文档。
- 配置多个帐户并为每个帐户配置过滤器。
- 从邮件添加文档时,无纸化可以将这些邮件移动到新文件夹、将其标记为已读、将其标记为重要或将其删除。
- 机器学习驱动的文档匹配。
- Paperless-ngx 会从你的文档中学习,一旦你以无纸化方式存储了一些文档,它就能够自动为文档分配标签、通讯录和类型。
- 针对多核系统进行了优化:Paperless-ngx 并行使用多个文档。
- 集成的完整性检查器可确保你的文档存档状况良好。
- 文档中提供了更多屏幕截图。

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
每日一博 | 亿级流量高并发春晚互动前端技术揭秘
前言 2022年1月,京东成为央视总台2022年春节联欢晚会独家互动合作伙伴,双方在红包互动、电商等方面展开全方位深度合作。在除夕当天产生691亿次互动,送出15亿元红包好物。 如何在这种大规模、高并发的场景下,确保系统的稳定性和性能,为用户提供稳定流畅的互动体验,成为了我们亟待解决的问题。 接下来我们主要从静态资源优化、缓存、容错、工程化几个方面来详细介绍前端团队所做的努力和创新。 静态资源优化 首屏资源加载策略 在春晚主持人口播之后,大量用户会集中在一段时间内涌入互动页面,这会导致流量峰值。为了降低页面打开时的请求次数和资源体积,我们根据页面交互,将所需资源分为三类:首屏、次屏以及操作后。 首屏资源主要包括:HTML文档、JavaScript、CSS以及样式图片。由于这是单页面应用,我们可以通过常规技术将JS和CSS进行打包。对于样式图片,我们可以通过按需加载的方式,显著减小首屏资源体积。 页面包含两个楼层,首屏的互动楼层和次屏的万券齐发楼层。其中,首屏会展示两排优惠券,因此,我们需要在首屏加载这部分券楼层的样式图片。互动主玩法中主要包括抽奖弹窗、邀人弹窗和击鼓游戏。通过拆分优化,...
- 下一篇
ACK One Argo工作流:实现动态 Fan-out/Fan-in 任务编排
作者:庄宇 什么是Fan-out Fan-in 在工作流编排过程中,为了加快大任务处理的效率,可以使用 Fan-out Fan-in 任务编排,将大任务分解成小任务,然后并行运行小任务,最后聚合结果。 由上图,可以使用 DAG(有向无环图)编排 Fan-out Fan-in 任务,子任务的拆分方式分为静态和动态,分别对应静态 DAG 和动态 DAG。动态 DAG Fan-out Fan-in 也可以理解为 MapReduce。每个子任务为 Map,最后聚合结果为 Reduce。 静态 DAG: 拆分的子任务分类是固定的,例如:在数据收集场景中,同时收集数据库 1 和数据库 2 中的数据,最后聚合结果。 动态 DAG: 拆分的子任务分类是动态的,取决于前一个任务的输出结果,例如:在数据处理场景中,任务 A 可以扫描待处理的数据集,为每个子数据集(例如:一个子目录)启动子任务 Bn 处理,当所有子任务 Bn 运行结束后,在子任务 C 中聚合结果,具体启动多少个子任务 B 取决由任务 A 的输出结果。根据实际的业务场景,可以在任务 A 中自定义子任务的拆分规则。 ACKOne分布式工作流 A...
相关文章
文章评论
共有0条评论来说两句吧...