首页 文章 精选 留言 我的

精选列表

搜索[最权威安装],共10000篇文章
优秀的个人博客,低调大师

今天 GitHub 上值得说的,不是爆款,是 3 个加速狂魔

昨天前三名的 MoneyPrinterTurbo、microsoft/markitdown 和 liteparse 今天集体后退,前三名加起来才占了今天总星的 29%。但有意思的是,三个加速最快的项目各有各的方向——一个教 AI 搞"团队协作"、一个给 Claude Code 装"工程插件"、还有一个是能让你自己从零搓出各种技术的经典教程。今天没有一家独大,但每个方向都值得你动手试试。 这 4 个东西,今天值得装上玩玩 EveryInc/compound-engineering-plugin(+251 星,TypeScript)——如果你在用 Claude Code 写代码,这个插件能让它突然变"聪明"。它是个官方出品的"复合工程"插件,简单说就是帮 Claude Code 在处理复杂项目时,能同时跑多个子任务、跨文件联动、记住上下文。不用再担心它写到一半"忘记"前面的逻辑。去 github.com/EveryInc/compound-engineering-plugin 看 README,装到你的 Claude Code 项目里就行。今天涨 251 星不算多,但最近 3 天累计 2202 星,加速 12 倍——这玩意儿正在快速被圈子里的人装上。 EveryInc/compound-engineering-plugin revfactory/harness(+323 星,HTML)——这项目名字挺硬,"元技能"、"智能体团队"听着玄,但说白了就是:你告诉它"我想要一个能写文案、做海报、发推特的 AI 小组",它就能帮你设计出这几个角色,并生成它们各自需要的能力文件。如果你是做 AI 产品、或者想在自己的项目里搭一个多 Agent 协作系统,这个可以直接拿来当脚手架。去 github.com/revfactory/harness 看 README,它是个 HTML 项目,下载网页文件打开就能用。最近 3 天 1325 星,加速 10 倍,说明"Agent 团队编排"这个需求正在从概念走向工具。 revfactory/harness harry0703/MoneyPrinterTurbo(+1937 星,Python)——昨天第一,今天滑到第三,但热度一点没减。这项目就是"AI 帮你自动生成短视频",输入一个主题词,它自己写文案、找素材、配音、加字幕、出片。如果你是做自媒体的、搞电商的、或者公司需要批量出宣传视频的,这个直接装。Python 项目,去 github.com/harry0703/MoneyPrinterTurbo 看 README,pip install 或者克隆仓库跑脚本都行。今天涨 1937 星,最近 3 天累计 22290 星,加速 3.5 倍。虽然名次掉了,但它是今天星数增量最多的一个。 harry0703/MoneyPrinterTurbo codecrafters-io/build-your-own-x(+1158 星,Markdown)——这不是工具,而是一个"教程目录"。它告诉你如何从零开始造一个数据库、一个 Git、一个操作系统、一个区块链……如果你是个想深入理解底层原理的开发者,或者准备面试想展现"我写过自己的前端框架",这个就是你的黄金清单。Markdown 项目,去 github.com/codecrafters-io/build-your-own-x 直接看 README 里列出来的教程链接。今天涨 1158 星,7 天累计 9706 星,说明"学会造轮子"这件事,永远有人需要。 还有这些 microsoft/markitdown(+2798 星):微软出的,把各种文档(PDF、Word、PPT)转成 Markdown,昨天第二今天掉到第 12,但增量还在,做数据处理的可以看看。 D4Vinci/Scrapling(+606 星):Python 爬虫工具,如果你需要从网页抓数据,这个比 Scrapy 轻量。 FareedKhan-dev/train-llm-from-scratch(+626 星):Jupyter Notebook 教程,教你从零训练一个大模型,适合想理解 LLM 原理的学生或研究者。 supermemoryai/supermemory(+264 星):AI 记忆工具,帮你管理对话历史。 anthropics/claude-code(+489 星):Anthropic 官方的 Claude Code 仓库,持续更新中。 今天圈子在动什么 今天没有某个赛道集中爆发,但一个有意思的迹象是:3 个加速最快的项目都在解决同一个问题——让 AI 在复杂任务里更可靠。compound-engineering-plugin 帮 Claude Code 管项目上下文,harness 教你怎么编排 Agent 团队,MoneyPrinterTurbo 则是把"从选题到出片"的完整流程交给 AI。这不像前几周"今天冒出一个爆款 Agent"那种突然性,而是说明:当大家都在用 AI 做正经事时,"怎么让 AI 别掉链子"正在成为新的刚需。

优秀的个人博客,低调大师

滴滴史上严重服务故障,罪魁祸首是底层软件 or “降本增笑”?

2023年11月27日晚间,滴滴因系统故障导致App服务异常,不显示定位且无法打车。11月27日晚,滴滴出行进行了回复:非常抱歉,由于系统故障。 2023年11月28日早间,滴滴出行消息称,网约车等服务已恢复,骑车等在陆续修复中。11月28日,在滴滴发出公告的同时,记者在上海、深圳等地使用滴滴呼叫网约车,发现网约车功能并未恢复使用,网络加载异常,仍无法打车。11月28日,滴滴向记者回应称,网约车服务已恢复,司机乘客权益陆续恢复补发。 11月29日,滴滴再次发文致歉,称初步确定事故起因是底层系统软件发生故障。 来源:https://weibo.com/2838754010/NuMAAaUEl 在滴滴官方发布这份公告之前,已经有资深IT技术人士分析:“从表现上看,打车、共享单车全挂,不同的业务板块之间应该是有隔离的,说明问题出在更加底层的基础设施。攻击者一般只能访问到应用层,基础设施访问不到。要么是被攻击者打穿,要么是自己系统操作不慎挂了。即便是前者,也算是一种系统缺陷,才会被打穿。” 360安全专家认为,滴滴闪崩背后的技术原因可能有六种: 第一,系统更新升级过程中出现了编程错误、逻辑错误或未处理的异常情况:一般情况下,互联网厂商发布更新都会在晚上,与滴滴发生故障的时间也能对应,当然业务升级维护是放量更新,但现在滴滴全平台、全业务都故障了,说明肯定是他“家里”的问题。 第二,服务器故障:比如滴滴的核心机房,可能恒温恒湿环境出了问题,导致服务器过热、CPU烧了,或者核心机房所在地发生了自然灾害如地震、洪水、海啸等,这种情况下,硬件需要重新更换,里面的服务软件也需要重新配置,恢复周期相对较长,但这个可能性比较小。 第三,第三方服务故障:滴滴的后台架构可能使用了第三方服务或者组件。如果第三方出了问题,也可能会影响滴滴的正常运行。但出于安全性考虑,滴滴可能不会将核心业务托管给第三方,不过这个可能性也较小。 第四,DDOS攻击:黑客采用分布式拒绝服务的方式,抢占了大量的服务器资源,导致用户无法访问,但这个不太可能,因为DDos不会导致数据出错,而且滴滴从体量上来说,有足够的成本和能力去对抗。 第五,其他网络攻击:某些黑灰产团伙可能会通过拖库盗取数据,然后在暗网上售卖,在这个过程中不排除会有误操作,破坏了数据库。 第六,勒索病毒:网络攻击黑客对滴滴的底层数据、业务代码进行了加密。据披露现象,用户的账单和打车数据都算错了,存在一定可能是滴滴为了避免更大损失主动暂停了业务。近期勒索攻击事件屡屡发生,月初,某金融机构就是因为遭遇勒索病毒攻击造成了业务停摆。 不过也有网络安全公司专家认为,如果是来自外部的黑客攻击,公司一般会在第一时间进行声明。他猜测更集中于滴滴发生了内部重大业务调整,或有新业务接入原系统,但没有做好预案,导致关联业务或关联系统出现重大故障,这是大公司系统故障最常见的原因。 因此对于滴滴此次大规模的长时间故障,有行业人士认为,降本增效可能也是原因之一。 该人士认为,互联网公司核心业务频繁宕机,且长时间宕机,是降本增效的附属品之一。系统投资少了,维护资源少了,程序员更换频繁了,BUG就多。 他举例称,一般在业务上行阶段都有冗余,为了迎接随时爆发的订单,上行阶段要维持负载的上限不能过大,比如平时70%,这样遇到一个小爆发不用担心会出问题,足以应对小高峰;但是下行期的逻辑就不同了,负载很高的时候抗一抗就行了,虽然后面遇到小高峰可能会难受,但是随着时间的推移总体负载会下降。 最后来看一下网传的消息,有同行说滴滴这次严重故障是K8S的问题导致,当时SRE工程师定位了三个小时没定位到。

优秀的个人博客,低调大师

「X」Embedding in NLP|一文读懂 2023 年流行的 20 个 NLP 模型

在上一篇文章中,我们已经科普了什么是自然语言处理(NLP)、常见用例及其与向量数据库的结合。今天,依然是「X」Embedding in NLP 系列专题,本文为初阶第二篇,我们将深入介绍在 2023 年爆火的大语言模型 NLP 模型,包括 BERT、XLNet 等基础模型和 GPT、PaLM 等。 01.火爆 2023 年的 10 大大语言模型 大语言模型(LLM)是一种机器学习模型,可以执行各种 NLP 任务,包括文本翻译、回答问题、根据知识库分类和生成词汇等。大语言模型中的“大”体现在其架构使用的参数数量上,常见的 LLM 都包含数十亿个参数。以下是在 2023 年爆火且备受关注的 LLM。 OpenAI 推出的 GPT 系列 *GPT,全称 Generative pre-trained transformers,即生成式预训练 Transformer 模型 GPT-3 于2021年发布,包含 1750 亿个参数。 能够完成翻译、问答、写作论文,甚至生成代码等任务。 从模型架构而言,GPT-3 是只带有解码器(decoder)的 transformer 模型。 是最后一个由 OpenAI 公开参数数量的 GPT 模型。 自 2022 年 9 月起由微软独家使用。 GPT-3.5 2022 年推出的升级版 GPT 模型,包含参数更少。 ChatGPT 训练所用的模型是基于 GPT-3.5 模型微调而来的。GPT-3.5 一经推出即迅速走红,短短五天内吸引 100 万用户,用户总数在 2 个月内达到 1 亿。 GPT-3.5 模型基于截至 2021 年 9 月的数据进行训练,比之前版本的模型更具有时效性。 必应(Bing)搜索引擎中最初集成了 GPT-3.5,但目前使用的是 GPT-4。 GPT-4 GPT 系列中的最新版本,于 2023 年发布。 GPT-4 是多模态模型,支持图像和文本类型的输入。 在微软 Azure AI 的人工智能超级计算机上训练,比以往任何模型都更具创造力和协作性。 Google 推出的 PaLM 2 于 2023 年推出,展现 Google 在机器学习和 Responsible AI 领域积累的成果。 相比 PaLM,PaLM 2 基于并行多语言文本和更大的语料库进行预训练。 在高级推理、翻译和代码生成方面表现出色。 Meta 和 Microsoft 推出的 LLama2 于 2023 年发布,提供三种参数规格(70 亿、130 亿和 700 亿)的基础模型。 LLama 2 Chat 包括基础模型和针对对话功能微调的模型。 功能丰富,性能强大,专为查询和自然语言理解等任务设计。 Meta 专注于打造教育型应用产品,因此 LLaMA-2 是适用于 EdTech 平台理想的 AI 助手。 Anthropic 推出的 Claude 2 于 2023 年推出,擅长复杂的推理任务。 聚焦于 Constitutional AI,引导 AI 根据一些原则或规则进行自我完善和监督,避免产生有害或不友善的输出。 Claude 2 是一个友好的助手,能够完成用户发出的各种自然语言指令。 xAI 推出的 Grok-1 埃隆·马斯克的公司 xAI 于 2023 年宣布推出 Grok-1,用于巧妙回答几乎所有问题。 灵感来源于《银河系漫游指南》。 通过 𝕏 平台实时获取真实世界中的知识。 技术创新研究所(Technology Innovation Institute)推出的 Falcon 于 2023 年开源的模型。 包含 1800 亿参数,参数数量超过 Hugging Face Open LLM 排行榜上的 Llama。 基于高质量数据集训练,数据集中包含文本和代码,涵盖各种语言和方言。 Cohere 推出的 Cohere 2022 年由加拿大初创公司 Cohere 推出的开源多语言模型。 基于多样的数据集训练,能够理解超过 100 种语言的文本。 Oracle 和 Salesforce 产品中已接入 Cohere,主要用于语言生成、文本内容概括和情感分析等任务。 02.10 大基础 NLP 模型 BERT(基于 Transformer 的双向编码器表示技术) BERT 最初于 2018 年由 Jacob Devlin 在其论文《BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding》中首次提出。 BERT 模型的主要突破是,它在训练过程中查看文本时,以双向方式扫描文本,不是从左到右,也不是从左到左和从右到左的组合。 BERT 模型有两种配置——BERT(base)和 BERT(large),区别在于可配置参数数量。BERT(base)包含 1.1 亿参数, BERT(large)包含 3.45 亿参数。 XLNet XLNet 于 2019 年在论文《XLNet: Generalized Autoregressive Pretraining for Language Understanding》中发布。 XLNet使用排列语言建模(Permutation Language Modeling) 来融合自回归(autoregressive, AR)和去噪自编码(autoencoding, AE) 模型的优点。 传统的模型基于前一个词的上下文预测句子中的词。但与之不同的是,XLNet 的排列语言建模考虑了词之间的相互依赖关系。 XLNet 性能比 BERT 提高了 2-15%。 RoBERTa(强力优化的 BERT 方法) RoBERTa 于 2019 年在论文《RoBERTa: A Robustly Optimized BERT Pretraining Approach》中提出。 RoBERTa 改进了 BERT 的架构和训练流程。具体而言,RoBERTa 去掉下一句预测(NSP)任务,采用了更大的训练数据集,并使用了动态掩码替换静态掩码。 RoBERTa 性能比 BERT 提高了 2-20%。 ALBERT(轻量级的 BERT) ALBERT 模型于 2019 年在论文《ALBERT: A Lite BERT for Self-supervised Learning of Language Representations》中提出。 ALBERT 基于 BERT 模型改进,其主要亮点是在保持性能的同时显著减少了参数数量。 AlBERT 实现了跨层参数共享。也就是说,12 层 Encoder 共享一套参数。而 BERT 中每层 Encoder 都有一组参数。 StructBERT StructBERT 于 2019 年在论文《StructBERT: Incorporating Language Structures into Pre-training for Deep Language Understanding》中提出。 StructBERT 基于 BERT,将语言结构信息引入到预训练任务中。 StructBERT 还引入了单词结构目标(WSO),它有助于模型学习单词的排序。 T5(文本到文本的 Transformer) T5 在 2019 年的论文《Exploring the Limits of Transfer Learning with a Unified Text-to-Text Transformer》中被提出。T5 全称为“Text-To-Text Transfer Transformer”。 T5 作者还发布了一个数据集,取名为“Colossal Clean Crawled Corpus (超大型干净爬取数据)”,简称 C4。 T5 将所有 NLP 任务都转化成 Text-to-Text (文本到文本)任务。 T5 模型提供 5 种不同的参数配置:T5-small(6000 万参数)、T5-base(2.2 亿参数)、T5-large(7.7 亿参数)、T5-3B(30 亿参数)、T5-11B(110 亿参数)。 SentenceTransformers SentenceTransformers 最初于 2019 年在发论文《Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks》中发表。 SentenceTransformers 是一个可以用于句子、文本和图像 embedding 的 Python 库 SentenceTransformers 可以计算超过 100 种语言的句子或文本 embedding。 SentenceTransformers 框架基于 PyTorch 和 Transformers,提供许多针对各种任务调优的预训练模型。 ERNIE(通过知识集成的增强表示) ERNIE 由百度开发,于 2019 年在论文《ERNIE: Enhanced Language Representation with Informative Entities》中首次被介绍,并由百度的研究人员在计算语言学协会(ACL)会议上展示。 ERNIE 将现实知识整合到预训练的语言模型中,从而理解人类语言的细微差别并提高各种 NLP 任务的表现。 ERNIE 提供不同版本。而且,ERNIE 随时间推移不断更新和完善,从而在广泛的 NLP 任务上取得更好的性能。 CTRL(可控文本生成) CTRL 由 Salesforce Research 在 2019 年 NeurIPS 论文《CTRL: A Conditional Transformer Language Model》中提出。 CTRL 允许用户控制生成文本的风格和内容。 CTRL 模型能够生成多样且可控的文本,用户对语言生成过程更可控。 ELECTRA ELECTRA 在 2020 年的论文《ELECTRA: Pre-training Text Encoders as Discriminators Rather Than Generators》中提出。 ELECTRA 提出了新的预训练任务和框架,把生成式的 Masked language model(MLM) 预训练任务改成了判别式的 Replaced token detection(RTD) 任务,判断当前token是否被语言模型替换过。 ELECTRA体积越小,相比于BERT就提升得越明显。

优秀的个人博客,低调大师

古老的 npm 包 request 已弃用,每周下载量达 1400 万+

去年我们报导过 HTTP 客户端 request 库将被弃用的计划,目前该项目的 npm 与 GitHub 主页均已显示,自 2020 年 2 月 11 日起,request 已完全弃用,预计不会有新的变更。 request 是添加到 npm 包仓库最早的模块之一,有众多应用依赖于request,目前其每周的下载量基本都在 1400 万以上,足见它在 HTTP 领域与 npm 中的地位。 但随着现代 JavaScript 的发展,request 的局限性也愈发体现出来,其核心模式也稍显过时。项目发起人 Mikeal Rogers表示也曾尝试通过改变以适应变化,但后来发现可行性非常低,因为兼容性问题很大。因此他决定废弃 request,重新打造一个项目。 在 Mikeal 写于去年 3 月份的说明中,他表示:“对于 JavaScript 生态,request 可以做的最有价值的事情是进入维护模式,并停止考虑新特性或主要版本。”同时他也对弃用 request 作了具体规划。如今 request 已经正式宣告退出,建议开发者尽快迁移。

资源下载

更多资源
Mario

Mario

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长,特征是大鼻子、头戴帽子、身穿背带裤,还留着胡子。与他的双胞胎兄弟路易基一起,长年担任任天堂的招牌角色。

腾讯云软件源

腾讯云软件源

为解决软件依赖安装时官方源访问速度慢的问题,腾讯云为一些软件搭建了缓存服务。您可以通过使用腾讯云软件源站来提升依赖包的安装速度。为了方便用户自由搭建服务架构,目前腾讯云软件源站支持公网访问和内网访问。

Rocky Linux

Rocky Linux

Rocky Linux(中文名:洛基)是由Gregory Kurtzer于2020年12月发起的企业级Linux发行版,作为CentOS稳定版停止维护后与RHEL(Red Hat Enterprise Linux)完全兼容的开源替代方案,由社区拥有并管理,支持x86_64、aarch64等架构。其通过重新编译RHEL源代码提供长期稳定性,采用模块化包装和SELinux安全架构,默认包含GNOME桌面环境及XFS文件系统,支持十年生命周期更新。

WebStorm

WebStorm

WebStorm 是jetbrains公司旗下一款JavaScript 开发工具。目前已经被广大中国JS开发者誉为“Web前端开发神器”、“最强大的HTML5编辑器”、“最智能的JavaScript IDE”等。与IntelliJ IDEA同源,继承了IntelliJ IDEA强大的JS部分的功能。

用户登录
用户注册