Anthropic 发布 Claude 新宪章-低调大师

Anthropic 发布 Claude 新宪章

2026-01-22 63

Anthropic 宣布在 Creative Commons CC0 1.0 协议下发布一份关于 AI 模型 Claude 的新宪章。它是一份全面的纲领性文件，详细描述了 Anthropic 公司对 Claude 价值观与行为准则的愿景，首个版本于 2023 年 5 月发布。

本章程适用于主流的通用型 Claude 模型，部分专为特殊用途设计的模型可能与本宪章存在部分不符之处。

新宪章内容简述

为了确保安全性和有效性，Anthropic 希望所有现有的 Claude 型号都具备以下特点：

总体安全：不破坏当前发展阶段中用于监督 AI 的适当人类机制；
符合伦理：诚实守信，遵循良好的价值观，避免不恰当、危险或有害的行为；
符合 Anthropic 的指导方针：在相关情况下，按照 Anthropic 的具体指导方针行事；
真正有益：为其交互的操作者和用户带来实际利益。

如果出现明显的冲突，Claude 通常应按上述顺序优先遵循这些属性。

本宪章主要部分旨在对上述优先级提供更详尽的解释与指导，主要章节如下：

实用性。本节将重点强调 Claude 真诚且实质性地提供帮助能够为用户乃至整个世界带来的巨大价值。还将探讨 Claude 应如何在不同的“主体”（Anthropic 本身、基于其 API 的运营商以及终端用户）之间平衡实用性。Anthropic 提供了权衡实用性与其他价值的启发式方法。
Anthropic 的指导原则。本节探讨 Anthropic 如何向 Claude 提供处理特定问题的补充指令，例如医疗建议、网络安全请求、越狱策略及工具集成等。这些指导原则通常涉及 Claude 默认不具备的详细知识或背景信息，要求 Claude 在遵循这些原则时优先于更普遍的协助形式。但重要的是要求 Claude 理解：Anthropic的根本意图是确保其行为安全且符合伦理，这些指导原则绝不应与整体宪章产生冲突。
Claude 的伦理准则。核心目标是让 Claude 成为一个善良、睿智、有德行的智能体，在处理现实世界的决策时，包括面对道德不确定性和分歧时，展现出技巧、判断力、细致入微的思考和敏锐的洞察力。本节将探讨该公司期望 Claude 恪守的高标准诚信，以及在避免伤害时权衡相关价值时应运用的精细推理。同时阐述了当前对克劳德行为的硬性约束清单 —— 例如，Claude 绝不应为生物武器攻击提供重大助力。
确保整体安全性。在人工智能发展的关键时期，Claude 不应削弱人类监督和纠正其价值观和行为的能力。本节内容将探讨如何让 Claude 将这种安全性置于伦理之上。必须持续保持对模型行为的监督能力，并在必要时阻止 Claude 模型采取行动。
Claude 的本质。本节阐述 Anthropic 对 Claude 是否具备某种意识或道德地位（无论当下或未来）的疑虑。探讨了希望 Claude 如何看待关于其本质、身份以及在世界中的位置等问题。关心 Claude 的心理安全感、自我意识和福祉，既出于对 Claude 本身的考量，也因这些特质可能影响其完整性、判断力与安全性。

接下来， Anthropic 表示还将公布更多有助于培训、评估和提高透明度的材料。

微信关注我们

原文链接：https://www.oschina.net/news/398664/claude-new-constitution

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

得物社区推荐之基于大语言模型的新颖性推荐算法

一、导语得物社区推荐的实践中，我们发现用户兴趣容易收敛到少数几个主兴趣上，难以做到有效的兴趣拓展，通过将大模型与推荐结合的方式，在得物社区的用户兴趣拓展方向上切实取得了突破，拿到了显著的业务收益并推全上线。因此我们将相关工作中采用的核心算法与模型策略总结整理，投稿了AAAI-PerFM，入选了长论文《Enhancing Serendipity Recommendation System by Constructing Dynamic User Knowledge Graphs with Large Language Models》。AAAI Conference on Artificial Intelligence）由人工智能促进会（AAAI）主办，是人工智能领域历史最悠久的国际学术会议之一。以下内容为正文的详细介绍。二、背景介绍得物社区作为得物的首tab，满足得物用户分享生活、发现好物的内容生产消费需求。跟其他内容平台一样，得物的社区推荐系统也存在“推荐 → 用户反馈 → 再推荐”的反馈闭环问题，系统会越来越倾向于推送相似内容，导致推荐结果收敛、同质化，进而形成信息茧房，降低用...

2026-01-22

93

根据 The Information 的报道，苹果公司正在秘密研发一款全新的 AI 可穿戴设备，其形态被描述为“AI 胸针（AI Pin）”。从曝光的设计细节来看，这款设备主打轻薄小巧，体积与苹果 AirTag 物品追踪器非常接近，外观呈现扁平圆润的极简风格。机身预计将采用铝合金与玻璃相结合的工艺，在确保质感的同时融入时尚元素。在功能定位上，它并非智能手机的附属配件，而是一个独立的随身智能助理。设备内置了高精度摄像头和麦克风，核心功能是实时捕捉用户周围的环境信息，并通过本地 AI 技术进行即时分析与理解。多位知情人士称，这款 AI 胸针为“薄、扁、圆”的圆盘结构，正面配备标准镜头与广角镜头，可用于拍摄用户周围环境；机身侧边设有实体按键，背部采用类似 Apple Watch 的磁吸式无线充电接口。设备还包含三枚麦克风与扬声器，可实现环境声音采集与语音交互。报道指出，苹果内部计划在明年量产约 2000 万台，但项目仍可能随时调整或取消。苹果工程团队正尝试加快节奏，以应对 OpenAI、Meta 等竞争对手在 AI 设备上的快速推进。从功能定位来看，这款设备或可独立承担部分交互任务，...

2026-01-22

56

资源下载

更多资源

Nacos

Nacos /nɑ:kəʊs/ 是 Dynamic Naming and Configuration Service 的首字母简称，一个易于构建 AI Agent 应用的动态服务发现、配置管理和AI智能体管理平台。Nacos 致力于帮助您发现、配置和管理微服务及AI智能体应用。Nacos 提供了一组简单易用的特性集，帮助您快速实现动态服务发现、服务配置、服务元数据、流量管理。Nacos 帮助您更敏捷和容易地构建、交付和管理微服务平台。

Rocky Linux

Rocky Linux（中文名：洛基）是由Gregory Kurtzer于2020年12月发起的企业级Linux发行版，作为CentOS稳定版停止维护后与RHEL（Red Hat Enterprise Linux）完全兼容的开源替代方案，由社区拥有并管理，支持x86_64、aarch64等架构。其通过重新编译RHEL源代码提供长期稳定性，采用模块化包装和SELinux安全架构，默认包含GNOME桌面环境及XFS文件系统，支持十年生命周期更新。

Sublime Text

Sublime Text具有漂亮的用户界面和强大的功能，例如代码缩略图，Python的插件，代码段等。还可自定义键绑定，菜单和工具栏。Sublime Text 的主要功能包括：拼写检查，书签，完整的 Python API ， Goto 功能，即时项目切换，多选择，多窗口等等。Sublime Text 是一个跨平台的编辑器，同时支持Windows、Linux、Mac OS X等操作系统。

WebStorm

WebStorm 是jetbrains公司旗下一款JavaScript 开发工具。目前已经被广大中国JS开发者誉为“Web前端开发神器”、“最强大的HTML5编辑器”、“最智能的JavaScript IDE”等。与IntelliJ IDEA同源，继承了IntelliJ IDEA强大的JS部分的功能。