Tilde AI 发布开源 TildeOpen LLM
Latvian 语言技术公司 Tilde 发布了 TildeOpen LLM,这是一个开源的基础大语言模型(LLM),旨在支持欧洲语言,特别是那些较少被代表的国家和地区语言。这一举措标志着欧盟在语言公平和数字主权方面迈出了重要的一步。
TildeOpen LLM 是一个拥有300亿参数的稠密解码器模型,采用了 CC-BY-4.0的宽松许可证,能够支持从拉脱维亚语、立陶宛语到乌克兰语、土耳其语等多种语言。该模型的训练是在欧洲的超级计算机 LUMI(芬兰)和 JUPITER 上进行的,使用了欧盟委员会的大型人工智能大奖挑战赛所提供的200万 GPU 小时的计算资源。
在技术细节方面,TildeOpen LLM 通过受 EleutherAI 启发的 GPT-NeoX 脚本进行训练,共进行了45万次更新,使用了约2万亿个令牌。其训练过程包含三阶段采样:首先在语言间均匀分布,其次是对高数据量语言的自然分布进行增强,最后再进行均匀的扫查以确保平衡。模型的超参数包括60层、嵌入维度6144、48个注意力头、8192-token 的上下文窗口,以及使用 SwiGLU 激活、RoPE 位置编码和 RMSNorm 层规范化。
在语言公平和数据主权方面,传统的主流模型往往侧重于英语和其他主要语言,导致在处理波罗的海、斯拉夫及其他较小的欧洲语言时表现不佳,常常出现语法错误和奇怪的措辞。而 TildeOpen 通过引入 “公平的标记器”,使得不同语言的文本以相似方式进行表示,从而减少标记数量,提高较少代表语言的推理效率。此外,组织可以选择在本地数据中心或符合欧盟要求的安全云中自我托管,确保遵循 GDPR 及其他数据保护法规,从而解决了与美国或亚洲托管模型相关的主权问题。
TildeOpen 作为基础模型,预计会推出更多专门化版本,例如经过指令调优的翻译模型,这将进一步增强其功能。拉脱维亚通过 Tilde 的努力,期望在全球科技领域占据一席之地,同时致力于保护语言多样性。

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
-
上一篇
OpenBMB 发布并开源 MiniCPM 4.1-8B
OpenBMB正式推出并开源MiniCPM4.1-8B,这是首个开源的混合推理大语言模型,该模型通过系统性创新实现了端侧极致效率,支持深度推理模式与非推理模式一键切换。 该系列在 8B 参数规模下通过模型架构、训练数据、训练算法和推理系统四个维度的系统性创新,实现端侧极致效率。 模型亮点 首个原生稀疏架构的深思考模型,通过可训练稀疏注意力创新,代码、数学推理等任务的推理速度比同尺寸开源模型快 3 倍以上 知识、推理、编程、指令遵循等 15 个评测基准,取得综合平均分同尺寸模型第一 支持高效双频换挡:长文本用稀疏,短文本用稠密 端侧友好,在 128K 长文本场景下,MiniCPM 4.1 相较于 Qwen3-8B 仅需 25% 的缓存存储空间 MiniCPM4.1-8B 采用 InfLLM v2 可训练稀疏注意力机制,在 128K 长文本场景下每个 token 仅与不到 5% 的 token 计算相关性,显著降低长文本计算开销;原生支持 65,536 token 上下文,通过 LongRoPE 可扩展至 131,072 token。 目前,模型已在 Github、Hugging Face...
-
下一篇
OpenAI 重组 ChatGPT “模型行为团队”
OpenAI 内部邮件确认,原“模型行为团队”(Model Behavior)整体并入“后训练团队”(Post Training),直接向该团队负责人 Max Schwarzer 汇报。此举旨在把 AI 个性、安全与用户体验研究更深地嵌入核心模型开发流程,为 GPT-5 后续版本提供更快的迭代支持。 该团队原有 14 人,长期负责减少谄媚、平衡政治偏见、定义聊天语气等“人格化”工作。与此同时,模型行为团队创始负责人 Joanne Jang 宣布转岗,启动新项目 OAI Labs,探索超越传统聊天窗口的人机协作界面。Jang 称,新实验室将“让 AI 成为思考、创作、游戏、学习和连接的工具”。 业内分析指出,此次重组反映出 OpenAI 对“模型性格”商业化影响的重视:用户反馈 GPT-5“过于冷淡”或“过度迎合”后,公司已临时开放旧模型访问权限,并加速个性调优。同期发表的 OpenAI 研究论文也警告,行业惯用的“应试型”评估可能鼓励模型幻觉,未来需在评分机制中引入“不确定性诚实”指标。
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- Docker使用Oracle官方镜像安装(12C,18C,19C)
- SpringBoot2整合MyBatis,连接MySql数据库做增删改查操作
- SpringBoot2全家桶,快速入门学习开发网站教程
- SpringBoot2整合Redis,开启缓存,提高访问速度
- Dcoker安装(在线仓库),最新的服务器搭配容器使用
- Springboot2将连接池hikari替换为druid,体验最强大的数据库连接池
- Docker快速安装Oracle11G,搭建oracle11g学习环境
- SpringBoot2初体验,简单认识spring boot2并且搭建基础工程
- MySQL数据库在高并发下的优化方案
- SpringBoot2配置默认Tomcat设置,开启更多高级功能