为什么大语言模型 OpenAI o1 有时候会用中文思考?
最近 X 上在讨论为什么大语言模型 O1,有时候会用中文思考?
转发一段 Hugging Face 王铁震老师的想法:
我一直觉得,会两种语言不仅仅是能用两种语言交流,而是能根据话题和场景,自然地用更合适的语言去思考。比如,我更喜欢用中文做加减乘除,因为每个数字只有一个音节,算起来干脆利落。但一提到 “无意识偏见” 这种话题,我就会不自觉地切换到英语,毕竟这些概念我最开始就是从英语里学来的。
这让我想到编程语言:大多数程序用什么语言都能写,但我还是会用 Bash 写命令行脚本,用 Python 搞机器学习,因为每种语言都有自己最顺手的地方。现实中的语言也一样,我们会根据语言的特点和自己的习惯,选择最顺手的语言去表达特定的内容。
这也是为什么我觉得,在训练大语言模型(LLM)时,保持所有语言和文化的多样性和包容性特别重要。就像哲学家维特根斯坦说的:“语言的界限就是世界的界限。” 只有包容每一种语言的细微差别,才能让模型学到更全面的思维。即使两种语言里的两个词意思一样,它们在模型中的 Embedding 也可能完全不同,因为它们背后的文化和使用方式截然不同。在我看来,这种包容性不仅能打造更公平、更准确的模型,还能让它处理更多样化的任务,汇聚全人类的智慧。
- 微博 海辛Hyacint

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
开源日报 | DeepSeek推出移动版APP;开源古汉语模型;论文的标题越来越花里胡哨;“AGI预言”突然增多只是炒作吗?
欢迎阅读 OSCHINA 编辑部出品的开源日报,每天更新一期。 # 2025.1.13 今日要闻 华为余承东 2025 全员信:鸿蒙三分天下有其一,10 万个原生应用是未来半年到一年关键目标 1 月 13 日消息,华为常务董事、终端 BG 董事长、智能汽车解决方案 BU 董事长余承东发布了新年第一封全员信。余承东表示:“时代的洪流冲天下,鸿蒙三分天下有其一,是历史赋予我们这代终端人的责任与使命。” 他还提到,2025 年鸿蒙生态要压强投入,10 万个应用是生态成熟标志,这是未来半年到一年时间的关键目标。 DeepSeek 推出移动版 APP DeepSeek 推出了官方移动版 APP,提供深度思考和联网搜索功能,可以生成内部思维链,逐步分析问题并得出结论。此外,该 APP 还提供图片、文件等多模态输入模式。 据介绍,该 APP 由 DeepSeek-R1-Lite 模型和 DeepSeek V3模型提供支持。 英伟达与美国半导体协会反对新一轮芯片出口禁令 受美国拜登政府计划对人工智能芯片出口实施新限制措施消息的影响,1 月 10 日美股开盘后,英伟达股价大跌超 3%,AMD 股价大跌近...
- 下一篇
LLM 带来了“编程末日”?计算机专业教授:别做梦了!
LLM会把编程淘汰吗?近日,哥本哈根大学的计算机教授Hans Hüttel通过分析计算理论中的定理所施加的基本限制,得出结论:距离编程的终结还远得很。 其主要观点如下: 计算复杂性理论的限制 PSPACE完备问题(PSPACE-complete)的挑战:从规范生成正确的程序代码是计算机科学的核心问题,即程序综合问题。这一问题在计算复杂性理论上是困难的,因为PSPACE完备问题的决策算法在运行时间上随输入大小呈指数级增长,即使是中等大小的输入,算法也可能非常慢。 QBF规范语言的难题:使用完全量化布尔公式(QBF)作为规范语言的问题也是PSPACE完备的,这进一步证实了生成程序的困难。 程序综合方法的局限性 近似方法的不足:一些程序综合方法是近似的,无法构建满足完整规范的程序,比如静态程序分析工具,而且这些工具一般只考虑特定的程序属性。 资源消耗大的方法:另一些方法则需要大量内存或大量时间才能构建程序,比如使用SMT求解器的方法和基于类型的开发形式(例如基于Hindley-Milner类型系统的方法)。 狭窄领域的方法:还有一些方法只能在合理的资源限制或狭窄的问题域中进行综合,比如用于生...
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- CentOS7设置SWAP分区,小内存服务器的救世主
- Mario游戏-低调大师作品
- Docker使用Oracle官方镜像安装(12C,18C,19C)
- 2048小游戏-低调大师作品
- Jdk安装(Linux,MacOS,Windows),包含三大操作系统的最全安装
- MySQL8.0.19开启GTID主从同步CentOS8
- CentOS8安装Docker,最新的服务器搭配容器使用
- CentOS8安装MyCat,轻松搞定数据库的读写分离、垂直分库、水平分库
- CentOS7编译安装Cmake3.16.3,解决mysql等软件编译问题
- CentOS7,CentOS8安装Elasticsearch6.8.6