字节跳动张一鸣近年首次公开露面,称很多人才潜力没有被充分挖掘
10月10日,上海徐汇知春创新中心正式开业,该创新中心由字节跳动创始人张一鸣、上海交通大学ACM班创始人俞勇教授共同发起。作为民办非营利性机构,中心计划招聘对泛计算机和人工智能感兴趣的年轻人。
据了解,本次开业,张一鸣也来到了现场并发言,他提到,自己长期关注人才招聘和培养,注意到很多人才潜力没有被充分挖掘,他以机器学习模型中的过拟合(Overfit)现象作为类比,有的人才可能专业知识扎实,也有高精准的技能,但面对创新任务就不行了。
值得注意的是,余勇作为中国最早的计算机教育布道者,和他的学生林晨曦、戴文渊、胡哲人、李磊、李沐、陈天奇、王敏捷、张伟楠、郑曌等等,共同书写了无数段传奇故事。而这直接推动了此后中国计算机技术的发展,ACM班也在后来被冠以“人工智能CTO摇篮”的盛誉。

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
-
上一篇
快手 Kwaipilot 团队开源 KAT-Dev-72B-Exp
快手 Kwaipilot 团队发布了 KAT-Dev-72B-Exp。 KAT-Dev-72B-Exp 是 KAT-Coder 模型强化学习的实验版本,在软件开发能力评测基准 SWE-Bench Verified 上取得了74.6%的卓越性能,在开源模型领域创下新纪录。 据介绍,该模型基于快手自研 SeamlessFlow 工业级强化学习框架,通过创新的数据平面架构实现了训练逻辑与 Agent 的完全解耦,成功支持多智能体和在线强化学习等复杂场景。 针对复杂 Agent 场景的技术挑战,团队创新性地引入 Trie Packing 机制,并对训练引擎进行了重构优化,使模型能够高效地在共享前缀轨迹上开展训练。通过难度感知的策略优化,实现了探索与利用的平衡,并结合基于开源仓库构建的大规模端到端可验证软件工程任务,KAT-Dev-72B-Exp 在编程领域展现出强大的能力。 免费试用 KAT-Coder:https://www.streamlake.ai/product/kat-coder KAT-Dev-72B-Exp 开源地址:https://huggingface.co/Kwaipilo...
-
下一篇
LLM 训练过程的网络通信;InfiniBand 真的是 “封闭” 技术吗?
编者按: 为什么训练大语言模型需要如此苛刻的网络条件?InfiniBand 真的是"封闭"技术吗?英伟达在 AI 网络领域的优势究竟从何而来? 文章从 LLM 训练的梯度下降过程切入,生动阐释了为何在包含数万 GPU 的集群中,哪怕一个 GPU 延迟 20 微秒,都会造成算力的巨大浪费。作者随后对比了企业网络、超大规模云网络和高性能计算网络三种场景,指出只有 HPC 网络的设计理念与 AI 训练需求高度契合。文章还破除了一个普遍的认知误区:InfiniBand 并非 Mellanox 或英伟达的私有技术,而是 1999 年由 180 余家企业联合制定的开放行业标准;同样,从 Mellanox 时代就开始推动的 RoCE 协议,也为今天的 AI 以太网方案(如 Spectrum-X 和 UEC 1.0)奠定了基础。 作者 | Austin Lyons 编译 | 岳扬 本文将解析低延迟与低抖动如何主导分布式训练的迭代效率,指出现有传统以太网技术的局限性,并阐释 InfiniBand 为何能成为高性能计算锁步工作负载的默认网络架构。 我们还将厘清一些常见的认知误区(别担心,我在撰写本文前也曾...
相关文章
文章评论
共有0条评论来说两句吧...