Hugging News #0626: 音频课程更新、在线体验 baichuan-7B 模型-低调大师

Hugging News #0626: 音频课程更新、在线体验 baichuan-7B 模型

2023-06-28 952

每一周，我们的同事都会向社区的成员们发布一些关于 Hugging Face 相关的更新，包括我们的产品和平台更新、社区活动、学习资源和内容更新、开源库和模型更新等，我们将其称之为「Hugging News」，本期 Hugging News 有哪些有趣的消息，快来看看吧！

重要更新

邀请参与全球开源 AI 游戏开发挑战赛

还有 11 天，已经有 900 多名参与者报名！借助人工智能工具释放你的创造力，一起打破游戏开发的边界。本挑战赛将在北京时间 2023 年 7 月 8 日凌晨 1 点到 10 日凌晨 1 点间举行，限时 48 小时，查看这篇文章了解更多。

参与 OpenVINO™ DevCon 中国系列工作坊活动

生成式 AI 领域一直在快速发展，许多潜在应用随之而来，这些应用可以从根本上改变人机交互与协作的未来。邀请各位社区成员们参加我们和英特尔联合举办的 OpenVINO™ DevCon 中国系列工作坊活动！这是一次线上活动，时间是 6 月 30 日下午 13:30-14:50，请使用下面这个链接注册活动，或者查看我们过去的文章了解更多活动详细内容。

注册活动: https://huggingface.link/devcon

开源生态更新

`gradio deploy` 直接将你的 Gradio 应用部署到 Hugging Face！

这是把 Gradio 应用从本地部署到 🤗Spaces 的最快方法: gradio deploy，快来试试看吧！

🧨Diffusers 库支持 UniDiffuser pipeline

UniDiffuser 是清华大学朱军老师团队提出的一个为多模态设计的概率建模框架，你可以在机器之心的这篇文章里了解更多《清华朱军团队开源首个基于 Transformer 的多模态扩散大模型，文图互生、改写全拿下》，感谢社区成员 dg845 的贡献，现在你已经可以在 🧨Diffusers 中使用支持 UniDiffuser。

查看文档: https://hf.co/docs/diffusers/main/en/api/pipelines/unidiffuser 查看 UniDiffuser 开源代码: https://github.com/thu-ml/unidiffuser

PerSAM

只需提供一张包含目标物体和参考掩码的图像，PerSAM (Personalization Segment Anything Model) 就可以在其他图像或视频中准确地分割目标物体，无需额外的训练。PerSAM 旨在自动对 Segment Anything Model (SAM) 进行个性化定制，以在照片相册中自动分割特定的视觉概念，例如你的宠物狗狗。

论文页面: https://hf.co/papers/2305.03048 Space 应用: https://hf.co/spaces/justin-zk/Personalize-SAM Notebooks 链接: https://github.com/NielsRogge/Transformers-Tutorials/tree/master/PerSAM GitHub 链接: https://github.com/ZrrSkywalker/Personalize-SAM

MQA 技术: 更长的文本、更少的内存占用

由于在多头注意力机制之间共享关键矩阵和值矩阵，MQA (Multi-query attention) 可以使用更少的内存能够生成更长的文本，这个技术的出现为使用大型语言模型带来了更多的可能性，生成更长的文本变得更加高效和便捷，现在已经有两个采用了 MQA 的语言模型: StarCoder 14B 和 Falcon 7B/40B。

查看论文: https://hf.co/papers/1911.02150

开源生态压轴出场

baichuan-7B: 免费可商用大语言模型

baichuan-7B 是由百川智能开发的一个开源的大规模预训练模型。基于 Transformer 结构，在大约 1.2 万亿 tokens 上训练的 70 亿参数模型，支持中英双语，上下文窗口长度为 4096。在标准的中文和英文权威 benchmark (C-EVAL/MMLU) 上均取得同尺寸较好的效果。

即刻体验百川-7B 模型: https://hf.co/spaces/ysharma/baichuan-7B

ChatGLM2-6B 重磅发布，荣登 Hugging Face 趋势榜单之首！

ChatGLM2-6B 是开源中英双语对话模型 ChatGLM-6B 的第二代版本，在保留了初代模型对话流畅、部署门槛较低等众多优秀特性的基础之上，ChatGLM2-6B 具有更强大的性能、更长的上下文和更高效的推理。

了解更多: https://hf.co/THUDM/chatglm2-6b

以上就是上周的 Hugging News，新的一周开始了，我们一起努力！

微信关注我们

原文链接：https://www.oschina.net/news/247127/hugging-news-0626

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

我国人工智能已进入全球第一梯队

6月28日下午消息，中国互联网协会副理事长黄澄清在GPT产业联盟成立大会上表示，近年来以GPT为代表的公司蓬勃兴起，推动了生成式AI的快速发展，相关产品在极短的时间内吸引了全球的关注。黄澄清介绍道，随着GPT大模型带来的产业发展变革，人工智能在国际竞争和经济增长中发挥着重要性。我国始终高度重视人工智能产业的发展，近年来也取得了一些成效。政策方面，十九大以来，国家陆续出台了一系列的政策文件，为人工智能的发展提供更多的依据和制度保障。2017年国务院就出台了新一代人工智能发展规划，明确将人工智能作为国家战略，工信部科技部等部委也出台文件进行细化落实。今年4月28号，中央政治局会议重点提及人工智能，指出要重视推动人工智能的发展，营造创新生态，重视防范风险。而在产业方面，近年来我国人工智能产业在技术创新，产业生态融合应用等方面也取得了积极的进展，已经进入了全球第一梯队。原文地址

2023-06-28

855

作者：喻奎阿里云智能高级技术专家本文主要从四部分介绍，阿里云云原生大数据计算服务MaxCompute湖仓一体近实时增量处理技术架构的核心设计和应用场景。一、MaxCompute 湖仓一体发展进程 MaxCompute作为阿里云自研的海量大数据处理平台已经有十几年的发展历史，在规模和扩展性方面一直表现比较优秀。其依托阿里云飞天分布式操作系统，能够提供快速，完全托管的EB级数据仓库及数据湖解决方案，可经济高效的处理海量数据。目前，其承担着阿里集团绝大部分离线数据存储和计算力，是阿里云产品矩阵中最重要的自研核心平台之一。 MaxCompute发展之初，主要聚焦数仓方面的大数据处理业务场景，并且处理的数据源主要为格式化数据。随着数据处理场景的多样化和业界数据湖架构的兴起，加上阿里集团内部本身数据也非常多，支持多样化数据源也就成为了一个必选项。因此MaxCompute 设计了完善的外表机制，可以读取存储在外部多种格式的数据对象，例如Hadoop开源体系，OSS半结构化或非结构化数据，为此也尽可能设计开发统一的元数据处理架构，此阶段MaxCompute 在湖仓一体化解决方案中迈出了重要一...

2023-06-28

857

资源下载

更多资源

Mario

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长，特征是大鼻子、头戴帽子、身穿背带裤，还留着胡子。与他的双胞胎兄弟路易基一起，长年担任任天堂的招牌角色。

腾讯云软件源

为解决软件依赖安装时官方源访问速度慢的问题，腾讯云为一些软件搭建了缓存服务。您可以通过使用腾讯云软件源站来提升依赖包的安装速度。为了方便用户自由搭建服务架构，目前腾讯云软件源站支持公网访问和内网访问。

Rocky Linux

Rocky Linux（中文名：洛基）是由Gregory Kurtzer于2020年12月发起的企业级Linux发行版，作为CentOS稳定版停止维护后与RHEL（Red Hat Enterprise Linux）完全兼容的开源替代方案，由社区拥有并管理，支持x86_64、aarch64等架构。其通过重新编译RHEL源代码提供长期稳定性，采用模块化包装和SELinux安全架构，默认包含GNOME桌面环境及XFS文件系统，支持十年生命周期更新。

Sublime Text

Sublime Text具有漂亮的用户界面和强大的功能，例如代码缩略图，Python的插件，代码段等。还可自定义键绑定，菜单和工具栏。Sublime Text 的主要功能包括：拼写检查，书签，完整的 Python API ， Goto 功能，即时项目切换，多选择，多窗口等等。Sublime Text 是一个跨平台的编辑器，同时支持Windows、Linux、Mac OS X等操作系统。