Hugging Face 中计算机视觉的现状
在 Hugging Face 上,我们为与社区一起推动人工智能领域的民主化而感到自豪。作为这个使命的一部分,我们从去年开始专注于计算机视觉。开始只是 🤗 Transformers 中 Vision Transformers (ViT) 的一个 PR,现在已经发展壮大: 8 个核心视觉任务,超过 3000 个模型,在 Hugging Face Hub 上有超过 1000 个数据集。 自从 ViTs 加入 Hub 后,已经发生了大量激动人心的事情。在这篇博客文章中,我们将从 🤗Hugging Face 生态系统中总结已经发生的和将要发生的进展,以支持计算机视觉的持续发展。 下面是我们要覆盖的内容: 支持的视觉任务和流水线 训练你自己的视觉模型 和 timm 整合 Diffusers 对第三方库的支持 开发 以及更多内容! 启动社区: 一次一个任务 Hugging Face Hub 拥有超过 10 万个用于不同任务的公共模型,例如: 下一词预测、掩码填充、词符分类、序列分类等。截止今天,我们支持 8 个核心视觉任务,提供许多模型的 checkpoints: 图像分类 图像分割 (零样本)...