FauxPilot —— GitHub Copilot 的替代品-低调大师

FauxPilot —— GitHub Copilot 的替代品

2022-10-08 1125

这是一个本地托管版本的 GitHub Copilot。它在英伟达的 Triton 推理服务器中使用了 SalesForce CodeGen 模型和 FasterTransformer 后端。

前提条件

Docker
docker-compose >= 1.28
一台计算能力大于 7.0 的英伟达 GPU，以及足够的 VRAM 来运行你想要的模型
nvidia-docker
curl 和 zstd，用于下载和解包模型

Copilot 插件

你可以配置官方 VSCode Copilot 插件来使用你的本地服务器。只要编辑你的 settings.json 来添加。

    "github.copilot.advanced": {
        "debug.overrideEngine": "codegen",
        "debug.testOverrideProxyUrl": "http://localhost:5000",
        "debug.overrideProxyUrl": "http://localhost:5000"
    }

设置

运行设置脚本以选择要使用的模型。这将从 Huggingface 下载模型，然后将其转换为与 FasterTransformer 一起使用。

$ ./setup.sh 
Models available:
[1] codegen-350M-mono (2GB total VRAM required; Python-only)
[2] codegen-350M-multi (2GB total VRAM required; multi-language)
[3] codegen-2B-mono (7GB total VRAM required; Python-only)
[4] codegen-2B-multi (7GB total VRAM required; multi-language)
[5] codegen-6B-mono (13GB total VRAM required; Python-only)
[6] codegen-6B-multi (13GB total VRAM required; multi-language)
[7] codegen-16B-mono (32GB total VRAM required; Python-only)
[8] codegen-16B-multi (32GB total VRAM required; multi-language)
Enter your choice [6]: 2
Enter number of GPUs [1]: 1
Where do you want to save the model [/home/moyix/git/fauxpilot/models]? /fastdata/mymodels
Downloading and converting the model, this will take a while...
Converting model codegen-350M-multi with 1 GPUs
Loading CodeGen model
Downloading config.json: 100%|██████████| 996/996 [00:00<00:00, 1.25MB/s]
Downloading pytorch_model.bin: 100%|██████████| 760M/760M [00:11<00:00, 68.3MB/s] 
Creating empty GPTJ model
Converting...
Conversion complete.
Saving model to codegen-350M-multi-hf...

=============== Argument ===============
saved_dir: /models/codegen-350M-multi-1gpu/fastertransformer/1
in_file: codegen-350M-multi-hf
trained_gpu_num: 1
infer_gpu_num: 1
processes: 4
weight_data_type: fp32
========================================
transformer.wte.weight
transformer.h.0.ln_1.weight
[... more conversion output trimmed ...]
transformer.ln_f.weight
transformer.ln_f.bias
lm_head.weight
lm_head.bias
Done! Now run ./launch.sh to start the FauxPilot server.

微信关注我们

原文链接：https://www.oschina.net/p/fauxpilot

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

每日一博 | Lepton 无损压缩原理及性能分析

作者：vivo 互联网数据库团队- Li Shihai 本文主要介绍无损压缩图片的概要流程和原理，以及Lepton无损压缩在前期调研中发现的问题和解决方案。一、从一个游戏开始 1.1 游戏找茬请拿出你的秒表计时，在15秒时间内找出下面图片的差异。时间到了，你发现两张图片的差异了吗？二、智者的成长在上面的游戏中，你可能你并没有发现两张图片间有任何差异，而实际上它们一张是3.7MB的jpg格式的原图，另外一张是大小为485KB的jpg格式压缩图片，只是大小不同。你可能会有些生气，愤愤不平到这是欺骗，然而聪明的你很快在大脑中产生了一连串的疑问，这些问号让你层层揭开游戏的面纱，不在为愚弄而悔恨，反而从新知中获得快乐。 2.1 苏格拉底助产术上面图片为何变小了呢？丢失了的信息去哪了呢？为什么图片质量下降了，我却看不出来呢？我还能将它变的更小吗？我能将它还原成原来的大小吗？为什么要压缩我的图片？上面图片为何变小了？图片从3.7MB变成485KB是因为我使用了图片查看工具将原图另存成一张新的图片，在另存的过程中，有一个图片质量选择的参数，我选择了质量最低，保存后便生成了一张更...

2022-10-09

392

性能提升 12 倍，Meta 推出不限定 GPU 的 AI 框架

到目前为止，人工智能推理引擎在很大程度上被束缚在它们所设计的特定硬件上。这样的硬件锁定意味着开发人员将需要为不同的硬件构建特定的软件，并且很可能也会减缓行业整体创新的步伐。 Meta 日前开源了一套新的 Python 框架，名为 AITemplate（AIT）。它彻底改变了上述情况，使开发者可以在不牺牲速度和性能的前提下使用不同厂商的 GPU。 AITemplate 能够提供高速的推理服务，最初将同时支持 Nvidia TensorCore 和 AMD MatrixCore 推理硬件，并且以 Apache 2.0 许可协议开放了 AITemplate 的源代码。 Meta 工程总监 Ajit Mathews 表示："当前版本的 AIT 主要是支持 Nvidia 和 AMD 的 GPU，但该平台是可扩展的，如果有需要的话，将来还可以支持 Intel 的 GPU。现在我们已经开放了 AIT 的源代码，我们欢迎任何有兴趣的芯片供应商能够为它做出贡献。” 与 PyTorch 中的 Eager 模式相比，Meta 使用 AIT 在 Nvidia A100 AI GPU 上实现了高达 12 倍的性...

2022-10-09

322

资源下载

更多资源

优质分享App

近一个月的开发和优化，本站点的第一个app全新上线。该app采用极致压缩，本体才4.36MB。系统里面做了大量数据访问、缓存优化。方便用户在手机上查看文章。后续会推出HarmonyOS的适配版本。

Mario

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长，特征是大鼻子、头戴帽子、身穿背带裤，还留着胡子。与他的双胞胎兄弟路易基一起，长年担任任天堂的招牌角色。

Eclipse

Eclipse 是一个开放源代码的、基于Java的可扩展开发平台。就其本身而言，它只是一个框架和一组服务，用于通过插件组件构建开发环境。幸运的是，Eclipse 附带了一个标准的插件集，包括Java开发工具（Java Development Kit，JDK）。

JDK

JDK是 Java 语言的软件开发工具包，主要用于移动设备、嵌入式设备上的java应用程序。JDK是整个java开发的核心，它包含了JAVA的运行环境（JVM+Java系统类库）和JAVA工具。