您现在的位置:Botrun机器人网>> Bot信息 AI技术>>正文内容

SGLang部署Deepseek

最近听说,Deepseek的部署工具中SGlang是官方最推荐的,今天来学习一下这种部署方式。

SGLang 是一个针对大型语言模型和视觉语言模型的快速服务框架。它通过共同设计后端运行时和前端语言,让您与模型的交互更快、更可控。

我们先来看下三个部署工具分别的适用场景:

考虑到Deepseek-R1满血版,是一个集成CoT的模型,所以文本都比较长,所以官方会推荐使用SGlang来进行部署。

照例先放一下repo的地址:github.com/sgl-project/

(1)SGLang安装步骤:

官方推荐的安装方式有4种:

  • 使用pip or uv方式;需要连接到抱抱脸;

  • git下载后,源码安装;需要连接到github;

  • 直接下载docker镜像方式;需要可连接至docker-hub;

  • docker compose方式;本地集群部署推荐这种方式。

考虑服务器环境,本次采用第二种部署方式,源码安装方式:

git clone -b v0.4.3.post2 github.com/sgl-project/

cd sglang

pip install --upgrade pippip install sgl-kernel --force-reinstall --no-depspip install -e "python[all]" --find-links flashinfer.ai/whl/cu124

注意这里隐藏着一个官方bug,目前这个工具兼容的transformers版本是4.48.3。如果你不是这个版本,安装成功后,在后面运行加载模型时会报错。

我的服务器transformers版本是4.49,所以还需要降版本操作。

pip uninstall transformers -y

pip install transformers==4.48.3
--force-reinstall
--no-deps
--index-url 
pypi.org/simple/
--extra-index-url download.pytorch.org/wh

安装完之后,运行

python -c "import transformers; print(transformers.version)"

输出结果是:4.48.3。就没有问题了。

(2)SGLang加载大模型:

为加快模型下载速度,我直接从modelscope上下载7B模型:

git clone modelscope.cn/deepseek-

然后从本地上传至服务器。

然后通过本命令去执行加载,注意这里模型参数需要使用绝对路径。

python3 -m sglang.launch_server --model /root/autodl-tmp/DeepSeek-R1-Distill-Qwen-7B --trust-remote-code --tp 1


模型启动完后,我们用curl去连接下试试:

curl -v 127.0.0.1:30000/v1/comp -H 'X-API-Key: 93e8b39f55fc4097956054c80a8ed7cf' -H "Content-Type: application/json" -d '{ "model": "DeepSeek-R1", "prompt": "你是谁?", "max_tokens": 100, "temperature": 0 }'

返回是正常的。(其实这里有个坑,先不说)

我们利用对话工具ChatBox来试一下API是否正常。

连接正常,对话正常,然后,见鬼的事情出现:

我问它参数量,它告诉我是14B.....我明明是从modelscope上下载的7B啊,不管了,反正能用。

接下来需要开启API-key,这是个很重要的安全控制。

python3 -m sglang.launch_server --model /root/autodl-tmp/DeepSeek-R1-Distill-Qwen-7B --trust-remote-code --tp 1 --api-key 123321

在启动参数最后面加上--api-key 123321即可,123321是我设置的试用key,真正使用时要注意秘钥复杂度。

如果在配置时,不输入秘钥,就会报错,无法连接。(这里提示的OpenAI API失败,是因为默认SGLang的启用的API是OpenAI API格式)。

更新API-key后,又可以正常链接了。

是的,它还是坚持自己是14B。

老说AI会有幻觉,我觉得这一把不是它有幻觉,就是我有幻觉了。。。



感动 同情 无聊 愤怒 搞笑 难过 高兴 路过
【字体: 】【收藏】【打印文章】 【 打赏 】 【查看评论

相关文章

    没有相关内容