docker部署vllm使用VLLM_USE_MODELSCOPE

最新推荐文章于 2025-09-01 06:02:37 发布

学亮编程手记

最新推荐文章于 2025-09-01 06:02:37 发布

阅读量144

点赞数 3

CC 4.0 BY-SA版权

分类专栏： chatgpt docker 文章标签： docker 容器运维

本文链接：https://blog.csdn.net/a772304419/article/details/150774322

docker 同时被 2 个专栏收录

457 篇文章

订阅专栏

chatgpt

254 篇文章

订阅专栏

docker run --name bge-reranker-v2-m3 -d --runtime nvidia --gpus all \-v ~/.cache/modelscope:/root/.cache/huggingface \--env "VLLM_USE_MODELSCOPE=True" \-p 8001:8000 \--ipc=host \vllm/vllm-openai:latest \--model BAAI/bge-reranker-v2-m3  \--gpu_memory_utilization 0.9

links
https://www.ppmy.cn/news/1748773.html?action=onClick

关注博主即可阅读全文