Windows下安装配置Xinference指南

老大白菜

已于 2024-12-25 20:32:01 修改

阅读量4.2k

点赞数 11

CC 4.0 BY-SA版权

分类专栏：机器学习 python 文章标签： windows python

于 2024-12-25 10:58:06 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/hzether/article/details/144713484

python 同时被 2 个专栏收录

202 篇文章

订阅专栏

40 篇文章

订阅专栏

Windows下安装配置Xinference指南

Xinference简介

显卡好，电脑好的可用。一般的就不要折腾了。
Xinference 是一个强大且可扩展的本地推理服务器，具有以下特点：

支持多种类型模型的部署和服务（LLM、嵌入、图像等）
提供统一的 RESTful API 和 Python SDK
支持模型量化和优化
可以在本地运行开源模型
支持多种推理后端（PyTorch、ONNX等）

# Xinference 安装与使用指南

## 1. 安装步骤

### 1.1 创建虚拟环境

conda create -n xin python=3.11
conda activate xin


### 1.2 安装 Xinference

pip install “xinference[all]”


## 2. 启动服务

### 2.1 启动单机服务

xinference-local


### 2.2 指定端口启动（默认端口9997）

xinference-local --host 0.0.0.0 --port 9997


### 2.3 后台运行服务

nohup xinference-local > xinference.log 2>&1 &


## 3. 修改模型目录

### 3.1 查看当前模型目录

xinference env


### 3.2 修改模型存储位置

Windows

set XINFERENCE_HOME=D:\models

Linux/Mac

export XINFERENCE_HOME=/path/to/models


### 3.3 永久修改模型目录
在用户目录下创建 `.xinference/config.toml` 文件，添加以下内容：

home = “D:\models” # Windows

home = “/path/to/models” # Linux/Mac


## 4. 关闭服务

### 4.1 查找服务进程

Windows

netstat -ano | findstr 9997
tasklist | findstr python

Linux/Mac

ps aux | grep xinference


### 4.2 关闭服务

Windows

taskkill /F /PID <进程ID>

Linux/Mac

kill -9 <进程ID>


## 5. 常见问题

### 5.1 安装失败
- 尝试使用国内源：

pip config set global.index-url https://pypi.tuna.tsinghua.edu.cn/simple


## 6. 注意事项
- 确保 Python 版本 >= 3.9
- 建议使用独立的虚拟环境
- 模型文件较大，请确保存储空间充足
- 首次下载模型可能需要较长时间，请耐心等待

参考资料

博客等级

码龄6年

473
原创

4700
点赞

3854
收藏

2828
粉丝

关注

私信

猜你想问

如何配置Xinference的pip源？

怎样启动并管理Xinference进程？

是否支持GPU加速推理服务？

热门文章

分类专栏

人工智能 28篇
python 202篇
机器学习 40篇
app 开发 48篇
量化交易 4篇
数据库 78篇
nodejs 16篇
vue3/vue2 33篇
go goframe 84篇
PHP 11篇
java 9篇
axtix web /rust 14篇
zig 9篇
游戏开发 7篇
c#\vb.net 2篇
drogon 3篇
鸿蒙开发 13篇
godot 1篇

展开全部收起

上一篇：: Windows 11 安装 Dify 完整指南非docker环境

下一篇：: RAG实战：构建基于本地大模型的智能问答系统

最新评论

Python八字排盘系统实现分析
邻诗测算: 欢迎使用邻诗测算！
基于Python与本地Ollama的智能语音唤醒助手实现
Numdia: OLLAMA_MODEL = "yi:34b" 34b是什么硬件能跑动的模型
Python FastAPI + Celery + RabbitMQ 分布式图片水印处理系统
北风之神c: 总结的很全面，写得赞，博主用心了。 celery对目录层级文件名称格式要求太高，只适合规划新的项目，对不规则文件夹套用难度高。所以新手使用celery很仔细的建立文件夹名字、文件夹层级、python文件名字。在不规范的文件夹路径下，使用celery难度很高，一般教程都没教。 [项目文件夹目录格式不规范下的celery使用演示](https://github.com/ydf0509/celery_demo) 。此国产分布式函数调度框架 funboost python万能通用函数加速器 https://funboost.readthedocs.io/zh-cn/latest/articles/c1.html ，从用法调用难度，用户所需代码量，超高并发性能，qps控频精确程度，支持的中间件类型，任务控制方式，稳定程度等20个方面全方位超过celery。发布性能提高1000%，消费性能提高2000%。 python万能分布式函数调度框架funboost支持python所有类型的并发模式和一切知名消息队列中间件，python函数加速器，只需要一行代码调度任意函数，框架包罗万象,万能编程功能宝典，一统编程思维，与业务不绑定，适用范围广。通过 funboost web manager 全方位可视化管理和查看你的函数运行情况，无需看文件日志。 https://funboost.readthedocs.io/zh-cn/latest/articles/c13.html pip install funboost
python 实现 Celery 任务队列系统
北风之神c: 总结的很全面，写得赞，博主用心了。 celery对目录层级文件名称格式要求太高，只适合规划新的项目，对不规则文件夹套用难度高。所以新手使用celery很仔细的建立文件夹名字、文件夹层级、python文件名字。在不规范的文件夹路径下，使用celery难度很高，一般教程都没教。 [项目文件夹目录格式不规范下的celery使用演示](https://github.com/ydf0509/celery_demo) 。此国产分布式函数调度框架 funboost python万能通用函数加速器 https://funboost.readthedocs.io/zh-cn/latest/articles/c1.html ，从用法调用难度，用户所需代码量，超高并发性能，qps控频精确程度，支持的中间件类型，任务控制方式，稳定程度等20个方面全方位超过celery。发布性能提高1000%，消费性能提高2000%。 python万能分布式函数调度框架funboost支持python所有类型的并发模式和一切知名消息队列中间件，python函数加速器，只需要一行代码调度任意函数，框架包罗万象,万能编程功能宝典，一统编程思维，与业务不绑定，适用范围广。通过 funboost web manager 全方位可视化管理和查看你的函数运行情况，无需看文件日志。 https://funboost.readthedocs.io/zh-cn/latest/articles/c13.html pip install funboost
Windows 11 安装 Dify 完整指南非docker环境
pangyunqing: 博主的帖子是很早写的，现在各包依赖或者有升级情况，需要自己慢慢根据错误进行调整了。

大家在看

最新文章

2025

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

老大白菜 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。