教大家本地搭建一键换装AI开源工具 OOTDiffusion

前言

最近休息了两天,在研究一些AI用于商业化方向的东西,最近找到服装一键更换的开源项目,效果非常不错,今天就把安装步骤分享给大家,同时给大家看看真实效果

部署

项目地址:[github.com/levihsu/OOT…]

没有中文的项目介绍

首先需要拉取项目的所有代码:

git clone https://github.com/levihsu/OOTDiffusion

    这个项目比较吃配置,机器配置是 内存 32G DDR4 显卡 2070S 8G CPU 9700F 系统 Ubuntu22.04

    基础环境搭建,我这里的显卡驱动已经安装好了, 这里的环境是Ubuntu,可以参考我之前的本地部署ChatGLM2的文章安装显卡环境。

    显卡相关的环境解决过后就需要使用conda 安装相关的依赖,现需要启动一个Python虚拟环境。

    conda create -n ootd python==3.10
    conda activate ootd
    pip install torch==2.0.1 torchvision==0.15.2 torchaudio==2.0.2
    pip install -r requirements.txt
    
    

    根据提示需要下载模型 ,模型下载地址有两个

    git lfs clone  https://huggingface.co/levihsu/OOTDiffusion
    git lfs clone  https://huggingface.co/openai/clip-vit-large-patch14
    
    

    下载完成后移动到主项目的 checkpoints 目录,模型非常大,需要耗费很长的时间,下载完成后效果如下:

    image.png 接下来需要启动web 服务,不推荐使用官方的命令行。启动web服务需要修改一下run/gradio_ootd.py,需要注销掉3行代码,默认 gradio 会调用两个显卡。

    # openpose_model_dc = OpenPose(1)
    # parsing_model_dc = Parsing(1)
    # ootd_model_dc = OOTDiffusionDC(1)
    
    

    启动:

    python run/gradio_ootd.py
    
    

    image.png

    本地访问:127.0.0.1:7865: 尝试一下

    image.png 把淘宝的衣服下载下来尝试了一下,效果真不错哦

    image.png

    image.png

    还可以调整,随机种子,重绘次数,一次生成的参数,但是目前仅仅生成上半身,上面注释的就是注释掉全身替换的代码,需要两块显卡同时运行。目前电脑只有一张显卡只能这样了

    最后

    我觉得这个效果非常炸裂,像这样的而且有一定的商业价值的项目我觉得非常有前景,对于一些想开服装网店的创业者非常有吸引力,可以节省大量的时间和金钱成本,对于这些开源进行的封装推广应该也有一定的商业价值,感兴趣的同学可以持续关注我,我会陆续介绍类似的项目。

    ### ComfyUI 一键换装功能实现方法 #### 工作流概述 ComfyUI 的一键换装功能主要依靠特定的工作流来完成。该工作流被分为三个核心部分,旨在简化从图像输入到最终输出的过程[^5]。 #### 准备阶段 确保使用的 ComfyUI 版本是最新的,这对于获取最新的特性支持至关重要。旧版本可能会导致兼容性问题或其他不必要的麻烦[^2]。 #### 安装必要的组件和依赖项 对于某些高级功能,可能需要额外安装自定义节点及其依赖项。例如,在处理复杂的换装需求时,可以通过如下命令在指定路径下安装所需的 Python 库: ```bash ..\..\..\python_embedded\python.exe -s -m pip install -r requirements.txt ``` 这段脚本应在对应的 custom_nodes 文件夹内执行,以确保所有必需的库都被正确加载[^3]。 #### 构建具体的一键换装流程 1. **导入素材** 用户需先上传待处理的人物照片作为基础图层,并准备好想要替换的新服饰图片资源。 2. **应用风格迁移算法** 利用内置或第三方提供的风格迁移工具,调整新衣物的颜色、纹理和其他视觉属性,使其能够自然融入原始场景之中[^4]。 3. **构建与优化工作流** 设计一个高效的工作流结构,连接各个处理环节,包括但不限于背景分割、姿态估计、衣服贴合度计算等操作。这些步骤共同作用于创建流畅且逼真的换衣体验。 4. **测试与迭代改进** 不断尝试不同的参数配置直至达到满意的效果为止。期间可根据实际反馈微调各模块之间的协作方式,提高整个系统的稳定性和准确性。 通过上述介绍可以看出,利用 ComfyUI 实现一键换装不仅涉及软件本身的设置,还需要综合运用多种计算机视觉技术和创意设计思路。随着更多开发者加入贡献自己的力量,未来这一领域必将涌现出更加惊艳的应用案例。
    评论
    添加红包

    请填写红包祝福语或标题

    红包个数最小为10个

    红包金额最低5元

    当前余额3.43前往充值 >
    需支付:10.00
    成就一亿技术人!
    领取后你会自动成为博主和红包主的粉丝 规则
    hope_wisdom
    发出的红包
    实付
    使用余额支付
    点击重新获取
    扫码支付
    钱包余额 0

    抵扣说明:

    1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
    2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

    余额充值