1.Pulid
训练:由1.5M张从互联网收集的高质量人类图像组成,图像标题由blip2自动生成。
测试:从互联网上收集了一个多样化的肖像测试集,该数据集涵盖了多种肤色、年龄和性别,共计120张图像,我们称之为DivID-120,作为补充资源,还使用了最近开源的测试集Unsplash-50,包含了2024年2月至3月期间上传到Unsplash网站的50张肖像图像。
2.PortraitBooth
训练:
测试:整个测试集包含15个对象(subjects)和30个文本。评估基准开发一系列文本提示,涵盖了广泛的场景,如重新情境化、风格化、配饰化以及多样的动作,每个对象使用五张图像来微调基于优化的方法。
3.Dreami