PALP:文本到图像模型的个性化定制
内容创作者经常希望使用个人主题创建个性化图片,超越传统的文本到图像模型的能力。此外,他们可能希望生成的图片包含特定的位置、风格、氛围等。现有的个性化方法可能会在个性化能力和与复杂文本提示的对齐之间做出妥协。这种权衡可能会阻碍用户提示和主题的忠实性。我们提出了一种新的方法,专注于单个提示的个性化方法,以解决这个问题。我们将这种方法称为提示对齐个性化。尽管这种方法可能看起来有限,但我们的方法在改进文本对齐方面表现出色,可以创建具有复杂和复杂提示的图像,这对于当前技术来说可能是一个挑战。具体而言,我们的方法使用额外的得分蒸馏采样项,使个性化模型与目标提示保持对齐。我们在多次拍摄和单次拍摄设置中展示了我们方法的多功能性,并进一步展示了它可以组合多个主题或从艺术作品等参考图像中获取灵感。我们定量和定性地与现有基线和最先进的技术进行比较。
(来源:站长之家)
免责声明:本站文章部分内容为本站原创,另有部分容来源于第三方或整理自互联网,其中转载部分仅供展示,不拥有所有权,不代表本站观点立场,也不构成任何其他建议,对其内容、文字的真实性、完整性、及时性不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容,不承担相关法律责任。如发现本站文章、图片等内容有涉及版权/违法违规或其他不适合的内容, 请及时联系我们进行处理。