Diffusion Models - 搜索 News

布局控制+身份一致：浙大提出ContextGen，实现布局锚定多实例生成新SOTA

随着扩散模型（Diffusion Models）的迭代演进，图像生成已经日臻成熟。然而，在多实例图像生成（Multi-Instance Image Generation, MIG） ...

7 天

ContextGen：精准布局+身份一致，多实例图像生成比肩 Nano Banana

数据集的痛点：很多专注身份的方法都附带了庞大规模的高质量数据集，但是这些数据集基本都没有提供精确的布局与身份标注对，而且奇缺实例较多的复杂场景，限制了模型的训练效果。少数包含布局标注的数据集，除了缺乏复杂场景外这一“通病”外，其参考图像与真值图像之间 ...

3 天

AI艺术创作新利器：PromptFill发布，复杂提示词秒变填空题

近日，一款名为PromptFill的开源结构化提示词生成工具横空出世。它通过创新的“填空式”可视化交互，显著降低了创建提示词的难度，使AI艺术真正实现“傻瓜式”操作。核心功能：填空式交互，拖拽式生成提示词。传统的长文本提示词被分解为一个个独立的“变量”，用户只需点击、拖拽、填空，即可快速构建完整的提示词结构。

7 天

「瞬息全宇宙」背后的 AI 公司，曾参与 Stable Diffusion 开发，去年获 ...

北京时间 3 月 13 日上午，2023 年奥斯卡颁奖礼在洛杉矶举行，影片《瞬息全宇宙》一举斩获七项大奖，成为最大赢家。主演杨紫琼也凭借该片将奥斯卡最佳女主角奖收入囊中，成为奥斯卡历史上首位华裔影后。

13 天

跳过“逐字生成”，蚂蚁集团赵俊博：扩散模型让我们能直接修改Token

所有的Auto-Regressive Model（AR，自回归模型）基本都遵循同一机制——给定前N个词，要求模型预测并生成第N+1个词，然后基于前N+1个词，再去预测第N+2个词，依此类推。

来自MSN

如何看待diffusionLLM的现状？

我觉得是一件非常好的事情，在如今Transformer的autoregressive范式盛行的大背景下，能够有一些non-autoregressive的alternatives来作为竞品，应该是大家喜闻乐见的事。我们知道现在主流的LLM都是autoregressively地生成token——也就是说只能根据上文信息预测下文。这样的 ...

知乎 on MSN

求助各位大佬要弃latent diffusion转pixel diffusion吗?

先说结论：是的，目前确实存在从latent diffusion回归pixel diffusion的明显趋势。虽然说从DDPM，到Stable Diffusion和DiT等一众LDM范式的成功，再到现在PixelDiT和JiT这类开始的回归pixel ...

一些您可能无法访问的结果已被隐去。

显示无法访问的结果