【最新科普】成色18k.8.35mb菠萝清华朱军组&NVIDIA提出DDO：扩散/自回归模型训练新范式

文章一作郑凯文为清华大学三年级博士生，研究方向为深度生成模型，曾提出流式扩散模型最大似然估计改进技术 i-DODE，扩散模型高效采样器 DPM-Solver-v3，扩散桥模型采样器 DBIM 以及掩码式离散扩散模型采样器 FHS 等。清华大学朱军教授团队与 NVIDIA Deep Imagination 研究组联合提出一种全新的视觉生成模型优化范式 —— 直接判别优化（DDO）。该方法将基于似然的生成模型（如扩散模型、自回归模型）隐式参数化为 GAN，从而设计出一种无需额外网络、训练高效的微调方法，并大幅突破传统最大似然训练的性能瓶颈。近年来，扩散模型（Diffusion Models）和自回归模型（Autoregressive Models）在图像生成中占据主导地位，如 NVIDIA 的 EDM 系列扩散模型和字节跳动以 VAR 为代表的视觉自回归模型。相比 GAN（Generative Adversarial Networks）这类直接优化数据生成过程的隐式生成模型，扩散模型和自回归模型均属于基于似然的生成模型（Likelihood-Based Generative Model），它们显式估计数据的对数似然（log-likelihood），具有训练稳定、样本多样性强、容易规模化的特点然而，这类模型广泛采用的最大似然估计（Maximum Likelihood Estimation, MLE）训练损失对应的是正向 KL 散度，会导致「mode covering」问题：模型倾向于覆盖所有数据模式而非聚焦主要分布，并且会在低估数据集中任何样本的似然时遭受严厉惩罚，从而使生成结果模糊或失真，在模型容量不足时限制了生成质量。例如，i-DODE 作为专注于似然的模型，虽然在密度估计任务上达到了最先进水平，但在 FID 等视觉质量指标下表现不佳。现有视觉生成模型也往往依赖引导（guidance）方法，如无需分类器的引导（Classifier-Free Guidance, CFG），来抑制低质量生成样本。为解决 MLE 的局限性，文章考虑使用GAN 式判别的思想，在训练目标中引入反向 KL 散度的成分，强化模型在真实数据附近的密度，同时抑制错误区域，将模型分布由图（a）：强调密度覆盖，微调为图（b）：强调密度集中，从而提高生成保真度与有限模型容量下的生成质量。然而，直接使用 GAN 损失会引入额外的判别器网络与工程优化上的复杂性，尤其对于扩散/自回归模型这类需要迭代式多步生成的模型。具体来说，DDO 引入待微调的目标模型和一个冻结的参考模型（均初始化为预训练模型），使用两个模型的对数似然比构造「隐式判别器」，得到可直接应用于扩散模型和自回归模型的 GAN 式优化目标： DDO 为扩散模型和自回归模型提供了即插即用的新训练目标，其微调后的模型和原模型具有完全相同的网络结构和采样方式，而在生成质量上大大增强更重要的是，DDO无需修改网络结构、不增加推理成本，且与主流 CFG 等引导方法兼容，可叠加使用进一步提升性能。如在视觉自回归模型 VAR 上，微调后的模型通过控制 CFG 的强度，得到的FID-IS 曲线整体显著优于原模型 DDO 参数化的灵感来自于语言模型中的直接偏好优化（DPO, Direct Preference Optimization），但其目标从「成对的偏好对齐」扩展到了「分布对齐」，更为通用。DDO 虽然没有「奖励」的概念，但其中使用自生成样本作为负例的思想也与大语言模型中流行的 RL 算法如 GRPO 具有相似性，这允许模型从错误中反思学习。也就是说，GRPO 中负例的作用同样可以解释为使用 reverse KL 散度抑制 mode covering 趋势从而提升生成质量，这在数学推理等任务中具有重要意义。该思路有望扩展至多模态生成等任务，构建统一的对齐范式

                                成色18k.8.35mb菠萝比亚迪夏的后排娱乐屏在收起状态时，基本完全嵌入车顶，并不会像其它品牌那样外露太多。好处一个是不会挤压车内空间，避免磕碰到头出现受伤，另一个就是车顶的整体感更强，一看就是原车带的屏幕，而不是后加的。“无论是永嘉学派的核心思想，还是改革开放孕育出的‘四千’精神，都是温州企业家的精神滋养，激励我们再创新的业绩，努力为经济社会发展作出更大贡献。”浙江省工商联主席南存辉说。成色18k.8.35mb菠萝xjxjxj18.gov.cn这个多元化的社会中，成功的定义也变得更加广泛。无论是从事科研工作、艺术创作，还是自主创业，只要我们能够找到自己热爱的事情，并为之努力奋斗，都能够实现自己的人生价值。该媒体认为紫色因其鲜艳现代的风格，被认为更有可能成为首发颜色；绿色则预计提供一种清新自然的色调，走简约而醒目的设计风格。
                            

                                20251207 🍌 成色18k.8.35mb菠萝近期媒体上出现了拜仁有意费尔明的传闻，而按照《每日体育报》的说法，巴萨的主帅弗里克绝对不会考虑在今夏放走这位西班牙球星，与此同时费尔明本人也没有任何离开巴萨的打算，他不愿意在现有合同2029年6月30日到期之前的任何情况下偏离继续在巴萨取得成功的道路。www.17cao.gov.cn目前汽车产业已跃升为北京制造业第一大产业。2024年北京市汽车制造业实现“15%”以上增长。昨日，在活力中国调研行采访中，小米集团创始人、董事长兼首席执行官雷军表示，15岁的小米，成长壮大离不开北京这片创新沃土的滋养。“软”环境的支持，“硬”政策的支撑，孕育了一批像小米一样的创新企业。“我是发自内心地感谢北京。”
                            

📸 施汉新记者范伟霞摄

                                20251207 🔞 成色18k.8.35mb菠萝加州大学伯克利分校也不遑多让，甚至还多出一个评判维度：belonging, DEI升级成DEIB。举例来说，如果一位教师在评职称的时候，仅仅参加过一到两项DEIB活动，那么，这位老师只能得到五分中的一分或是两分，要拿全这五分，老师must demonstrate a history of commitment to DEIB activities, such as having “organized or spoken at workshops or other events aimed at increasing others understanding of diversity, equity, inclusion and belonging…Candidates must also integrate DEIB into their scholarship and clearly formulate new ideas for advancing equity and inclusion at Berkeley and within their field, through their research, teaching and/or service”。你不仅要宣扬DEIB，还要付诸行动。更绝的是，如果你拒绝按照这样的政治指挥棒从事学术活动，那么你必须provide reasons for not considering diversity in hiring，也就是老师要自证为什么不能向DEIB的标准看齐。看来，学术中没有政治，在哪儿都是梦。7788.gov.cm去年他为了主演《戴假发的人》减肥30多斤，确实投入了大量的精力，但因为个人口碑变差，号召力也大不如从前，最后这部电影的累计票房才420万，让人大失所望。
                            

📸 崔睿珂记者师月香摄

                            ✅ 据《每日体育报》的消息，阿劳霍与巴萨合同中的解约条款将在7月份的前10天从10亿欧降至6500万欧。目前巴萨和阿劳霍都没有主动推进转会，但在6500万欧解约条款生效后，阿劳霍势必会成为转会市场的热门话题。香蕉.com