EN
rabbitjump.430school.net

扒开腿让我教你很舒服的导演是谁清华朱军组&NVIDIA提出DDO:扩散/自回归模型训练新范式

文章一作郑凯文为清华大学三年级博士生,研究方向为深度生成模型,曾提出流式扩散模型最大似然估计改进技术 i-DODE,扩散模型高效采样器 DPM-Solver-v3,扩散桥模型采样器 DBIM 以及掩码式离散扩散模型采样器 FHS 等。 清华大学朱军教授团队与 NVIDIA Deep Imagination 研究组联合提出一种全新的视觉生成模型优化范式 —— 直接判别优化(DDO)。该方法将基于似然的生成模型(如扩散模型、自回归模型)隐式参数化为 GAN,从而设计出一种无需额外网络、训练高效的微调方法,并大幅突破传统最大似然训练的性能瓶颈。 近年来,扩散模型(Diffusion Models)和自回归模型(Autoregressive Models)在图像生成中占据主导地位,如 NVIDIA 的 EDM 系列扩散模型和字节跳动以 VAR 为代表的视觉自回归模型。相比 GAN(Generative Adversarial Networks)这类直接优化数据生成过程的隐式生成模型,扩散模型和自回归模型均属于基于似然的生成模型(Likelihood-Based Generative Model),它们显式估计数据的对数似然(log-likelihood),具有训练稳定、样本多样性强、容易规模化的特点 然而,这类模型广泛采用的最大似然估计(Maximum Likelihood Estimation, MLE)训练损失对应的是正向 KL 散度,会导致「mode covering」问题:模型倾向于覆盖所有数据模式而非聚焦主要分布,并且会在低估数据集中任何样本的似然时遭受严厉惩罚,从而使生成结果模糊或失真,在模型容量不足时限制了生成质量。例如,i-DODE 作为专注于似然的模型,虽然在密度估计任务上达到了最先进水平,但在 FID 等视觉质量指标下表现不佳。现有视觉生成模型也往往依赖引导(guidance)方法,如无需分类器的引导(Classifier-Free Guidance, CFG),来抑制低质量生成样本。 为解决 MLE 的局限性,文章考虑使用GAN 式判别的思想,在训练目标中引入反向 KL 散度的成分,强化模型在真实数据附近的密度,同时抑制错误区域,将模型分布由图(a):强调密度覆盖,微调为图(b):强调密度集中,从而提高生成保真度与有限模型容量下的生成质量。然而,直接使用 GAN 损失会引入额外的判别器网络与工程优化上的复杂性,尤其对于扩散/自回归模型这类需要迭代式多步生成的模型。 具体来说,DDO 引入待微调的目标模型和一个冻结的参考模型(均初始化为预训练模型),使用两个模型的对数似然比构造「隐式判别器」,得到可直接应用于扩散模型和自回归模型的 GAN 式优化目标: DDO 为扩散模型和自回归模型提供了即插即用的新训练目标,其微调后的模型和原模型具有完全相同的网络结构和采样方式,而在生成质量上大大增强 更重要的是,DDO无需修改网络结构、不增加推理成本,且与主流 CFG 等引导方法兼容,可叠加使用进一步提升性能。如在视觉自回归模型 VAR 上,微调后的模型通过控制 CFG 的强度,得到的FID-IS 曲线整体显著优于原模型 DDO 参数化的灵感来自于语言模型中的直接偏好优化(DPO, Direct Preference Optimization),但其目标从「成对的偏好对齐」扩展到了「分布对齐」,更为通用。DDO 虽然没有「奖励」的概念,但其中使用自生成样本作为负例的思想也与大语言模型中流行的 RL 算法如 GRPO 具有相似性,这允许模型从错误中反思学习。也就是说,GRPO 中负例的作用同样可以解释为使用 reverse KL 散度抑制 mode covering 趋势从而提升生成质量,这在数学推理等任务中具有重要意义。该思路有望扩展至多模态生成等任务,构建统一的对齐范式

扒开腿让我教你很舒服的导演是谁
扒开腿让我教你很舒服的导演是谁令人痛心的是,当老师因为身体实在支撑不住,挪动一步去喝药时,迎接他们的不是理解与关怀,而是冰冷的“旷工”标签。那一声“课堂上不能缺老师”,每一个字都如同一把锋利的刀,直直地刺进老师的心里。仿佛在某些人的认知里,教师不是有情感、有需求、会生病的血肉之躯,而仅仅是讲台上一颗永不松动的螺丝钉,只能机械地运转,不能有丝毫的停歇与差错。据现场的展台人员介绍,同场展示的其他座舱还有舱泊一体的自动泊车功能和离线大模型语音助手,前者在现场没办法进行体验,后者我简单试了一下,基本就是离线部署的Qwen 2.5-3B,图一乐还是可以的。扒开腿让我教你很舒服的导演是谁www.17cao.gov.cn此前,自2024年温网开始,郑钦文已经连续4个大满贯赛事与世界第1萨巴伦卡分在同1/4区,并分别在2024年美网和2025年法网,两次被萨巴伦卡挡在八强门外。据了解,尽管此前遭到拒绝且已有协议,拜仁仍在关注尼科-威廉斯与巴萨之间的情况,以及巴萨是否真的能完成这笔交易。巴尔科拉仍然是拜仁引援名单上的优先目标之一,但他是否愿意转会仍不明朗。莱奥也仍在俱乐部内部的讨论之中。
20251207 😈 扒开腿让我教你很舒服的导演是谁李峰永谈道,针对产后出现盆底功能障碍的女性,手术干预是关键手段。她所在团队开展的阴道紧缩术,对所有可见的盆底肌系统进行缝合和复位,术后大多数患者的器官脱垂症状明显改善。WWW.77788.GOV.CN在这两节课的时间里,我的内心一直在这两种想法之间徘徊。每一次目光扫到那个趴着睡觉的同学,我的心里就像有两个小人在打架,始终无法做出一个明确的决定。直到下课铃声响起,我都还没有想好该如何处理这件事情。
扒开腿让我教你很舒服的导演是谁
📸 赵亚春记者 刘志刚 摄
20251207 🔞 扒开腿让我教你很舒服的导演是谁停火协议生效后,以色列国防军称,侦测到伊朗再次发射弹道导弹。随后,以色列国防部长卡茨表示,他已指示以色列国防军“对伊朗违反停火协议的行为作出有力回应,对德黑兰市中心的目标进行猛烈打击”。8x8x.gov.cn婚后两人虽然经常闹矛盾,但还是相继生下3个儿女。2016年长女出生,2018年儿子出生,2022年次女出生。两人最近一次吵架是2023年春节期间,当年正月十四晚上,夫妻俩为了孩子的教育再次发生争吵。
扒开腿让我教你很舒服的导演是谁
📸 李改青记者 孙伟 摄
🖤 记者搜索发现,圣龙潭水深200多米,外加水下地貌复杂,深受潜水爱好者喜爱,当地还曾组织过多项官方活动。广西壮族自治区体育局官网去年4月的消息,世界潜联(CMAS)2024年4月国际自由潜水教练员、裁判员培训班就在圣龙潭举办。30多名来自全国各地的潜水教练员、裁判员接受了为期3天的训练,涵盖室内外潜水理论、泳池实践以及户外开放水域训练的一系列专业培训。香蕉.com
扫一扫在手机打开当前页