TEMOS

news2026/4/2 1:03:55

TEMOSText-conditioned Motion Synthesis是2022年提出的一个文本驱动动作生成模型核心设计是文本编码器动作编码器动作解码器输入文本描述 → 生成对应的3D动作序列训练时用 KL 散度损失让文本和动作的隐空间分布对齐让两者都趋向正态分布方便从文本隐向量解码生成动作。一对匹配的数据文本描述 → 文本编码器 → z_text对应的真实动作序列 → 动作编码器 → z_motion任务一对齐 z_text 和 z_motion 尽量靠近 → 用 KL 散度损失 → 让两者的分布都趋向正态分布任务二文本重建 z_text → 解码器 → 重建动作序列 → 和真实动作序列尽量相似 → 用重建损失任务三动作重建 z_motion → 解码器 → 重建动作序列 → 和原始动作序列尽量相似 → 用重建损失”真实动作和原动作是同一个东西都是指采集的 Ground Truth 动作序列任务二和任务三共享同一个解码器z_text ─→┐├→ 同一个解码器 → 重建动作z_motion─→┘在TEMOS的推理/测试阶段输入只有文本模型的任务是将文本编码为 latent 表示再通过 decoder 生成对应的动作序列。但论文使用KL散度会把latent分布“高斯化集中化”把原本数据的“个性差异”压缩掉压缩数据之间的差异而FID正是依赖这些差异来衡量质量因此会导致FID出现“虚假乐观”的失真结果。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/2473770.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

TEMOS

相关文章

SpringBoot-17-MyBatis动态SQL标签之常用标签

wordpress后台更新后前端没变化的解决方法

网络编程（Modbus进阶）

UE5 学习系列（二）用户操作界面及介绍

IDEA运行Tomcat出现乱码问题解决汇总

利用最小二乘法找圆心和半径

使用docker在3台服务器上搭建基于redis 6.x的一主两从三台均是哨兵模式

XML Group端口详解

LBE-LEX系列工业语音播放器|预警播报器|喇叭蜂鸣器的上位机配置操作说明

(LeetCode 每日一题) 3442. 奇偶频次间的最大差值 I (哈希、字符串)

【大模型RAG】拍照搜题技术架构速览：三层管道、两级检索、兜底大模型

【Axure高保真原型】引导弹窗

接口测试中缓存处理策略

龙虎榜——20250610

观成科技：隐蔽隧道工具Ligolo-ng加密流量分析

铭豹扩展坞 USB转网口突然无法识别解决方法

未来机器人的大脑：如何用神经网络模拟器实现更智能的决策？

Linux应用开发之网络套接字编程(实例篇)

华为云AI开发平台ModelArts

深度学习在微纳光子学中的应用