国际人工智能联合会议(IJCAI)是人工智能领域最古老、最具权威性的学术会议之一,自1969年首次举办以来,至今已有近六十年的历史。它见证了人工智能从萌芽到蓬勃发展的全过程,是全球人工智能研究者、学者、工程师和行业专家汇聚交流的重要平台,也是CCF A类会议。IJCAI 2025将于2025年8月16日至8月22日在加拿大蒙特利尔举办。IJCAI 2025共有5404份投稿,录用1024篇,录取率为 19.3%。
导读
G3PT是高德地图自研的3D生成基座大模型,也是自动化3D资产生产的核心引擎,目前已广泛支持用于地图渲染的3D内容资产,包括3D世界建筑、导航车标以及3D数字人等。这项突破性技术大幅度降低了3D资产的制作成本,并且极大地扩展了用户在地图上的消费内容场,未来具有巨大的商业空间。
随着OpenAI推出GPT-4o图像生成功能,首次实现了基于大型语言模型(LLM)自回归架构的原生图像生成,其性能突破了当前主流的扩散模型(Diffusion Model)架构,引发了业界对基于自回归架构统一多模态建模的高度关注与广泛期待。
我们团队同样秉持对自回归架构价值的坚定信念,历经一年的技术攻坚,成功打造了业界首个基于自回归架构的原生3D生成基座大模型——G3PT。该模型通过单张图像即可生成高质量3D Mesh,其核心创新之处在于提出了Cross-scale Querying Transformer模块,实现了3D 数据的多尺度1D Tokenizer,并且引入了Next-scale Autoregressive架构,取代了传统GPT中的Next-token Autoregressive架构,从而巧妙地解决了3D数据无序性这一长期困扰自回归建模的关键难题。
尤为值得一提的是,我们在3D生成领域首次验证了自回归架构的Scaling Law,其生成效果与业界基于扩散模型架构的同类闭源产品持平,并且生成速度远优于扩散模型架构,有力地证明了自回归架构在3D生成任务中的巨大潜力与优势。目前,我们正全力推进相关工作的开源,旨在进一步推动3D生成社区的发展,敬请期待。
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2375144.html
如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!