灵度智能

ThemeStation：AI生成3D主题乐园，风格一致角色、建筑批量一键生成

人工智能·头条

“ThemeStation: Generating Theme-Aware 3D Assets from Few Exemplars” 3D模型生成需要设计师消耗大量的精力完成，目前无法快速大规模生成。为了解决这个问题，提升3D...

2024-06-24 2.38k

腾讯开源Hunyuan-DiT混元大模型，首个中文原生DiT架构大模型，刷新多个SOTA

人工智能·头条

近日，腾讯开源了旗下的混元大模型Hunyuan-DiT。模型含有15亿参数量，在文本-图像一致性、排除AI伪像的能力、主题清晰度和美感等任务上取得全面SOTA。目前已在 Hug...

2024-05-18 2.86k

SemCity：使用AI进行真实3D户外环境场景生成

人工智能·头条

摘要 SemCity是一个3D Diffusion模型，用于在现实世界的户外环境中生成语义场景。与合成数据不同，真实的户外数据集由于传感器限制通常包含更多的空白空间，这给学习真实户外...

2024-05-18 2.55k

清华发表GeneOH Diffusion，让AI看懂手物交互动作，迈进全息操作

人工智能·头条

“GENEOH DIFFUSION: TOWARDS GENERALIZABLE HAND-OBJECT INTERACTION DENOISING VIA DENOISING DIFFUSION” 电影《钢铁侠》中史塔克可以通过挥动双手直接操作全息投影中...

2024-05-16 1.37k

FixAgent：使用大模型进行自动化代码调试，80个BUG中成功修复了79个！

人工智能·头条

“A Unified Debugging Approach via LLM-Based Multi-Agent Synergy” 对于程序员来说，找BUG是一个痛苦的过程。目前的大模型已经可以自己写代码了，那是否可以实现自动D...

2024-05-15 1.85k

字节发表StoryDiffusion：让AI生成一个好的漫画故事，已开源

人工智能·头条

你是否还在为如何创作一个漫画故事发愁？让我们来看看字节和南开发表的StoryDiffusion，让AI自动生成一个好的漫画故事。项目主页：https://storydiffusion.github.io/ ...

2024-05-14 1.79k

ChatHuman：一个模型实现3D数字人交互分析、3D姿势估计、情感分析

人工智能·头条

“ChatHuman: Language-driven 3D Human Understanding with Retrieval-Augmented Tool Reasoning” 项目主页：https://chathuman.github.io/ 论文地址：https://arxiv.o...

2024-05-11 1.56k

ID-Aligner：要真实还要好看，结合美学评分的高保真身份保持生成方法

人工智能·头条

“ID-Aligner: Enhancing Identity-Preserving Text-to-Image Generation with Reward Feedback Learning” 项目主页：https://idaligner.github.io/ 论文地址：https://...

2024-05-10 1.38k

清华发表AutoWebGLM，基于大模型的自动网页导航Agent，让大模型帮我们浏览网页

人工智能·头条

“AutoWebGLM: Bootstrap And Reinforce A Large Language Model-basedWeb Navigating Agent” AutoWebGLM是一个旨在构建更高效的语言模型驱动的自动web导航代理的项目。...

2024-05-10 1.34k

LinkIn最新研究，利用大模型提升客户技术支持服务质量，有效降低28.6%响应时间

人工智能·头条

本文介绍了一种将知识图谱与检索增强生成（RAG）相结合的客户服务问答方法。本方法利用历史问题构建知识图谱，保留了问题内部结构和问题间关系，提高了检索准确...

2024-05-10 1.07k

ThemeStation：AI生成3D主题乐园，风格一致角色、建筑批量一键生成

腾讯开源Hunyuan-DiT混元大模型，首个中文原生DiT架构大模型，刷新多个SOTA

SemCity：使用AI进行真实3D户外环境场景生成

清华发表GeneOH Diffusion，让AI看懂手物交互动作，迈进全息操作

FixAgent：使用大模型进行自动化代码调试，80个BUG中成功修复了79个！

字节发表StoryDiffusion：让AI生成一个好的漫画故事，已开源

ChatHuman：一个模型实现3D数字人交互分析、3D姿势估计、情感分析

ID-Aligner：要真实还要好看，结合美学评分的高保真身份保持生成方法

清华发表AutoWebGLM，基于大模型的自动网页导航Agent，让大模型帮我们浏览网页

LinkIn最新研究，利用大模型提升客户技术支持服务质量，有效降低28.6%响应时间

微信公众号

客服微信