路西法AI前沿

Controlnet作者推新项目C-Light 能生成符合光照要求的背景

人工智能·头条

Controlnet的作者最近推出了一项名为C-Light的新技术，这是一款能够操控图像生成时光照效果的AI工具。C-Light的出现，为图像编辑领域带来了重大突破，特别是在商品图合成等需要精确保持原有...

2024-05-18 2.48k

MoA：用于图片合成的混合注意力架构可实现风格参考和人物融合

人工智能·头条

在最新的研究中，提出了一种名为注意力混合模式（MoA）的新架构，旨在个性化文本到图像扩散模型，可以实现风格参考和人物融合的效果。受大型语言模型（LLMs）中使用的专家混合机制的启发，M...

2024-05-15 1.38k

谷歌2024I/O大会： AI 搜索“AI Overviews”发布

人工智能·头条

在今日举行的谷歌2024年I/O开发者大会上，谷歌公司正式推出了其全新搜索体验——“AI Overviews”，这标志着谷歌搜索引擎问世25年来的又一次重大更新。据悉，该体验将于本周首先在美国地区上线...

2024-05-15 1.11k

谷歌推出文生视频模型Veo：对标Sora 时长超 1 分钟

人工智能·头条

在今日举行的谷歌2024I/O开发者大会上，谷歌正式推出了备受瞩目的全新视频生成模型——Veo。这款产品被视为对OpenAI三个月前推出的文本转视频工具Sora的直接挑战，旨在为用户提供更加高质量、...

2024-05-15 1.32k

LLaVA++：为Phi-3和Llama-3模型增加视觉处理能力

人工智能·头条

LLaVA++项目通过扩展现有的LLaVA模型，成功地为Phi-3和Llama-3模型赋予了视觉能力。这一改进标志着AI在多模态交互领域的进一步发展。主要创新点包括: 模型整合: LLaVA++将Phi-3和Llama-3...

2024-05-15 1.34k

Meta AI推MA-LMM:用于长视频理解的记忆增强多模态大模型

人工智能·头条

Meta AI近日推出了一种名为MA-LMM的新型模型，旨在解决长期视频理解中的挑战。LLMs在处理文本数据时表现出了令人印象深刻的能力，但在处理视频输入方面存在一些限制，例如上下文长度限制和GP...

2024-05-11 1.42k

Adobe Photoshop测试版推出AI图像生成功能

人工智能·头条

Adobe Photoshop的最新测试版现已引入一项革命性的功能，允许用户通过简单的文本提示，利用人工智能技术生成图像。此外，新功能还提供了利用参考图像扩展和增添背景的能力，极大地丰富了图像...

2024-05-04 1.19k

DreamWalk：实现对图像生成风格和内容的精细控制

人工智能·头条

在图像生成领域，精确控制图像的风格和特征一直是一个具有挑战性的问题。然而，DreamWalk技术的出现为这一难题提供了解决方案，使得用户可以更加自由地决定图像中哪部分应该更加强烈地体现...

2024-04-28 1.25k

谷歌发布基础世界模型Genie：11B参数，单张图生成可交互的虚拟世界

人工智能·头条

谷歌最新发布了基础世界模型Genie，这一模型拥有110亿参数，能够生成可交互的虚拟世界。Genie的出现让人们看到了人工智能在虚拟世界的无限可能性。Genie可以在没有动作标签的情况下学习控制...

2024-04-19 1.5k

新加坡国立大学研究人员设计出一种利用鱼鳞传递加密信息的方法

人工智能·头条

科学家们设计出了一种利用鱼鳞传递加密信息的方法。这项技术不仅能将海鲜业的废弃物从垃圾填埋场转移出来，而且成本也低于特殊油墨等现有方案。这项技术是由 Sow Chorng Haur 教授领导的新加...

2024-04-19 1.35k

Controlnet作者推新项目C-Light 能生成符合光照要求的背景

MoA：用于图片合成的混合注意力架构可实现风格参考和人物融合

谷歌2024I/O大会： AI 搜索“AI Overviews”发布

谷歌推出文生视频模型Veo：对标Sora 时长超 1 分钟

LLaVA++：为Phi-3和Llama-3模型增加视觉处理能力

Meta AI推MA-LMM:用于长视频理解的记忆增强多模态大模型

Adobe Photoshop测试版推出AI图像生成功能

DreamWalk：实现对图像生成风格和内容的精细控制

谷歌发布基础世界模型Genie：11B参数，单张图生成可交互的虚拟世界

新加坡国立大学研究人员设计出一种利用鱼鳞传递加密信息的方法

微信公众号

客服微信