ContorlNet作者的研究!LayerDiffusion可生成商业素材级别透明PNG图片
用于生成图像的大规模模型已经成为计算机视觉的基础而图形,令人惊讶的是,很少有研究关注分层内容生成或透明图像生成。这种情况与巨大的市场需求形成鲜明对比。
ContorlNet的作者研究了一款...
港大开发V-IRL平台:将真实世界地图纳入虚拟环境 给AI Agent完整的一生!
近日,港大和NYU的研究团队合作开发了一个名为V-IRL的平台,该平台将真实世界的地图、街景等丰富信息融入到虚拟环境中,为AI Agent提供了更真实和完整的生活体验。
这项研究的核心在于构建一...
Stable Diffusion 3 惊艳亮相,可生成图像真假难辨!
大模型领域,每家公司都在争分夺秒。在文生图这条赛道上,面对 Midjourney、DALL-E 的围攻,2 月 22 日,初创公司 Stability AI 宣布推出下一代 AI 图像生成器——Stable Diffusion 3(简称 SD...
Meta首发AI视频模型V-JEPA 可用人类的理解方式看世界
近日,深度学习领域泰斗LeCun在WGS峰会上怒斥Sora模型不能真正理解物理世界,引起广泛关注。他指出,仅根据文字提示生成逼真的视频,并不代表模型理解了物理世界,与基于世界模型的因果预测...
Sora助推OpenAI估值飙升275%!跃升至全球第三大独角兽
日前,打造了ChatGPT的人工智能公司OpenAI发布了首个文生视频模型Sora,用户通过一句话,就能生成长达1分钟的高清视频。
在Sora发布后,OpenAI的估值正在大幅飙升。市场预计,在最新一轮...
ComfyUI发布最新3D Pack 可快速将图片转换为3D模型
ComfyUI最新的3D Pack现已发布,让用户可以快速将图片转换为3D模型,并在RTX3080GPU上不到30秒内完成。这一新功能让用户能够直观地查看3D模型,并自动创建多个相机角度,从各种方向全方位地...
LangChain 的 LLM 应用开发平台LangSmith正式开放
LangChain的LLM应用开发平台LangSmith正式开放给了所有人使用,同时宣布获得了Sequoia领投的A轮融资。LangSmith是一个统一的DevOps平台,用于开发、协作、测试、部署和监控LLM应用程序。它是...
继GPT-4出来之后 一款击败「GPT-4之外所有大模型神秘新模型」“Miqu”展露锋芒
近期AI社区掀起了一场关于Mistral-Medium模型的讨论,该模型意外泄露并与一个名为quot;Miququot;的新模型有关。Miqu在EQ-Bench基准上的表现引起关注,直接击败除GPT-4之外的所有大模型,得分...
微软成立专门的 AI 团队,开发类似 OpenAI 模型的小型 AI 模型,成本更低
微软正在与 OpenAI 竞争,在开发小型语言模型方面形成了专门的 AI 团队。据《The Information》报道,这些小型语言模型将具有类似于 OpenAI 的 ChatGPT 的功能。微软已经组建了一个团队来应...
阿里推生成模型开源框架SCEPTER 支持和简化图像生成
SCEPTER是由阿里巴巴开发的一个专为生成模型设计的开源框架。它用于训练、微调和推理生成模型,涵盖诸如图像生成、转换和编辑等下游任务。这个框架专门用于支持和简化图像生成、合成和编辑任...