用于生成图像的大规模模型已经成为计算机视觉的基础而图形,令人惊讶的是,很少有研究关注分层内容生成或透明图像生成。这种情况与巨大的市场需求形成鲜明对比。 ContorlNet的作者研究了一款...
2024-03-06 721

近日,港大和NYU的研究团队合作开发了一个名为V-IRL的平台,该平台将真实世界的地图、街景等丰富信息融入到虚拟环境中,为AI Agent提供了更真实和完整的生活体验。 这项研究的核心在于构建一...
2024-03-06 691

大模型领域,每家公司都在争分夺秒。在文生图这条赛道上,面对 Midjourney、DALL-E 的围攻,2 月 22 日,初创公司 Stability AI 宣布推出下一代 AI 图像生成器——Stable Diffusion 3(简称 SD...
2024-02-26 1.02k

近日,深度学习领域泰斗LeCun在WGS峰会上怒斥Sora模型不能真正理解物理世界,引起广泛关注。他指出,仅根据文字提示生成逼真的视频,并不代表模型理解了物理世界,与基于世界模型的因果预测...
2024-02-22 809

日前,打造了ChatGPT的人工智能公司OpenAI发布了首个文生视频模型Sora,用户通过一句话,就能生成长达1分钟的高清视频。 在Sora发布后,OpenAI的估值正在大幅飙升。市场预计,在最新一轮...
2024-02-22 776

ComfyUI最新的3D Pack现已发布,让用户可以快速将图片转换为3D模型,并在RTX3080GPU上不到30秒内完成。这一新功能让用户能够直观地查看3D模型,并自动创建多个相机角度,从各种方向全方位地...
2024-02-22 1.49k

LangChain的LLM应用开发平台LangSmith正式开放给了所有人使用,同时宣布获得了Sequoia领投的A轮融资。LangSmith是一个统一的DevOps平台,用于开发、协作、测试、部署和监控LLM应用程序。它是...
2024-02-22 1.04k

近期AI社区掀起了一场关于Mistral-Medium模型的讨论,该模型意外泄露并与一个名为quot;Miququot;的新模型有关。Miqu在EQ-Bench基准上的表现引起关注,直接击败除GPT-4之外的所有大模型,得分...
2024-02-19 740

微软正在与 OpenAI 竞争,在开发小型语言模型方面形成了专门的 AI 团队。据《The Information》报道,这些小型语言模型将具有类似于 OpenAI 的 ChatGPT 的功能。微软已经组建了一个团队来应...
2024-02-19 908

SCEPTER是由阿里巴巴开发的一个专为生成模型设计的开源框架。它用于训练、微调和推理生成模型,涵盖诸如图像生成、转换和编辑等下游任务。这个框架专门用于支持和简化图像生成、合成和编辑任...
2024-02-19 566
显示验证码