-
吉娃娃or松饼难题被解决!IDEA研究院新模型T-Rex2打通文本视觉Prompt,连黑客帝国的子弹都能数清楚
还记得黑客帝国经典的子弹时间吗?IDEA研究院最新检测模型T-Rex2,可以齐刷刷给全部识别出来~面对难倒一众大模型「吉娃娃or松饼」的难题,它只需被投喂一张吉娃娃的照片,就
-
DeepMind发布新模型Mirasol3B:更高效处理音频、视频数据
GoogleDeepMind日前悄然宣布了其人工智能研究的重大进展,推出了一款名为“Mirasol3B”的新型自回归模型,旨在提升对长视频输入的理解能力。该新模型展示了一种颠覆性的多模
-
Oracle 在 Nvidia AI 中循环进行端到端模型开发
Nvidia的AI企业软件和DGX云已在Oracle云市场上推出了两个专用应用程序。通过这一合作,Oracle客户可以直接从市场购买Nvidia的AI技术,并在Oracle云基础设施上训练模型。需要
-
10秒极速出片!还有超多特效模版,国产视频模型又整新活了
2025刚开年,没想到国产AI视频模型PixVerse又给咱们整了一波新活!继上次席卷全网的万物皆可毒液之后,它们又火速更新了3.5版本。新模型不仅能10秒光速生成高清视频复杂运动
-
大模型落地“诸神之战”,场景玩家先杀出重围了
都说今年是大模型落地元年,但实际进展还是快得超出想象了。在一年一度的AWE现场,我们发现大模型都能给家居家电“带货”了。技术落地的底层定律中,始终都包含一条:得场景
-
Sora模型体验入口 OpenAI文生视频软件工具app免费下载地址
Sora是一个基于大规模训练的文本控制视频生成扩散模型。它能够生成长达1分钟的高清视频,涵盖广泛的视觉数据类型和分辨率。Sora还展现出一些模拟物理世界和数字世界的能力,
-
买不到用户的大模型,开始倒闭了
拿到2000万元创业投资的大林,仅过了一年多,便在2024年3月解散了公司。随着大厂大模型开始0元购,“国内AI用户本来就不多,和大厂相比,B端企业拼不过价格,半年几乎没有商
-
天工SkyMusic体验入口 昆仑万维AI音乐生成大模型免费邀测申请地址
天工SkyMusic是一款基于昆仑万维「天工3.0」超级大模型打造的AI音乐生成大模型。它支持高质量AI音乐生成、人声合成、歌词段落控制、多种音乐风格和音乐智能表达等功能。「天
-
微软推大模型整合性工具库PromptBench
微软最近推出了一个专门用于评估大语言模型的整合性工具库,名为PromptBench。该工具库提供了一系列工具,包括创建不同类型的提示、进行数据集和模型加载、执行对抗性提示攻
-
Gemini 1.5官网体验入口 谷歌新AI助手模型怎么使用方法教程指南
Gemini1.5是谷歌最新一代的AI助手模型,具有长篇语境理解能力,支持多模态输入,在文本、代码、图像、音频和视频等领域表现出色。Gemini1.5采用了更高效的模型结构,显著提