首页 科技内容详情
皇冠体育官网开户(www.hg108.vip):一句话产生 AI 绘画落伍了!现在 NVIDIA 的 Magic3D 让你一句话产生 3D 模型

皇冠体育官网开户(www.hg108.vip):一句话产生 AI 绘画落伍了!现在 NVIDIA 的 Magic3D 让你一句话产生 3D 模型

分类:科技

标签: # 皇冠信用网app

网址:

SEO查询: 爱站网 站长工具

点击直达

皇冠体育官网开户www.hg108.vip)是一个开放皇冠体育官网即时比分、皇冠体育官网开户的平台。皇冠体育官网开户平台(www.hg108.vip)提供最新皇冠体育官网登录,皇冠体育官网APP下载包含新皇冠体育官网代理、会员APP。

ADVERTISEMENT

Nvidia进入 AI 生成模型领域的研究,直接比别人多一个次元:一句描述生成 3D 模型。 

我们生活在3D的世界里,尽管目前大多数应用程式是 2D 的,但人们一直对 3D 数位内容有很高的需求,包括游戏、娱乐、建筑和机器人模拟等应用。 

然而,创建专业的 3D 内容需要很高的艺术与审美素养和大量 3D 建模专业知识。人工完成这项工作需要花费大量时间和精力来培养这些技能。 

需求大又是「劳动密集型行业」,那么有没有可能交给 AI 来做?上周五,Nvidia提交到预印版论文平台 arXiv 的论文引起了人们的关注。 

和现在流行的 NovelAI 差不多,人们只需要输入一段文字比如「一只坐在睡莲上的蓝色箭毒蛙」,AI 就能为你产生个纹理造型俱全的 3D 模型出来。

Magic3D 还可以执行基于提示的 3D 网格编辑:给定低解析度 3D 模型和基本提示,可以更改文本进而修改产生的模型内容。此外,作者还展示了保持画风,以及将 2D 图像样式应用于 3D 模型的能力。

Stable Diffusion 的论文在 2022 年 8 月才首次提交,几个月就已经进化到这样的程度,不禁让人感叹科技发展的速度。 

Nvidia表示,你只需要在这个基础上稍作修改,产生的模型就可以当做游戏或 CGI 艺术场景的素材了。 

3D 生成模型的方向并不神秘,其实在 9 月 29 日,Google曾经发布过一款文本到 3D 的产生模型 DreamFusion,Nvidia在 Magic3D 的研究目标直接就是以该方法为对象。

类似于 DreamFusion 用文本产生 2D 图像,再将其最佳为体积 NeRF(神经辐射场)资料的流程,Magic3D 使用两阶段生成法,用低解析度生成的粗略模型再最佳到更高的解析度。 

Nvidia的方法首先使用低解析度扩散先验获得粗糙模型,并使用稀疏 3D 杂凑网格结构进行加速。用粗略表示作为初始,再进一步最佳了带纹理的 3D 网格模型,该模型具有与高解析度潜在扩散模型交互的高效可微分算绘器。 

Magic3D 可以在 40 分钟内创建高品质的 3D 网格模型,比 DreamFusion 快 2 倍(后者平均需要 1.5 小时),同时还做到了更高的解析度。统计表明相比 DreamFusion,61.7% 的人更喜欢Nvidia的新方法。 

,

约搏以太坊www.eth108.vip)采用以太坊区块链高度哈希值作为统计数据,约搏以太坊游戏数据开源、公平、无任何作弊可能性。

,

连同图像调节产生功能,新技术为各种创意应用开辟了新途径。 

论文下载连结:Magic3D: High-Resolution Text-to-3D Content Creatio

技术细节 

Magic3D 可以在较短的计算时间内根据文本 prompt 合成高度详细的 3D 模型。Magic3D 透过改进 DreamFusion 中的几个主要设计选择来使用文本 prompt 合成高品质的 3D 内容。 

具体来说,Magic3D 是一种从粗到精的最佳方法,其中使用不同解析度下的多个扩散先验来最佳 3D 表征,进而产生视图一致的几何形状以及高解析度细节。Magic3D 使用监督方法合成 8 倍高解析度的 3D 内容,速度也比 DreamFusion 快 2 倍。 

Magic3D 的整个工作流程分为两个阶段:在第一阶段,该研究最佳了类似于 DreamFusion 的粗略神经场表征,以实现具有基于杂凑网格(hash grid)的记忆体和计算的高效场景表征。 

在第二阶段该方法切换到最佳网格表征。这个步骤很关键,它允许该方法在高达 512 × 512 的解析度下利用扩散先验。由于 3D 网格适用于快速图形算绘,可以即时算绘高解析度图像,因此该研究利用基于光栅化的高效微分算绘器和相机特写来恢复几何纹理中的高频细节。

基于上述两个阶段,该方法可以产生高仿真的 3D 内容,并且很容易在标准图形软体中导入和视觉化。 

此外,该研究展示了用文本 prompt 对 3D 合成过程的创造性控制能力,如下图 1 所示。

为了对比实际应用效果,Nvidia的研究人员把 Magic3D 和 DreamFusion 在 397 个文本提示生成的内容上进行了比较。平均的粗略模型生成阶段花费 15 分钟,精细阶段训练了 25 分钟,所有执行时间均在 8 块Nvidia A100 GPU 上测得。

 

虽然论文和 demo 只是第一步,但Nvidia已经为 Magic3D 想好了未来的应用方向:为游戏和元宇宙世界提供制作海量 3D 模型的工具,而且让所有人都可以上手使用。 

当然,最早上线这项功能的可能会是Nvidia自己的 Omniverse。 

资料来源:

  • 3D for everyone? Nvidia’s Magic3D can generate 3D models from text
,

澳洲幸运5玩法www.a55555.net)?澳洲幸运5是澳洲幸运5彩票官方网站,开放澳洲幸运5彩票会员开户、澳洲幸运5彩票代理开户、澳洲幸运5彩票线上投注、澳洲幸运5实时开奖等服务的平台。

 当前暂无评论,快来抢沙发吧~

发布评论