NeurIPS 2019:英伟达展示基于AI的自动编舞软件

Android社区 收藏文章

example.gif

(题图 via Neowin

不过本文要为大家介绍的,则是英伟达在 NeurIPS 2019 上推出的一种基于深度学习的新模型。它能够根据输入的音乐,自动生成合适的舞蹈动作。

这款由加州大学和默塞德大学合作开发的能够自动编舞的软件,亦被称作 AI Choreographer 。

尽管表面上看起来并不难,但研究团队注意到:测量音乐和舞蹈之间的精确相关性,仍需考虑诸多的变量,比如音乐的节拍和风格。

为此,研究团队收集了三种具有代表性的舞蹈类别,分别是芭蕾舞、尊巴舞、以及嘻哈。在分析了 36.1 万段舞蹈剪辑后,研究人员再通过训练系统来使用对抗网络(GAN)。

1575964877_nvidia_ai_choreographer_model_schematic.jpg

作为分解合成框架的核心组件,GAN 的复杂程度如上图所示(来自:GitHub

自上而下来看,团队借助运动节拍检测器,对从实际舞蹈序列中切割出来的各个单元进行归一化,然后训练 DU-VAE 对舞蹈单元进行建模。

编舞阶段,需给予其一定的音乐与舞蹈数据源,然后借助 MM-GAN 学习如何根据特定音乐来编排各个小节。

测试期间,研究人员从音乐中提取了样式和节拍,然后以循环方式合成一系列舞蹈单元,最终套上节拍整形器进行梳理输出。

为了训练模型,研究团队使用了 PyTorch 深度学习框架和 Nvidia Tesla v100 GPU,辅以 OpenPose 执行姿势处理。

后者是一种实时多人系统,用于联合检测单个图像中的人体、手部、面部和足部的关键点。

展望未来,Nvidia 计划将这套方法拓展到其它舞蹈风格,比如流行舞和伴舞。NeurIPS 会议结束后,相关源码和模型将在 GitHub 上发布。

相关文章:

Nvidia研究人员提出用2D图像生成3D对象的渲染框架的方法

相关标签
 相关文章
王慧文病休53天,旗下OneFlow团队重新创业 1年以前  |  1次阅读
智己CEO现场怒怼!不满LS6和小鹏G6当对手 1年以前  |  1次阅读
董明珠回应落榜世界500强:总比爆雷的世界500强好 1年以前  |  1次阅读
阿里云上线 AI 视频生成工具 Live Portait:可一键让照片开口说话 1年以前  |  78次阅读
妙鸭相机将并入神力视界,阿里大文娱CTO郑勇:不是“搬家”是“回家” 1年以前  |  85次阅读
特斯拉上海超级工厂约40秒下线一台车,零部件本土化率超95% 1年以前  |  69次阅读
宁德时代发布神行超充电池,可实现充电10分钟行驶800里 1年以前  |  71次阅读
中科院博士被骗到缅甸已一年!女友:他负债几万,家里条件一般,以为去当翻译 1年以前  |  85次阅读
小鹏汽车否认收购玛莎拉蒂传闻:系谣言 1年以前  |  63次阅读
联想二季度净利润猛降66%,股价应声跳水 1年以前  |  80次阅读
业内人士:视觉中国对不同侵权主体采用差异化策略,老客由销售沟通新客发律师函 1年以前  |  70次阅读
恒大集团在美国申请破产保护 1年以前  |  56次阅读
劳斯莱斯首款纯电轿跑将在北美亮相 1年以前  |  89次阅读
realme印度前CEO确认加盟荣耀,即将推出手机新品 1年以前  |  88次阅读
OpenAI正在测试内容审核系统,一天可以完成六个月的工作 1年以前  |  80次阅读
谷歌百人“复仇者联盟”出击,将发对标GPT-4的大模型,26位研发主管名单流出 1年以前  |  77次阅读
OpenAI收购数字产品公司Global Illumination,为创立以来首笔公开收购 1年以前  |  80次阅读
海口规定:电动汽车充电服务费不得超过0.65元每度 1年以前  |  80次阅读
波音任命柳青为波音中国总裁 1年以前  |  88次阅读
业内人士谈图片复杂代理链:图片代理商越多摄影师分成越少 1年以前  |  67次阅读

扫一扫

在手机上阅读