研究人员分享如何利用 AI 技术解决水下图片模糊和着色问题

Android社区 收藏文章

他们说,这种方法在质量和数量上都与最新技术相匹配,并且能够在单个显卡上以每秒 125 帧的速度进行处理。

该团队指出,大多数水下图像增强算法(例如那些调整白平衡的算法)都不是基于物理成像模型实现,这使其不适用于一些任务。相比之下,这种方法利用了生成式对抗网络( GAN )(一种深度学习模型,模型通过框架中两个模块:生成模型和判别模型的互相博弈学习产生相当好的输出),以生成一组特定调查地点的图像并在此基础上引入第二种算法, U-Net 。

研究小组对 GAN 进行了一系列有标记场景的训练,这些场景包括 3733 幅图像和相应的深度地图,主要包括扇贝、海参、海胆和室内海洋农场内的其他此类生物。他们还获得了包括 NY Depth 在内的公开数据集,其中包含了总共数千张水下照片。

训练后,研究人员将双模型方法的结果与基线模型方法的结果进行了比较。他们指出,前者技术的优势在于它在颜色恢复上是统一的,这使它能在很好恢复绿色色调图像的同时,不破坏原始输入图像的底层结构。通常情况下,这种方式在保持“适当的”亮度和对比度的同时,还能设法恢复颜色,而在这方面其他解决方案并不特别擅长。

值得注意的是,这并不是第一个想到利用AI技术从损坏的图片中重建画面的研究团队。剑桥咨询( Cambridge Consultants )公司的 AI 系统 DeepRay 利用了一套训练有素的 GAN 来处理 10 万张静止图像的数据集,以消除不透明的玻璃窗格导致的失真。开源 DeOldify 项目使用了包括 GANs 在内的一系列人工智能模型来对旧图像和胶片进行着色和恢复。

在其他方面,微软亚洲研究院( Microsoft Research Asia )的科学家在 9 月份详细介绍了一个用于自主视频着色的端到端系统; NVIDIA 的研究人员去年描述了一个框架,该框架仅基于一个被注释过得彩色视频帧推断颜色分类;今年 6 月,谷歌AI团队推出了一种无需人工监督即可对灰度视频进行着色的算法。

venturebeat

相关标签
 相关文章
王慧文病休53天,旗下OneFlow团队重新创业 1年以前  |  1次阅读
智己CEO现场怒怼!不满LS6和小鹏G6当对手 1年以前  |  1次阅读
董明珠回应落榜世界500强:总比爆雷的世界500强好 1年以前  |  1次阅读
阿里云上线 AI 视频生成工具 Live Portait:可一键让照片开口说话 1年以前  |  78次阅读
妙鸭相机将并入神力视界,阿里大文娱CTO郑勇:不是“搬家”是“回家” 1年以前  |  85次阅读
特斯拉上海超级工厂约40秒下线一台车,零部件本土化率超95% 1年以前  |  69次阅读
宁德时代发布神行超充电池,可实现充电10分钟行驶800里 1年以前  |  71次阅读
中科院博士被骗到缅甸已一年!女友:他负债几万,家里条件一般,以为去当翻译 1年以前  |  85次阅读
小鹏汽车否认收购玛莎拉蒂传闻:系谣言 1年以前  |  63次阅读
联想二季度净利润猛降66%,股价应声跳水 1年以前  |  80次阅读
业内人士:视觉中国对不同侵权主体采用差异化策略,老客由销售沟通新客发律师函 1年以前  |  70次阅读
恒大集团在美国申请破产保护 1年以前  |  56次阅读
劳斯莱斯首款纯电轿跑将在北美亮相 1年以前  |  89次阅读
realme印度前CEO确认加盟荣耀,即将推出手机新品 1年以前  |  88次阅读
OpenAI正在测试内容审核系统,一天可以完成六个月的工作 1年以前  |  80次阅读
谷歌百人“复仇者联盟”出击,将发对标GPT-4的大模型,26位研发主管名单流出 1年以前  |  77次阅读
OpenAI收购数字产品公司Global Illumination,为创立以来首笔公开收购 1年以前  |  80次阅读
海口规定:电动汽车充电服务费不得超过0.65元每度 1年以前  |  80次阅读
波音任命柳青为波音中国总裁 1年以前  |  88次阅读
业内人士谈图片复杂代理链:图片代理商越多摄影师分成越少 1年以前  |  67次阅读

扫一扫

在手机上阅读