博客
关于我
Facebook将照片3D化技术商用,强大的算法+海量的数据+移动端优化是工程亮点
阅读量:556 次
发布时间:2019-03-09

本文共 1298 字,大约阅读时间需要 4 分钟。

点击我爱计算机视觉标星,更快获取CVML新技术


近日,Facebook AI 团队官宣使用其 Facebook APP的用户均可以方便的在手机端将单摄像头拍摄的2D图像转成3D图像,这项服务支持iPhone 7以上苹果手机和大多数中高端安卓手机。

3D 拍摄是手机摄像头进化的重要方向,使用双目摄像头是主流方案,但一直以来学术界都在研究使用算法将单摄像头拍摄的2D RGB图像转化成3D图像(虽然也有人认为这并不科学),这不仅可以使得新设备硬件成本降低,而且可以让我们看到之前拍摄的老照片3D化后的效果。

值得一提的是,Facebook发布的这项功能的几种关键技术都是开源的,这可以让个人开发者和创业团队容易地也进入到照片3D化的研发和产品化中来。(由于国内无法使用Facebook app,这肯定是好的机会)

其将2D照片3D化的卷积网络使用U-Net的结构:

其中使用了面向移动设备优化的FBNet模块,该模块基本构成是点卷积层,可选的上采样层,K x K深度卷积层和附加的点卷积层。 如上图,该U-Net结构被修改为沿skip连接放置FBNet模块, U-Net编码器和解码器均包含五个阶段,每个阶段对应于不同的空间分辨率。

选择了算法架构并没有结束,为使得算法保有高精度和满足一定的受限计算资源,Facebook 工程师们使用了神经架构搜索方法ChamNet来配置结构参数。其搜索空间有3.4x1022种架构,他们使用了800块 Tesla V100 GPUs 耗费了3天时间完成了搜索。

FBNet 和 ChamNet开源地址:

https://github.com/facebookresearch/mobile-vision

为了更好的降低模型大小提高计算速度,他们进一步将模型转化为Int8数据,使用Int8精度推断,这里他们使用了PyTorch生态的QNNPack  和 QAT(量化感知训练)方法,进一步消除训练阶段和产品部署的模型性能差距。

这两项技术的开源地址和使用说明:

https://github.com/pytorch/QNNPACK

https://pytorch.org/docs/stable/quantization.html

当然上述工程方法都很重要,但更重要的是,训练阶段他们使用了百万级成对的3D图像和相应的深度图,这才是最终效果好的保障。

总之,照片3D化功能很吸引人,但Facebook 在整个工程开发中的流程和使用的工具也都是值得参考的!

原文地址:

https://ai.facebook.com/blog/-powered-by-ai-turning-any-2d-photo-into-3d-using-convolutional-neural-nets/


三维视觉交流群

关注最新最前沿的三维视觉、三维重建技术,扫码添加CV君拉你入群,(如已为CV君其他账号好友请直接私信)

(请务必注明:3D)

喜欢在QQ交流的童鞋,可以加52CV官方QQ群:805388940。

(不会时时在线,如果没能及时通过验证还请见谅)


长按关注我爱计算机视觉

转载地址:http://chbsz.baihongyu.com/

你可能感兴趣的文章
NLP 基于kashgari和BERT实现中文命名实体识别(NER)
查看>>
NLP 模型中的偏差和公平性检测
查看>>
Vue3.0 性能提升主要是通过哪几方面体现的?
查看>>
NLP 项目:维基百科文章爬虫和分类【01】 - 语料库阅读器
查看>>
NLP_什么是统计语言模型_条件概率的链式法则_n元统计语言模型_马尔科夫链_数据稀疏(出现了词库中没有的词)_统计语言模型的平滑策略---人工智能工作笔记0035
查看>>
NLP三大特征抽取器:CNN、RNN与Transformer全面解析
查看>>
NLP学习笔记:使用 Python 进行NLTK
查看>>
NLP度量指标BELU真的完美么?
查看>>
NLP的不同研究领域和最新发展的概述
查看>>
NLP的神经网络训练的新模式
查看>>
NLP采用Bert进行简单文本情感分类
查看>>
NLP问答系统:使用 Deepset SQUAD 和 SQuAD v2 度量评估
查看>>
NLP项目:维基百科文章爬虫和分类【02】 - 语料库转换管道
查看>>
NLP:从头开始的文本矢量化方法
查看>>
NLP:使用 SciKit Learn 的文本矢量化方法
查看>>
nmap 使用方法详细介绍
查看>>
nmap使用
查看>>
Nmap扫描教程之Nmap基础知识
查看>>
nmap指纹识别要点以及又快又准之方法
查看>>
Nmap渗透测试指南之指纹识别与探测、伺机而动
查看>>