博客
关于我
Facebook将照片3D化技术商用,强大的算法+海量的数据+移动端优化是工程亮点
阅读量:556 次
发布时间:2019-03-09

本文共 1079 字,大约阅读时间需要 3 分钟。

Facebook 开源的 3D 照片转化技术:基于移动端视觉算法的创新方案

近日,Facebook AI 团队发布了一项颠覆性技术:通过 Facebook APP 的用户可以将单摄像头拍摄的 2D 照片转化为 3D 照片。这项服务目前已支持 iPhone 7 及以上版本的苹果手机以及大多数中高端安卓手机。

3D 拍摄技术的进步

3D 拍摄技术一直是手机摄像头发展的重要方向。虽然双目摄像头是主流方案,但学术界长期致力于研究如何仅利用单摄像头的 2D RGB 照片生成 3D 照片。这种技术不仅降低了硬件成本,还让我们得以观察经典照片的 3D 化效果。

Facebook 的技术实现

Facebook 的实现方案主要包括以下几个关键技术:

1. U-Net 架构的改进

Facebook 选择使用 U-Net 结构来实现 2D 照片到 3D 照片的转化。该架构通过 skip 连接方式部署 FBNet 模块。U-Net 编码器和解码器均包含五个阶段,每个阶段对应不同的空间分辨率。

2. FBNet 模块

FBNet 模块是 U-Net 的核心组件,包含以下功能:

  • 点卷积层
  • 可选的上采样层
  • K x K 深度卷积层
  • 附加的点卷积层

3. 神经架构搜索 (ChamNet)

为了实现高精度和计算效率的平衡,Facebook 团队采用了神经架构搜索方法 ChamNet 来优化网络结构。其搜索空间包含 3.4 x 10^22 种架构,耗时 3 天完成搜索,使用了 800 块 Tesla V100 GPU。

模型优化技术

为了进一步降低模型大小并提升计算速度,Facebook 采用了以下技术:

1. Int8 精度推断

通过将模型转化为 Int8 精度,显著降低了计算需求。该技术利用 PyTorch 生态的 QNNPack 和 QAT 方法,实现了训练阶段与产品部署阶段的性能差距缩小。

2. 模型量化训练

PyTorch 的 QNNPACK 和 QAT 方法为量化训练提供了开源支持,帮助开发者快速实现高效的模型推理。

数据准备与训练基础

Facebook 在训练阶段使用了百万级成对的 3D 照片和深度图,这是实现高精度效果的基础保障。

总结

Facebook 的这项技术不仅展现了 3D 照片转化的潜力,更体现了其在算法研究和工程实现方面的实力。尤其值得一提的是,团队将核心技术开源,为个人开发者和创业团队提供了宝贵的机会。

如果你对三维视觉技术和重建领域感兴趣,可以关注我们的交流群,获取最新动态。


原文地址:Facebook AI Research

转载地址:http://chbsz.baihongyu.com/

你可能感兴趣的文章
OpenMCU(二):GD32E23xx FreeRTOS移植
查看>>
OpenMCU(五):STM32F103时钟树初始化分析
查看>>
OpenMetadata 命令执行漏洞复现(CVE-2024-28255)
查看>>
OpenMMLab | S4模型详解:应对长序列建模的有效方法
查看>>
OpenMMLab | 【全网首发】Llama 3 微调项目实践与教程(XTuner 版)
查看>>
OpenMMLab | 不是吧?这么好用的开源标注工具,竟然还有人不知道…
查看>>
OpenMMLab | 面向多样应用需求,书生·浦语2.5开源超轻量、高性能多种参数版本
查看>>
OpenMP 线程互斥锁
查看>>
OpenMV入门教程(非常详细)从零基础入门到精通,看完这一篇就够了
查看>>
OpenObserve云原生可观测平台本地Docker部署与远程访问实战教程
查看>>
openoffice使用总结001---版本匹配问题unknown document format for file: E:\apache-tomcat-8.5.23\webapps\ZcnsDms\
查看>>
OpenPPL PPQ量化(2):离线静态量化 源码剖析
查看>>
OpenPPL PPQ量化(3):量化计算图的加载和预处理 源码剖析
查看>>
OpenPPL PPQ量化(4):计算图的切分和调度 源码剖析
查看>>
OpenPPL PPQ量化(5):执行引擎 源码剖析
查看>>
openpyxl 模块的使用
查看>>
OpenResty & Nginx:详细对比与部署指南
查看>>
OpenResty(nginx扩展)实现防cc攻击
查看>>
openresty完美替代nginx
查看>>
Openresty框架入门详解
查看>>