点云上的深度学习

最新推荐文章于 2025-06-21 08:40:58 发布

maverick0

最新推荐文章于 2025-06-21 08:40:58 发布

阅读量1.2k

点赞数 1

CC 4.0 BY-SA版权

分类专栏：机器学习深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/maverick0/article/details/117409234

本文探讨3D深度学习，重点在于点云数据的处理。点云数据具有不规则性和置换不变性特点，适用于原始传感器数据如激光雷达。PointNet与PointNet++是处理点云数据的代表性网络结构，解决3D场景中的变换不变性问题。PointNet++通过局部区域学习改进了PointNet的平移不变性，适用于更复杂的3D特征提取。在3D物体识别等领域，结合2D与3D信息的Frustum PointNet展示了高效性能。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

我们往往需要数据的方法理解和处理三维数据，从而带来非常强烈的需求，在三位数据上的深度学习：3D Deep Learning。

3D 数据表达

我们往往需要数据的方法理解和处理三维数据, 通过深度传感器扫描得到的图像。

PointCloud

Mesh特别适合做建模和渲染。

Volumetric 是把空间划分成三维的网格（栅格）。

Multi-View Images RGB（D）使用图片的方式表达三维。往往用在可视化的方面。

为什么使用点云数据做3D深度学习

1）更接近原始的传感器数据。比如激光雷达（LiDAR）扫描到的数据，直接就是点云。Depth Sensor扫描到的图像也是点云，只不过是局部的点云。

2）数据表达更加简单

比较适合端到端的学习。数据结构简单，比如Mesh需要选择面片的形状和大小，Volumetric需要选择网格的大小。图像拍摄角度，另外对3d表达是不全面的，只能表达若干视角。

之前大部分工作都是集中在手工设计的点云特征上。针对特定的任务进行的假设，很难做通用型的工作，。所以更希望对特征进行深度学习的方法。

1）Irregular 不规则数据。不是定义在一个规则的网格上，数量也是任意数量。

栅格化：

所以之前有很多理论是把点云在均匀的分布在三位网格中（Voxelization）。然后通过3DCNN的拓展来处理这些数据。

缺点：

1）高算力： 3D的conv具有非常高的空间复杂度和时间复杂度。随着分辨率的增长都是3次方的增长。所以很多低分辨率，来降低复杂度。

投影：

讲3D数据投影成2D数据来计算，牺牲了3D表达信息。很多时候也需要决定投影角度，也不是一个简单的问题。

提取手工特征 + FC的方法。

网络数据性能，由手工提取特征来限制。

点云数据的特点：

1）Permutation Invariance 置换不变性。

点云数据表达上，是点的集合，跟顺序不相关。神经网络上对称函数是置换不变的。简单的置换函数有（MaxPool，sum，avg）等。

在这样的情况下，如何用神经网络来实现对称函数？

映射到更高维的空间，这样是个冗余的空间，因为冗余在对称操作中，可以保留信息。

h是复用到每一个电商，g是对称的。下面是个原始point。

MLP多层感知器，g取maxpooling。保证它是对称的。

实际上p

最低0.47元/天解锁文章

200万优质内容无限畅学

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。