增强现实与虚拟现实技术在不同领域的应用与研究
立即解锁
发布时间: 2025-08-29 12:10:53 阅读量: 9 订阅数: 24 AIGC 

### 增强现实与虚拟现实技术在不同领域的应用与研究
在当今科技飞速发展的时代,增强现实(AR)和虚拟现实(VR)技术正逐渐在各个领域展现出巨大的潜力。本文将深入探讨这两项技术在不同场景下的应用,包括VR中的传感器融合与姿态估计,以及AR在手术图像显示系统中的应用。
#### 传感器融合与姿态估计在VR中的应用
在VR体验中,为了提供更真实、更自然的交互,传感器融合与姿态估计技术至关重要。
##### 模型对比
为了直观比较不同方法的效果,研究人员将模型进行重叠,展示估计的虚拟形象与基础虚拟形象之间的偏移。同时,还进行了定量比较,生成了源数据与姿态估计和传感器融合之间的坐标和旋转偏移。从数据中可以推断出,虽然两种方法在关键点上的性能相当,但传感器融合在预测末端执行器方面表现更好,并且在头部到骨骼的旋转预测上更准确。
|对比项目|传感器融合|姿态估计|
| ---- | ---- | ---- |
|末端执行器预测|更好| - |
|头部到骨骼旋转预测|更准确| - |
##### 计算机视觉算法性能
在姿态估计中,使用了不同的计算机视觉算法。对于OpenCV实现,比较了Mediapipe和TensorFlow这两种现成的解决方案,在标准i5处理器和GPU上进行测试。结果表明,Mediapipe在生成预测时具有更高的帧率,表现更优。然而,这些模型在可训练的关键点数量上存在限制,因此研究人员转向了自定义的ResNet模型。
以下是不同模型的性能对比:
|模型|帧率|准确性|
| ---- | ---- | ---- |
|ResNet模型|15fps|较高|
|MobileNet|32fps|较低|
ResNet模型在1061张图像上进行了姿态检测的准确性测试,展示了其在单人或多人姿态检测中的性能。为了提高速度,还测试了其他模型,如MobileNet,它可以达到32fps的帧率,但准确性有所下降。此外,模型在测试数据上的平移坐标平方平均误差(SMAE)为32mm。
mermaid图如下:
```mermaid
graph LR
A[姿态估计] --> B[OpenCV实现]
B --> C[Mediapipe]
B --> D[TensorFlow]
B --> E[ResNet模型]
E --> F[单人姿态检测]
E --> G[多人姿态检测]
A --> H[其他模型]
H --> I[MobileNet]
```
##### 与Unity的集成
为了测试ResNet模型的集成效果,将估计的关键点投影到Unity中,以可视化骨骼轮廓。然后将这些关键点重叠到启用了反向运动学(IK)的虚拟形象上,展示了变换时的比例和旋转准确性。
为了测试应用程序的可用性,研究人员进行了实时VR交互模拟。通过传感器融合,基于实时视频流和输入设备(如头戴式显示器和控制器)模拟了一个虚拟形象。利用物理引擎,在虚拟空间中创建了额外的刚体,并将虚拟形象定义为具有碰撞功能的刚体。实验结果展示了虚拟形象根据用户的实时动作与3D对象进行交互的场景,如向后踢块、向前踢球和在VR中踢墙。
#### AR在手术图像显示系统中的应用
在医疗领域,特别是内窥镜手术中,AR技术也有重要的应用前景。
##### 内窥镜手术的挑战
近年来,内窥镜手术的需求不断增加。与传统的剖腹手术相比,内窥镜手术具有创伤小、术后疼痛轻、出院早和美容效果好等优点。然而,许多内窥镜手术使用的是单目内窥镜,只能显示二维图像,这使得医生难以确保内窥镜视野和把握深度信息。为了把握二维图像中的深度,医生必须依靠解剖知识、经验和使用镊子进行触诊。因此,复杂的手术操作困难且耗时,手术的安全性和确定性也受到影响。
##### 开发的系统
为了解决这些问题,研究人员开发了一种内窥镜手术支持系统,旨在提供能够实时观察手术器械与器官之间距离的手术图像,从而让医生直观地感知手术视野的空间信息。该系统使用了Microsoft HoloLens 2,这是一种支持AR的头戴式显示器,可以实现完全免提操作。同时,还使用了Azure Kinect D
0
0
复制全文
相关推荐








