眼底图像中视网膜异常检测的深度学习方法
立即解锁
发布时间: 2025-09-01 00:20:30 阅读量: 14 订阅数: 11 AIGC 


神经网络在医学影像中的应用
# 眼底图像中视网膜异常检测的深度学习方法
## 1. 白内障相关情况
### 1.1 白内障危害与现状
白内障可能导致失明,是眼部疾病中致盲的主要原因,占比约 51%。据世界卫生组织报告,因白内障致盲的人数约 2000 万,到 2025 年将超过 4000 万。白内障进展缓慢,但会发展到需要手术治疗的严重程度。它可分为健康、轻度、中度和重度四个等级,轻度白内障可通过改善健康习惯、戒烟和佩戴太阳镜来治疗,因此早期检测至关重要。
### 1.2 传统检测方法及不足
传统的白内障检测方法有四种:聚焦法、虹膜图像投影法、裂隙灯检查法和透照眼底镜检查法。然而,这些方法成本高且耗时,因此有必要开发计算机辅助诊断(CAD)系统进行白内障检测。
### 1.3 基于眼底图像的检测
在健康视网膜的眼底图像中,所有视网膜结构(如视盘和粗细血管)都能清晰区分;轻度白内障时,细血管稍有可见;中度阶段,只有粗血管和视盘可见;重度阶段则看不到任何视网膜结构。
## 2. 基于深度学习的白内障检测与分级方法
### 2.1 DCNN 方法
- **处理步骤**:
1. 对眼底图像进行统一尺寸调整。
2. 消除不均匀光照。
3. 提取绿色通道。
4. 使用具有五个卷积层、三个全连接层和一个四路 SoftMax 的 DCNN 进行分级。
- **数据集与结果**:使用包含 3269 张无白内障图像和 2351 张健康图像的私有数据集,该方法检测白内障的准确率为 93.52%,分级准确率为 86.69%。
### 2.2 计算机辅助自动方法
- **处理步骤**:
1. 提取绿色通道。
2. 使用自然度图像质量评估器和基于感知的图像质量评估器评估图像质量,保留得分超过特定阈值的图像。
3. 使用在 ImageNet 数据库上预训练的 AlexNet 模型提取特征。
4. 将特征输入到通过实验确定的分类器中。
- **数据集与结果**:从多个公共数据集收集图像,每个白内障等级选择 200 张眼底图像。该方法在二分类(正常与白内障)中的准确率为 100%,四分类的平均准确率为 92.91%。
### 2.3 基于卷积 - 递归神经网络的方法
- **处理步骤**:
1. 将晶状体结构划分为前皮质、核和后皮质。
2. 调整三个部分的大小,前皮质和后皮质缩放为正方形,宽度为核的一半。
3. 移除前部分,将核分为三个重叠部分。
4. 学习每个部分的局部特征,随机提取局部补丁并合并。
5. 将特征输入到 CNN 的卷积层,进行图像对比度归一化和平均池化。
6. 执行 N 个随机递归神经网络提取高阶特征向量。
7. 将向量输入支持向量回归得到最终分级结果。
- **数据集与结果**:使用 ACHIKO - NC 数据集(包含 5378 张图像)进行评估,计算四个指标,积分一致性比率(R0)为 0.704 ± 0.016,小数分级误差 ≤ 0.5 的比率(Re0.5)为 0.881 ± 0.019,积分分级误差 ≤ 1.0 的比率(Re1.0)为 0.990 ± 0.004,平均绝对误差(ε)为 0.307 ± 0.019。
### 2.4 眼底图像分级方法
- **处理步骤**:
1. 将四分类问题建模为三个相邻的二分类问题。
2. 划定视网膜后,应用改进的“Haar 小波滤波器”将眼底图像分解为近似分量(ACs)。
3. 通过对应三个二分类器的三个最优阈值对 ACs 进行分类,阈值通过 BP - net 模型的“均方误差”损失函数确定。
- **数据集与结果**:使用包含 1355 张视网膜图像的私有数据集进行评估,二分类和四分类的准确率分别约为 94.83% 和 85.98%。
## 3. 基于智能手机的视网膜异常检测
### 3.1 智能手机拍摄眼底图像评估
如今,基于 CAD 的智能手机用于视网膜异常检测的设计越来越多。一些研究评估了智能手机拍摄的眼底图像质量,如 D - EYE 镜头拍摄的图像与直接检眼镜拍摄的图像对比。眼科医生认为智能手机拍摄的眼底图像可读性平均在 86% - 100% 之间,93% - 100% 具有可接受的质量。
### 3.2 相关设备
有一些非散瞳的智能手机视网膜相机,如 PEEK Retina、D - EYE、HFC MicroClear 和 ZEISS VISUSCOUT 100 等。
### 3.3 相关工作成果
| 作者 | 病理 | 眼底图像数量 | 性能评估 | 捕获设备 |
| --- | --- | --- | --- | --- |
| Toy 等 | 中度非增殖性及更严重的糖尿病视网膜病变 | 100 | 91% 灵敏度,99% 特异性,95% 阳性预测值,98% 阴性预测值 | Paxos Scope |
| Russo 等 | 垂直杯盘比(青光眼) | 107 | 95% 灵敏度,95% 特异性,63% Kappa(k) | D - EYE |
| Rajalakshmi 等 | 糖尿病视网膜病变 | - | 92.7% 灵敏度,98.4% 特异性,Kappa(k) = 0.90 | (FOP) 相机 |
| Muiesan 等 | 出血、渗出、视盘水肿 | 104 | 出血:0.795;渗出:0.822 - 0.878;视盘水肿:0.815 - 0.804 | D - EYE |
| Thomas 等 | 青光眼 | - | 83% 灵敏度,79% 特异性 | - |
### 3.4 基于深度学习的方法
#### 3.4.1 提取未矫正屈光不正信息
- **处理步骤**:使用来自 UK Biobank 和 AREDS 的 45 度和 30 度视野的视网膜眼底图像,训练 DL 算法预测未矫正屈光不正(URE)误差。
- **数据集与结果**:在 UK Biobank 数据集上估计球镜等效值的平均绝对误差为 0.56 屈光度,在 AREDS 数据集上为 0.91 屈光度。
#### 3.4.2 检测糖尿病视网膜病变和威胁视力的糖尿病视网膜病变
- **处理步骤**:使用智能手机设备捕获图像,使用 EyeArt AI 算法进行分级。
- **数据集与结果**:对 296 名患者的视网膜图像进行分级,该软件检测糖尿病视网膜病变的灵敏度为 95.8%,特异性为 80.2%;检测威胁视力的糖尿病视网膜病变的灵敏度为 99.1%,特异性为 80.4%。
#### 3.4.3 实时检测视网膜异常
- **处理步骤**:使用 D - EYE 镜头在智能手机平台上实时捕获和处理眼底图像,基于 CNN 和迁移学习方法,使用在 ImageNet 数据库上预训练的 Exception 模型。
- **数据集与结果**:在 iPhone 7/iPhone XR iOS 智能手机和 Pixel 2/Pixel 3 Android 智能手机上进行测试,iOS 版本每秒捕获 30 帧,每秒做出两个检测决策,糖尿病视网膜病变检测的总体准确率为 94.6%。
## 4. 讨论
青光眼、年龄相关性黄斑变性(AMD)、糖尿病视网膜病变(DR)和白内障是主要的视网膜疾病,早期筛查对于避免严重的视力损害至关重要。传统的基于图像分析的自动化方法在眼部疾病诊断中得到了广泛探索,但存在一些不足。而深度学习和卷积神经网络(CNN)在眼科领域展现出了强大的能力,能够识别、定位、量化和分析眼底图像中的病理特征。
### 4.1 青光眼诊断
传统上,青光眼通过测量眼压或评估视盘(ONH)的相关指标来诊断。在过去十年中,深度学习在眼科诊断中得到了广泛应用,视盘、杯盘和神经头的分割是自动裁剪感兴趣区域(ROI)的重要步骤。
### 4.2 AMD 检测
眼底图像是检测和分级 AMD 的主要元素,一些基于深度学习的方法旨在将眼底图像分级为标准的四分类(无 AMD、早期 AMD、中期 AMD 和晚期 AMD)或简化版本的分类,取得了较高的检测性能。但在大分类分级和玻璃膜疣病变分割方面仍存在挑战。
### 4.3 DR 诊断
微动脉瘤(MAs)和硬性渗出(EXs)的出现是 DR 的早期迹象。深度学习方法在 DR 诊断中表现出比传统方法更好的性能。
### 4.4 白内障检测
传统的白内障检测方法成本高且耗时,因此需要开发 CAD 系统。深度学习方法在大多数情况下优于传统方法。
### 4.5 智能手机应用前景
近年来,人们对智能手机拍摄的眼底图像质量以及基于深度学习的 CAD 系统在智能手机上的应用产生了兴趣,但相关研究成果较少,这将是未来眼科诊断的一个重要研究方向。
## 5. 结论
在眼部疾病的自动化诊断研究中,人们积极开发各种方法。许多用于眼部疾病的 CAD 系统已经得到广泛应用,但传统方法由于图像特性和质量的差异以及 ROI 检测和视网膜结构分割方法的不足而表现不佳。深度学习和 CNN 能够有效处理这些问题,在视网膜异常检测中取得了优异的分类和分级准确率。未来,基于混合和全深度学习方法的研究将继续深入,同时考虑使用 OCT 和眼底相机两种视网膜成像方式。
```mermaid
graph LR
classDef startend fill:#F5EBFF,stroke:#BE8FED,stroke-width:2px;
classDef process fill:#E5F6FF,stroke:#73A6FF,stroke-width:2px;
classDef decision fill:#FFF6CC,stroke:#FFBC52,stroke-width:2px;
A([开始]):::startend --> B(收集眼底图像):::process
B --> C{图像质量评估}:::decision
C -->|合格| D(图像处理):::process
C -->|不合格| B
D --> E(特征提取):::process
E --> F(分类与分级):::process
F --> G(输出结果):::process
G --> H([结束]):::startend
```
```mermaid
graph LR
classDef startend fill:#F5EBFF,stroke:#BE8FED,stroke-width:2px;
classDef process fill:#E5F6FF,stroke:#73A6FF,stroke-width:2px;
classDef decision fill:#FFF6CC,stroke:#FFBC52,stroke-width:2px;
A([开始]):::startend --> B(选择检测方法):::process
B --> C{传统方法?}:::decision
C -->|是| D(执行传统检测):::process
C -->|否| E(使用深度学习方法):::process
D --> F(得出结果):::process
E --> G(数据预处理):::process
G --> H(模型训练):::process
H --> I(模型预测):::process
I --> F
F --> J([结束]):::startend
```
## 6. 各类疾病检测方法对比
### 6.1 不同疾病检测方法总结
| 疾病类型 | 传统检测方法 | 深度学习检测方法 | 优势 | 不足 |
| --- | --- | --- | --- | --- |
| 青光眼 | 测量眼压、评估视盘相关指标 | 视盘、杯盘和神经头分割后进行 ROI 处理 | 能更精准地定位和分析病变区域 | 对数据质量和数量要求较高 |
| AMD | - | 将眼底图像分级为标准四分类或简化分类 | 取得较高检测性能 | 大分类分级和玻璃膜疣病变分割有挑战 |
| DR | - | 基于深度学习的图像分析 | 比传统方法性能更好 | - |
| 白内障 | 聚焦法、虹膜图像投影法、裂隙灯检查法、透照眼底镜检查法 | 多种基于深度学习的分级方法 | 准确率高、效率提升 | 部分方法依赖特定数据集 |
### 6.2 性能指标对比
| 疾病 | 检测方法 | 准确率 | 灵敏度 | 特异性 | 其他指标 |
| --- | --- | --- | --- | --- | --- |
| 白内障 | DCNN 方法 | 93.52%(检测),86.69%(分级) | - | - | - |
| 白内障 | 计算机辅助自动方法 | 100%(二分类),92.91%(四分类) | - | - | - |
| 白内障 | 卷积 - 递归神经网络方法 | - | - | - | R0:0.704 ± 0.016,Re0.5:0.881 ± 0.019,Re1.0:0.990 ± 0.004,ε:0.307 ± 0.019 |
| 白内障 | 眼底图像分级方法 | 94.83%(二分类),85.98%(四分类) | - | - | - |
| DR | EyeArt AI 算法 | - | 95.8%(DR),99.1%(STDR) | 80.2%(DR),80.4%(STDR) | kappa 协议:DR 为 0.78,STDR 为 0.75 |
| 未矫正屈光不正 | 基于 DL 的方法 | - | - | - | 平均绝对误差:UK Biobank 为 0.56 屈光度,AREDS 为 0.91 屈光度 |
## 7. 技术发展趋势
### 7.1 深度学习技术的优化
随着深度学习技术的不断发展,模型的结构和算法将不断优化。例如,可能会出现更高效的卷积神经网络架构,减少计算量的同时提高检测的准确率。同时,迁移学习和预训练模型的应用将更加广泛,能够利用大规模的公共数据集进行预训练,然后在特定的眼部疾病检测任务中进行微调,从而提高模型的泛化能力和训练效率。
### 7.2 多模态数据融合
目前的研究主要集中在眼底图像和 OCT 图像上,未来可能会融合更多的模态数据,如眼部超声、光学相干断层扫描血管造影(OCTA)等。多模态数据融合能够提供更全面的眼部信息,有助于更准确地检测和诊断眼部疾病。
### 7.3 智能手机应用的拓展
智能手机在眼部疾病检测中的应用前景广阔。未来,智能手机的摄像头和相关硬件将不断升级,能够拍摄更高质量的眼底图像。同时,基于智能手机的检测软件将更加智能化和便捷化,用户可以随时随地进行眼部疾病的初步筛查。此外,智能手机应用还可以与医疗信息系统集成,实现数据的实时传输和共享,方便医生进行远程诊断和治疗。
### 7.4 个性化医疗的实现
深度学习技术能够对患者的个体数据进行分析和挖掘,实现个性化的医疗诊断和治疗方案。未来,根据患者的基因信息、生活习惯、病史等多方面因素,结合眼底图像和其他检查结果,为患者提供更加精准和个性化的治疗建议,提高治疗效果和患者的生活质量。
## 8. 实际应用案例分析
### 8.1 某眼科医院的应用
某眼科医院引入了基于深度学习的白内障检测系统。该系统采用了卷积 - 递归神经网络方法,对患者的眼底图像进行分级。在实际应用中,系统能够快速准确地给出白内障的分级结果,为医生的诊断提供了重要的参考依据。通过与传统的诊断方法进行对比,该系统的分级准确率达到了 90% 以上,大大提高了诊断效率和准确性。
### 8.2 偏远地区的筛查项目
在一些偏远地区,由于医疗资源有限,眼部疾病的筛查和诊断存在较大困难。通过使用智能手机和基于深度学习的检测软件,开展了眼部疾病的筛查项目。志愿者使用智能手机拍摄患者的眼底图像,然后将图像上传到云端服务器进行分析。系统能够快速给出初步的检测结果,对于疑似患有眼部疾病的患者,再安排进一步的检查和治疗。该项目有效地提高了偏远地区眼部疾病的筛查覆盖率,为患者的早期治疗提供了机会。
## 9. 挑战与应对策略
### 9.1 数据质量和数量问题
深度学习模型的性能高度依赖于数据的质量和数量。目前,眼部疾病的数据集存在数据标注不准确、数据分布不均衡等问题。为了解决这些问题,需要加强数据的标注和管理,建立标准化的数据集。同时,可以通过数据增强、迁移学习等方法,提高模型对不同数据的适应能力。
### 9.2 模型解释性问题
深度学习模型通常被认为是“黑匣子”,其决策过程难以解释。在医疗领域,模型的解释性至关重要,医生需要了解模型做出决策的依据。为了提高模型的解释性,可以采用一些可解释的机器学习方法,如局部可解释模型无关解释(LIME)、特征重要性分析等,帮助医生理解模型的决策过程。
### 9.3 隐私和安全问题
眼部疾病的检测涉及到患者的个人隐私和敏感信息,如眼底图像、病历等。在数据的采集、存储和传输过程中,需要采取严格的隐私保护和安全措施,确保患者的信息不被泄露。同时,要遵守相关的法律法规和伦理准则,保障患者的合法权益。
### 9.4 临床应用推广问题
虽然深度学习在眼部疾病检测中取得了较好的研究成果,但在临床应用中的推广还面临一些挑战。例如,医生对新技术的接受程度、医疗设备的更新换代等。为了促进临床应用的推广,需要加强医生的培训和教育,提高他们对深度学习技术的认识和应用能力。同时,要与医疗机构和企业合作,推动相关技术的产业化发展,降低技术应用的成本。
## 10. 结语
眼部疾病的早期检测和诊断对于保护患者的视力至关重要。深度学习和卷积神经网络在眼部疾病检测中展现出了巨大的潜力,能够提高检测的准确率和效率。虽然目前还面临一些挑战,但随着技术的不断发展和完善,相信这些问题将逐步得到解决。未来,深度学习技术将在眼部疾病的检测和诊断中发挥更加重要的作用,为患者提供更加优质的医疗服务。
```mermaid
graph LR
classDef startend fill:#F5EBFF,stroke:#BE8FED,stroke-width:2px;
classDef process fill:#E5F6FF,stroke:#73A6FF,stroke-width:2px;
classDef decision fill:#FFF6CC,stroke:#FFBC52,stroke-width:2px;
A([当前技术现状]):::startend --> B(深度学习技术优化):::process
A --> C(多模态数据融合):::process
A --> D(智能手机应用拓展):::process
A --> E(个性化医疗实现):::process
B --> F(未来技术发展):::process
C --> F
D --> F
E --> F
F --> G([临床应用推广]):::startend
```
```mermaid
graph LR
classDef startend fill:#F5EBFF,stroke:#BE8FED,stroke-width:2px;
classDef process fill:#E5F6FF,stroke:#73A6FF,stroke-width:2px;
classDef decision fill:#FFF6CC,stroke:#FFBC52,stroke-width:2px;
A([面临挑战]):::startend --> B(数据质量和数量问题):::process
A --> C(模型解释性问题):::process
A --> D(隐私和安全问题):::process
A --> E(临床应用推广问题):::process
B --> F(应对策略):::process
C --> F
D --> F
E --> F
F --> G([解决问题]):::startend
```
0
0
复制全文
相关推荐










