项目地址:https://github.com/Ucas-HaoranWei/GOT-OCR2.0
整合包下载:https://pan.quark.cn/s/3757da820e65
显卡建议使用RTX 30以上的
①先安装NVIDIA显卡驱动:
https://www.nvidia.cn/drivers/lookup/
输入显卡型号搜索就行
②安装CUDA 工具包
cuda_12.6.1_560.94_windows.exe
链接:https://pan.quark.cn/s/79e3930d439c
版本对应关系参考:
https://docs.nvidia.com/cuda/cuda-toolkit-release-notes/index.html
编辑系统环境变量参考:
CUDA_HOME=C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v12.6
C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v12.6\bin
C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v12.6\libnvvp
-
验证 CUDA 版本
#确认输出显示 CUDA 版本为 12.6 nvcc --version
③安装cuDNN
https://developer.nvidia.com/cudnn-downloads?target_os=Windows
cudnn-windows-x86_64-9.4.0.58_cuda11-archive.zip
链接:https://pan.quark.cn/s/793bdc4a379f
找到 CUDA 的安装目录,其下也存在 bin
、include
、lib
三个目录
将 cuDNN 解压后得到的 bin
、include
、lib
三个目录中的内容分别复制到 CUDA 安装目录下的对应目录中。
C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v12.6
在 CUDA 的安装目录下的 extras\demo_suite
目录下找到 bandwidthTest.exe
和 deviceQuery.exe
两个文件,分别在 ⌈命令提示符⌋ 中执行(直接双击可能会一闪而过)若均执行成功,说明 cuDNN 安装成功。
整合包使用:
自解压:GOT-OCR2.0Win整合包0920.exe
解压到D盘根目录,如图
确保python路径正确 D:\GOT-OCR2.0\GOT-OCR2.0\.pyenv\pyenv-win\versions\3.10.11
测试flash-attn.bat
start.cmd
1、测试简单文本识别
识别结果:劳动密集型企业
2、给出其他示例代码,手动复制执行