高效卷积范式与药物发现加速技术

# 高效卷积范式与药物发现加速技术 ## 1. 高效 im2win 卷积算法 ### 1.1 算法概述提出了一种基于 GPU 的高性能 im2win 卷积算法（Algorithm 3），其输入为输入张量 I、滤波器张量 F 和步长 s，输出为输出张量 O。算法流程如下： ```plaintext Algorithm 3: High Performance Im2win Convolution Algorithm On GPU Input: Input tensor I, Filter tensor F, Stride s Output: Output tensor O Im2winTensor: ˆI = Function im2win(I, F, s) Dimensions: M = Co, N = No × Ho × Wo, K = Cf × Hf × Wf # of blocks: M/MB × N/NB # of threads per block: MB/MT × NB/NT 1 Registers: RˆI[2][NT ], RF[2][MT ], RO[MT × MT ] //double buﬀer 2 Shared memories: SˆI[2][KB × NB], SF[2][MB × KB] //double buﬀer 3 SˆI[0][kB × nB] load ←−−kB × nB of ˆI(0, by) 4 SF[0][mB × kB] load ←−−mB × kB of F(bx, 0) 5 syncthreads() 6 RˆI[0][nT ] vec load ←−−−−−nT of SˆI[0][0 × nB] 7 RF[0][mT ] vec load ←−−−−−mT of SF[0][mB × 0] 8 for kk = 0 to Cf × Hf × Wf/Kf,b −1 do 9 for k′ = 1 to Kf,b −1 do 10 RˆI[load][nT ] vec load ←−−−−−nT of SˆI[store][k′ × nB] //prefetching 11 RF[load][mT ] vec load ←−−−−−mT of SF[store][mB × k′] //prefetching 12 RO[mT × nT ] += RF[store][mT ] × RˆI[store][nT ] //micro-kernel 13 if kk ̸= Cf × Hf × Wf/Kf,b −1 then 14 SˆI[load][kB × nB] load ←−−kB × nB of ˆI(kk + 1, by) //prefetching 15 SF[load][mB × kB] load ←−−mB × kB of F(bx, kk + 1) //prefetching 16 syncthreads() 17 RˆI[0][nT ] vec load ←−−−−−nT of SˆI[store][0 × nB] 18 RF[0][mT ] vec load ←−−−−−mT of SF[store][mB × 0] 19 RO[mT × nT ] += RˆI[1][nT ] × RˆI[1][nT ] //micro-kernel 20 O(bx, by) store ←−−−RO[mT × nT ] ``` ### 1.2 优化策略受 GEMM 在 GPU 上的优化技术启发，对算法进行了多种优化： - **分块（Tiling）**：将输入张量和滤波器张量的索引划分为小块（tiles），在块级别为 MB × NB × KB，线程级别为 MT × NT。分块的主要作用是通过减少数据访问和提高数据局部性来提升计算性能，例如使块大小与共享内存或寄存器大小匹配，提高数据重用和缓存命中率。 - **共享内存和寄存器（Shared Memory and

最低0.47元/天解锁专栏

赠100次下载

继续阅读点击查看下一篇

400次会员资源下载次数

300万+ 优质博客文章

1000万+ 优质下载资源

1000万+ 优质文库回答

复制全文

高效卷积范式与药物发现加速技术

相关推荐

专栏目录

高效卷积范式与药物发现加速技术

相关推荐

一种高效咬尾卷积码译码器的设计与仿真

基于卷积神经网络的HEVC帧内编码技术研究与优化

基于深度卷积神经网络的图像去噪技术研究

芋道ruoyi-vue-pro 工作流最新sql

实习生管理-实习生管理系统-实习生管理系统源码-实习生管理系统代码-springboot实习生管理系统源码-基于springboot的实习生管理系统设计与实现-实习生管理管理系统-实习生管理项目代码

MATLAB's live scripts to markdown. The provided function con

target_channel_0.apk

箱包存储-箱包存储系统-箱包存储系统源码-箱包存储系统代码-springboot箱包存储系统源码-基于springboot的箱包存储系统设计与实现-箱包存储管理系统-箱包存储项目代码-箱包存储网站代码

在MATLAB中轻松应用和保存配色方案。_Apply and save color schemes in MATLAB

使用MATLAB的姿态和航向参考系统尽可能简单_Attitude and Heading Reference Syste

2020年校园学生会网络部部长工作计划范文.doc

专栏目录

最新推荐

Rust模块系统与JSON解析：提升代码组织与性能

iOS开发中的面部识别与机器学习应用

Rust开发实战：从命令行到Web应用

AWS无服务器服务深度解析与实操指南

并发编程中的锁与条件变量优化

React应用性能优化与测试指南

Rust应用中的日志记录与调试

Rust编程：模块与路径的使用指南

Rust数据处理：HashMaps、迭代器与高阶函数的高效运用

Rust项目构建与部署全解析