0% found this document useful (0 votes)

103 views37 pages

Convolution

This C++ code defines functions for performing 1D and 2D convolution on input data with a kernel. It includes functions for unsigned char, unsigned short, signed integer, and float data types. The 2D convolution functions use pointers to efficiently iterate through input and kernel data without copying, compute the valid boundary region for each output element, and accumulate the results into the output array.

Uploaded by

Mohd Norisman Hussin

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as TXT, PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

103 views37 pages

Convolution

Uploaded by

Mohd Norisman Hussin

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as TXT, PDF, TXT or read online on Scribd

You are on page 1/ 37

#include <cmath>

#include "convolution.h"
///////////////////////////////////////////////////////////////////////////////
// 1D convolution
// We assume input and kernel signal start from t=0.
///////////////////////////////////////////////////////////////////////////////
bool convolve1D(float* in, float* out, int dataSize, float* kernel, int kernelSi
ze)
{
int i, j, k;
// check validity of params
if(!in || !out || !kernel) return false;
if(dataSize <=0 || kernelSize <= 0) return false;
// start convolution from out[kernelSize-1] to out[dataSize-1] (last)
for(i = kernelSize-1; i < dataSize; ++i)
{
out[i] = 0;
// init to 0 before accumulate
for(j = i, k = 0; k < kernelSize; --j, ++k)
out[i] += in[j] * kernel[k];
}
// convolution from out[0] to out[kernelSize-2]
for(i = 0; i < kernelSize - 1; ++i)
{
out[i] = 0;
// init to 0 before sum
for(j = i, k = 0; j >= 0; --j, ++k)
out[i] += in[j] * kernel[k];
}
return true;
}
///////////////////////////////////////////////////////////////////////////////
// Simplest 2D convolution routine. It is easy to understand how convolution
// works, but is very slow, because of no optimization.
///////////////////////////////////////////////////////////////////////////////
bool convolve2DSlow(unsigned char* in, unsigned char* out, int dataSizeX, int da
taSizeY,
float* kernel, int kernelSizeX, int kernelSizeY)
{
int i, j, m, n, mm, nn;
int kCenterX, kCenterY;
// center index of kernel
float sum;
// temp accumulation buffer
int rowIndex, colIndex;
// check validity of params
if(!in || !out || !kernel) return false;
if(dataSizeX <= 0 || kernelSizeX <= 0) return false;
// find center position of kernel (half of kernel size)
kCenterX = kernelSizeX / 2;
kCenterY = kernelSizeY / 2;

for(i=0; i < dataSizeY; ++i)

{
for(j=0; j < dataSizeX; ++j)
{
sum = 0;
for(m=0; m < kernelSizeY; ++m)
{
mm = kernelSizeY - 1 - m;

// rows
// columns
// init to 0 before sum
// kernel rows
// row index of flipped kernel

for(n=0; n < kernelSizeX; ++n) // kernel columns

{
nn = kernelSizeX - 1 - n; // column index of flipped kerne
l
// index of input signal, used for checking boundary
rowIndex = i + m - kCenterY;
colIndex = j + n - kCenterX;
// ignore input samples which are out of bound
if(rowIndex >= 0 && rowIndex < dataSizeY && colIndex >= 0 &&
colIndex < dataSizeX)
sum += in[dataSizeX * rowIndex + colIndex] * kernel[kern
elSizeX * mm + nn];
}
}
out[dataSizeX * i + j] = (unsigned char)((float)fabs(sum) + 0.5f);
}
}
return true;
}

///////////////////////////////////////////////////////////////////////////////
// 2D convolution
// 2D data are usually stored in computer memory as contiguous 1D array.
// So, we are using 1D array for 2D data.
// 2D convolution assumes the kernel is center originated, which means, if
// kernel size 3 then, k[-1], k[0], k[1]. The middle of index is always 0.
// The following programming logics are somewhat complicated because of using
// pointer indexing in order to minimize the number of multiplications.
///////////////////////////////////////////////////////////////////////////////
///////////////////////////////////////////////////////////////////////////////
// unsigned char version (8bit): Note that the output is always positive number
///////////////////////////////////////////////////////////////////////////////
bool convolve2D(unsigned char* in, unsigned char* out, int dataSizeX, int dataSi
zeY,
float* kernel, int kernelSizeX, int kernelSizeY)
{
int i, j, m, n;
unsigned char *inPtr, *inPtr2, *outPtr;
float *kPtr;
int kCenterX, kCenterY;
int rowMin, rowMax;
// to check boundary of inpu
t array
int colMin, colMax;
//
float sum;
// temp accumulation buffer

// check validity of params

if(!in || !out || !kernel) return false;
if(dataSizeX <= 0 || kernelSizeX <= 0) return false;
// find center position of kernel (half of kernel size)
kCenterX = kernelSizeX >> 1;
kCenterY = kernelSizeY >> 1;
// init working pointers
inPtr = inPtr2 = &in[dataSizeX * kCenterY + kCenterX]; // note that it is
shifted (kCenterX, kCenterY),
outPtr = out;
kPtr = kernel;
// start convolution
for(i= 0; i < dataSizeY; ++i)
// number of rows
{
// compute the range of convolution, the current row of kernel should be
between these
rowMax = i + kCenterY;
rowMin = i - dataSizeY + kCenterY;
for(j = 0; j <
{
// compute
ould be between these
colMax = j
colMin = j

dataSizeX; ++j)

// number of columns

the range of convolution, the current column of kernel sh

+ kCenterX;
- dataSizeX + kCenterX;

sum = 0;

// set to 0 before accumulat

e
// flip the kernel and traverse all the kernel values
// multiply each kernel value with underlying input data
for(m = 0; m < kernelSizeY; ++m)
// kernel rows
{
// check if the index is out of bound of input array
if(m <= rowMax && m > rowMin)
{
for(n = 0; n < kernelSizeX; ++n)
{
// check the boundary of array
if(n <= colMax && n > colMin)
sum += *(inPtr - n) * *kPtr;
++kPtr;

// next kernel

}
}
else
kPtr += kernelSizeX;

// out of bound, move to nex

t row of kernel
inPtr -= dataSizeX;

// move input data 1 raw up

}
// convert negative number to positive
*outPtr = (unsigned char)((float)fabs(sum) + 0.5f);
kPtr = kernel;
inPtr = ++inPtr2;

// reset kernel to (0,0)

// next input

++outPtr;

// next output

}
}
return true;
}
///////////////////////////////////////////////////////////////////////////////
// unsigned short (16bit)
///////////////////////////////////////////////////////////////////////////////
bool convolve2D(unsigned short* in, unsigned short* out, int dataSizeX, int data
SizeY,
float* kernel, int kernelSizeX, int kernelSizeY)
{
int i, j, m, n;
unsigned short *inPtr, *inPtr2, *outPtr;
float *kPtr;
int kCenterX, kCenterY;
int rowMin, rowMax;
// to check boundary of inpu
t array
int colMin, colMax;
//
float sum;
// temp accumulation buffer
// check validity of params
if(!in || !out || !kernel) return false;
if(dataSizeX <= 0 || kernelSizeX <= 0) return false;
// find center position of kernel (half of kernel size)
kCenterX = kernelSizeX >> 1;
kCenterY = kernelSizeY >> 1;
// init working pointers
inPtr = inPtr2 = &in[dataSizeX * kCenterY + kCenterX]; // note that it is
shifted (kCenterX, kCenterY),
outPtr = out;
kPtr = kernel;
// start convolution
for(i= 0; i < dataSizeY; ++i)
// number of rows
{
// compute the range of convolution, the current row of kernel should be
between these
rowMax = i + kCenterY;
rowMin = i - dataSizeY + kCenterY;
for(j = 0; j <
{
// compute
ould be between these
colMax = j
colMin = j
sum = 0;

dataSizeX; ++j)

// number of columns

the range of convolution, the current column of kernel sh

+ kCenterX;
- dataSizeX + kCenterX;
// set to 0 before accumulat

if(m <= rowMax && m > rowMin)

{
for(n = 0; n < kernelSizeX; ++n)
{
// check the boundary of array
if(n <= colMax && n > colMin)
sum += *(inPtr - n) * *kPtr;
++kPtr;

// next kernel

}
}
else
kPtr += kernelSizeX;

// out of bound, move to nex

t row of kernel
inPtr -= dataSizeX;

// move input data 1 raw up

}
// convert negative number to positive
*outPtr = (unsigned short)((float)fabs(sum) + 0.5f);
kPtr = kernel;
inPtr = ++inPtr2;
++outPtr;

// reset kernel to (0,0)

// next input
// next output

}
}
return true;
}
///////////////////////////////////////////////////////////////////////////////
// signed integer (32bit) version:
///////////////////////////////////////////////////////////////////////////////
bool convolve2D(int* in, int* out, int dataSizeX, int dataSizeY,
float* kernel, int kernelSizeX, int kernelSizeY)
{
int i, j, m, n;
int *inPtr, *inPtr2, *outPtr;
float *kPtr;
int kCenterX, kCenterY;
int rowMin, rowMax;
// to check boundary of inpu
t array
int colMin, colMax;
//
float sum;
// temp accumulation buffer
// check validity of params
if(!in || !out || !kernel) return false;
if(dataSizeX <= 0 || kernelSizeX <= 0) return false;
// find center position of kernel (half of kernel size)
kCenterX = kernelSizeX >> 1;
kCenterY = kernelSizeY >> 1;
// init working pointers
inPtr = inPtr2 = &in[dataSizeX * kCenterY + kCenterX]; // note that it is
shifted (kCenterX, kCenterY),
outPtr = out;
kPtr = kernel;
// start convolution

for(i= 0; i < dataSizeY; ++i)

// number of rows
{
// compute the range of convolution, the current row of kernel should be
between these
rowMax = i + kCenterY;
rowMin = i - dataSizeY + kCenterY;
for(j = 0; j <
{
// compute
ould be between these
colMax = j
colMin = j

dataSizeX; ++j)

// number of columns

the range of convolution, the current column of kernel sh

+ kCenterX;
- dataSizeX + kCenterX;

sum = 0;

// set to 0 before accumulat

// next kernel

}
}
else
kPtr += kernelSizeX;

// out of bound, move to nex

t row of kernel
inPtr -= dataSizeX;

// move input data 1 raw up

}
// convert integer number
if(sum >= 0) *outPtr = (int)(sum + 0.5f);
else *outPtr = (int)(sum - 0.5f);
kPtr = kernel;
inPtr = ++inPtr2;
++outPtr;

// reset kernel to (0,0)

// next input
// next output

}
}
return true;
}
///////////////////////////////////////////////////////////////////////////////
// single float precision version:
///////////////////////////////////////////////////////////////////////////////
bool convolve2D(float* in, float* out, int dataSizeX, int dataSizeY,
float* kernel, int kernelSizeX, int kernelSizeY)
{
int i, j, m, n;

float inPtr, inPtr2, outPtr, kPtr;

int kCenterX, kCenterY;
int rowMin, rowMax;
t array
int colMin, colMax;

// to check boundary of inpu

// check validity of params

dataSizeX; ++j)

// number of columns

the range of convolution, the current column of kernel sh

+ kCenterX;
- dataSizeX + kCenterX;

*outPtr = 0;

// set to 0 before accumulat

// move input data 1 raw up

kPtr = kernel;
inPtr = ++inPtr2;
++outPtr;

// reset kernel to (0,0)

// next input
// next output

}
}
return true;
}
///////////////////////////////////////////////////////////////////////////////
// double float precision version:
///////////////////////////////////////////////////////////////////////////////
bool convolve2D(double* in, double* out, int dataSizeX, int dataSizeY,
double* kernel, int kernelSizeX, int kernelSizeY)
{
int i, j, m, n;
double *inPtr, *inPtr2, *outPtr, *kPtr;
int kCenterX, kCenterY;
int rowMin, rowMax;
// to check boundary of inpu
t array
int colMin, colMax;
//
// check validity of params
if(!in || !out || !kernel) return false;
if(dataSizeX <= 0 || kernelSizeX <= 0) return false;
// find center position of kernel (half of kernel size)
kCenterX = kernelSizeX >> 1;
kCenterY = kernelSizeY >> 1;
// init working pointers
inPtr = inPtr2 = &in[dataSizeX * kCenterY + kCenterX]; // note that it is
shifted (kCenterX, kCenterY),
outPtr = out;
kPtr = kernel;
// start convolution
for(i= 0; i < dataSizeY; ++i)
// number of rows
{
// compute the range of convolution, the current row of kernel should be
between these
rowMax = i + kCenterY;
rowMin = i - dataSizeY + kCenterY;
for(j = 0; j <
{
// compute
ould be between these
colMax = j
colMin = j

dataSizeX; ++j)

// number of columns

the range of convolution, the current column of kernel sh

+ kCenterX;
- dataSizeX + kCenterX;

*outPtr = 0;

// set to 0 before accumulat

{
for(n = 0; n < kernelSizeX; ++n)
{
// check the boundary of array
if(n <= colMax && n > colMin)
*outPtr += *(inPtr - n) * *kPtr;
++kPtr;
// next kernel
}
}
else
kPtr += kernelSizeX;

// out of bound, move to nex

t row of kernel
inPtr -= dataSizeX;

// move input data 1 raw up

}
kPtr = kernel;
inPtr = ++inPtr2;
++outPtr;

// reset kernel to (0,0)

// next input
// next output

}
}
return true;
}

///////////////////////////////////////////////////////////////////////////////
// Separable 2D Convolution
// If the MxN kernel can be separable to (Mx1) and (1xN) matrices, the
// multiplication can be reduced to M+N comapred to MxN in normal convolution.
// It does not check the output is excceded max for performance reason. And we
// assume the kernel contains good(valid) data, therefore, the result cannot be
// larger than max.
///////////////////////////////////////////////////////////////////////////////
///////////////////////////////////////////////////////////////////////////////
// unsigned char (8-bit) version
///////////////////////////////////////////////////////////////////////////////
bool convolve2DSeparable(unsigned char* in, unsigned char* out, int dataSizeX, i
nt dataSizeY,
float* kernelX, int kSizeX, float* kernelY, int kSizeY)
{
int i, j, k, m, n;
float *tmp, *sum;
// intermediate data buffer
unsigned char *inPtr, *outPtr;
// working pointers
float *tmpPtr, *tmpPtr2;
// working pointers
int kCenter, kOffset, endIndex;
// kernel indice
// check validity of params
if(!in || !out || !kernelX || !kernelY) return false;
if(dataSizeX <= 0 || kSizeX <= 0) return false;
// allocate temp storage to keep intermediate result
tmp = new float[dataSizeX * dataSizeY];
if(!tmp) return false; // memory allocation error
// store accumulated sum
sum = new float[dataSizeX];
if(!sum) return false; // memory allocation error

// covolve horizontal direction ///////////////////////

// find center position of kernel (half of kernel size)
kCenter = kSizeX >> 1;
// center index of kernel ar
ray
endIndex = dataSizeX - kCenter;
volution

// index for full kernel con

// init working pointers

inPtr = in;
tmpPtr = tmp;
s from 1D horizontal convolution

// store intermediate result

// start horizontal convolution (x-direction)

for(i=0; i < dataSizeY; ++i)
{
kOffset = 0;
kernel varies for each sample
// COLUMN FROM index=0 TO index=kCenter-1
for(j=0; j < kCenter; ++j)
{
*tmpPtr = 0;

// number of rows
// starting index of partial

// init to 0 before accumula

tion
for(k = kCenter + kOffset, m = 0; k >= 0; --k, ++m) // convolve with
partial of kernel
{
*tmpPtr += *(inPtr + m) * kernelX[k];
}
++tmpPtr;
// next output
++kOffset;
// increase starting index o
f kernel
}
// COLUMN FROM index=kCenter TO index=(dataSizeX-kCenter-1)
for(j = kCenter; j < endIndex; ++j)
{
*tmpPtr = 0;
// init to 0 before accumula
te
for(k = kSizeX-1, m = 0; k >= 0; --k, ++m) // full kernel
{
*tmpPtr += *(inPtr + m) * kernelX[k];
}
++inPtr;
// next input
++tmpPtr;
// next output
}
kOffset = 1;
ernel varies for each sample

// ending index of partial k

// COLUMN FROM index=(dataSizeX-kCenter) TO index=(dataSizeX-1)

for(j = endIndex; j < dataSizeX; ++j)
{
*tmpPtr = 0;
// init to 0 before accumula
tion

for(k = kSizeX-1, m=0; k >= kOffset; --k, ++m) // convolve with pa

rtial of kernel
{
*tmpPtr += *(inPtr + m) * kernelX[k];
}
++inPtr;
// next input
++tmpPtr;
// next output
++kOffset;
// increase ending index of
partial kernel
}
inPtr += kCenter;
// next row
}
// END OF HORIZONTAL CONVOLUTION //////////////////////
// start vertical direction ///////////////////////////
// find center position of kernel (half of kernel size)
kCenter = kSizeY >> 1;
// center index of vertical
kernel
endIndex = dataSizeY - kCenter;
// index where full kernel c
onvolution should stop
// set working pointers
tmpPtr = tmpPtr2 = tmp;
outPtr = out;
// clear out array before accumulation
for(i = 0; i < dataSizeX; ++i)
sum[i] = 0;
// start to convolve vertical direction (y-direction)
// ROW FROM index=0 TO index=(kCenter-1)
kOffset = 0;
kernel varies for each sample
for(i=0; i < kCenter; ++i)
{
for(k = kCenter + kOffset; k >= 0; --k)
nel
{
for(j=0; j < dataSizeX; ++j)
{
sum[j] += *tmpPtr * kernelY[k];
++tmpPtr;
}
}
for(n = 0; n < dataSizeX; ++n)

// starting index of partial

// convolve with partial ker

// convert and copy from sum

to out
{
// covert negative to positive
*outPtr = (unsigned char)((float)fabs(sum[n]) + 0.5f);
sum[n] = 0;
// reset to zero for next su
mming
++outPtr;

// next element of output

}
tmpPtr = tmpPtr2;
++kOffset;

// reset input pointer

// increase starting index o

f kernel
}
// ROW FROM index=kCenter TO index=(dataSizeY-kCenter-1)
for(i = kCenter; i < endIndex; ++i)
{
for(k = kSizeY -1; k >= 0; --k)
// convolve with full kernel
{
for(j = 0; j < dataSizeX; ++j)
{
sum[j] += *tmpPtr * kernelY[k];
++tmpPtr;
}
}
for(n = 0; n < dataSizeX; ++n)

// convert and copy from sum

to out
{
// covert negative to positive
*outPtr = (unsigned char)((float)fabs(sum[n]) + 0.5f);
sum[n] = 0;
// reset for next summing
++outPtr;
// next output
}
// move to next row
tmpPtr2 += dataSizeX;
tmpPtr = tmpPtr2;
}
// ROW FROM index=(dataSizeY-kCenter) TO index=(dataSizeY-1)
kOffset = 1;
// ending index of partial k
ernel varies for each sample
for(i=endIndex; i < dataSizeY; ++i)
{
for(k = kSizeY-1; k >= kOffset; --k)
// convolve with partial ker
nel
{
for(j=0; j < dataSizeX; ++j)
{
sum[j] += *tmpPtr * kernelY[k];
++tmpPtr;
}
}
for(n = 0; n < dataSizeX; ++n)

// convert and copy from sum

// next input
// increase ending index of

kernel
}
// END OF VERTICAL CONVOLUTION ////////////////////////

// deallocate temp buffers

delete [] tmp;
delete [] sum;
return true;
}
///////////////////////////////////////////////////////////////////////////////
// unsigned short (16-bit) version
///////////////////////////////////////////////////////////////////////////////
bool convolve2DSeparable(unsigned short* in, unsigned short* out, int dataSizeX,
int dataSizeY,
float* kernelX, int kSizeX, float* kernelY, int kSizeY)
{
int i, j, k, m, n;
float *tmp, *sum;
// intermediate data buffer
unsigned short *inPtr, *outPtr;
// working pointers
float *tmpPtr, *tmpPtr2;
// working pointers
int kCenter, kOffset, endIndex;
// kernel indice
// check validity of params
if(!in || !out || !kernelX || !kernelY) return false;
if(dataSizeX <= 0 || kSizeX <= 0) return false;
// allocate temp storage to keep intermediate result
tmp = new float[dataSizeX * dataSizeY];
if(!tmp) return false; // memory allocation error
// store accumulated sum
sum = new float[dataSizeX];
if(!sum) return false; // memory allocation error
// covolve horizontal direction ///////////////////////
// find center position of kernel (half of kernel size)
kCenter = kSizeX >> 1;
// center index of kernel ar
ray
endIndex = dataSizeX - kCenter;
volution

// index for full kernel con

// init working pointers

inPtr = in;
tmpPtr = tmp;
s from 1D horizontal convolution

// store intermediate result

// start horizontal convolution (x-direction)

for(i=0; i < dataSizeY; ++i)
{
kOffset = 0;
kernel varies for each sample
// COLUMN FROM index=0 TO index=kCenter-1
for(j=0; j < kCenter; ++j)
{
*tmpPtr = 0;

// number of rows
// starting index of partial

// init to 0 before accumula

tion
for(k = kCenter + kOffset, m = 0; k >= 0; --k, ++m) // convolve with

partial of kernel
{
*tmpPtr += *(inPtr + m) * kernelX[k];
}
++tmpPtr;
// next output
++kOffset;
// increase starting index o
f kernel
}
// COLUMN FROM index=kCenter TO index=(dataSizeX-kCenter-1)
for(j = kCenter; j < endIndex; ++j)
{
*tmpPtr = 0;
// init to 0 before accumula
te
for(k = kSizeX-1, m = 0; k >= 0; --k, ++m) // full kernel
{
*tmpPtr += *(inPtr + m) * kernelX[k];
}
++inPtr;
// next input
++tmpPtr;
// next output
}
kOffset = 1;
ernel varies for each sample

// ending index of partial k

// COLUMN FROM index=(dataSizeX-kCenter) TO index=(dataSizeX-1)

for(j = endIndex; j < dataSizeX; ++j)
{
*tmpPtr = 0;
// init to 0 before accumula
tion
for(k = kSizeX-1, m=0; k >= kOffset; --k, ++m) // convolve with pa
rtial of kernel
{
*tmpPtr += *(inPtr + m) * kernelX[k];
}
++inPtr;
// next input
++tmpPtr;
// next output
++kOffset;
// increase ending index of
partial kernel
}
inPtr += kCenter;
// next row
}
// END OF HORIZONTAL CONVOLUTION //////////////////////
// start vertical direction ///////////////////////////
// find center position of kernel (half of kernel size)
kCenter = kSizeY >> 1;
// center index of vertical
kernel
endIndex = dataSizeY - kCenter;
// index where full kernel c
onvolution should stop
// set working pointers
tmpPtr = tmpPtr2 = tmp;
outPtr = out;
// clear out array before accumulation

for(i = 0; i < dataSizeX; ++i)

sum[i] = 0;
// start to convolve vertical direction (y-direction)
// ROW FROM index=0 TO index=(kCenter-1)
kOffset = 0;
kernel varies for each sample
for(i=0; i < kCenter; ++i)
{
for(k = kCenter + kOffset; k >= 0; --k)
nel
{
for(j=0; j < dataSizeX; ++j)
{
sum[j] += *tmpPtr * kernelY[k];
++tmpPtr;
}
}
for(n = 0; n < dataSizeX; ++n)

// starting index of partial

// convolve with partial ker

// convert and copy from sum

to out
{
// covert negative to positive
*outPtr = (unsigned short)((float)fabs(sum[n]) + 0.5f);
sum[n] = 0;
// reset to zero for next su
mming
++outPtr;

// next element of output

}
tmpPtr = tmpPtr2;
++kOffset;

// reset input pointer

// increase starting index o

// convert and copy from sum

to out
{
// covert negative to positive
*outPtr = (unsigned short)((float)fabs(sum[n]) + 0.5f);
sum[n] = 0;
// reset before next summing
++outPtr;
// next output
}
// move to next row
tmpPtr2 += dataSizeX;
tmpPtr = tmpPtr2;
}

// ROW FROM index=(dataSizeY-kCenter) TO index=(dataSizeY-1)

kOffset = 1;
// ending index of partial k
ernel varies for each sample
for(i=endIndex; i < dataSizeY; ++i)
{
for(k = kSizeY-1; k >= kOffset; --k)
// convolve with partial ker
nel
{
for(j=0; j < dataSizeX; ++j)
{
sum[j] += *tmpPtr * kernelY[k];
++tmpPtr;
}
}
for(n = 0; n < dataSizeX; ++n)

// convert and copy from sum

// next input
// increase ending index of

kernel
}
// END OF VERTICAL CONVOLUTION ////////////////////////
// deallocate temp buffers
delete [] tmp;
delete [] sum;
return true;
}

///////////////////////////////////////////////////////////////////////////////
// integer (32-bit) version
///////////////////////////////////////////////////////////////////////////////
bool convolve2DSeparable(int* in, int* out, int dataSizeX, int dataSizeY,
float* kernelX, int kSizeX, float* kernelY, int kSizeY)
{
int i, j, k, m, n;
float *tmp, *sum;
// intermediate data buffer
int *inPtr, *outPtr;
// working pointers
float *tmpPtr, *tmpPtr2;
// working pointers
int kCenter, kOffset, endIndex;
// kernel indice
// check validity of params
if(!in || !out || !kernelX || !kernelY) return false;
if(dataSizeX <= 0 || kSizeX <= 0) return false;
// allocate temp storage to keep intermediate result
tmp = new float[dataSizeX * dataSizeY];
if(!tmp) return false; // memory allocation error

// store accumulated sum

sum = new float[dataSizeX];
if(!sum) return false; // memory allocation error
// covolve horizontal direction ///////////////////////
// find center position of kernel (half of kernel size)
kCenter = kSizeX >> 1;
// center index of kernel ar
ray
endIndex = dataSizeX - kCenter;
volution

// index for full kernel con

// init working pointers

inPtr = in;
tmpPtr = tmp;
s from 1D horizontal convolution

// store intermediate result

// start horizontal convolution (x-direction)

for(i=0; i < dataSizeY; ++i)
{
kOffset = 0;
kernel varies for each sample
// COLUMN FROM index=0 TO index=kCenter-1
for(j=0; j < kCenter; ++j)
{
*tmpPtr = 0;

// number of rows
// starting index of partial

// init to 0 before accumula

// ending index of partial k

// COLUMN FROM index=(dataSizeX-kCenter) TO index=(dataSizeX-1)

for(j = endIndex; j < dataSizeX; ++j)

{
*tmpPtr = 0;

// init to 0 before accumula

tion
for(k = kSizeX-1, m=0; k >= kOffset; --k, ++m) // convolve with pa
rtial of kernel
{
*tmpPtr += *(inPtr + m) * kernelX[k];
}
++inPtr;
// next input
++tmpPtr;
// next output
++kOffset;
// increase ending index of
partial kernel
}
inPtr += kCenter;
// next row
}
// END OF HORIZONTAL CONVOLUTION //////////////////////
// start vertical direction ///////////////////////////
// find center position of kernel (half of kernel size)
kCenter = kSizeY >> 1;
// center index of vertical
kernel
endIndex = dataSizeY - kCenter;
// index where full kernel c
onvolution should stop
// set working pointers
tmpPtr = tmpPtr2 = tmp;
outPtr = out;
// clear out array before accumulation
for(i = 0; i < dataSizeX; ++i)
sum[i] = 0;
// start to convolve vertical direction (y-direction)
// ROW FROM index=0 TO index=(kCenter-1)
kOffset = 0;
kernel varies for each sample
for(i=0; i < kCenter; ++i)
{
for(k = kCenter + kOffset; k >= 0; --k)
nel
{
for(j=0; j < dataSizeX; ++j)
{
sum[j] += *tmpPtr * kernelY[k];
++tmpPtr;
}
}
for(n = 0; n < dataSizeX; ++n)

// starting index of partial

// convolve with partial ker

// convert and copy from sum

to out
{
if(sum[n] >= 0)
*outPtr = (int)(sum[n] + 0.5f);

// store final result to out

put array
else
*outPtr = (int)(sum[n] - 0.5f);

// store final result to out

put array
sum[n] = 0;

// reset to zero for next su

++outPtr;

// next element of output

mming
}
tmpPtr = tmpPtr2;
++kOffset;

// reset input pointer

// increase starting index o

// convert and copy from sum

to out
{
if(sum[n] >= 0)
*outPtr = (int)(sum[n] + 0.5f);

// store final result to out

put array
else
*outPtr = (int)(sum[n] - 0.5f);

// store final result to out

put array
sum[n] = 0;

// reset to 0 before next su

++outPtr;

// next output

mming
}
// move to next row
tmpPtr2 += dataSizeX;
tmpPtr = tmpPtr2;
}
// ROW FROM index=(dataSizeY-kCenter) TO index=(dataSizeY-1)
kOffset = 1;
// ending index of partial k
ernel varies for each sample
for(i=endIndex; i < dataSizeY; ++i)
{
for(k = kSizeY-1; k >= kOffset; --k)
// convolve with partial ker
nel
{
for(j=0; j < dataSizeX; ++j)
{
sum[j] += *tmpPtr * kernelY[k];
++tmpPtr;
}
}
for(n = 0; n < dataSizeX; ++n)
to out

// convert and copy from sum

{
if(sum[n] >= 0)
*outPtr = (int)(sum[n] + 0.5f);

// store final result to out

put array
else
*outPtr = (int)(sum[n] - 0.5f);

// store final result to out

put array
sum[n] = 0;
++outPtr;

// reset before next summing

// next output

}
// move to next row
tmpPtr2 += dataSizeX;
tmpPtr = tmpPtr2;
++kOffset;

// next input
// increase ending index of

kernel
}
// END OF VERTICAL CONVOLUTION ////////////////////////
// deallocate temp buffers
delete [] tmp;
delete [] sum;
return true;
}

///////////////////////////////////////////////////////////////////////////////
// single precision float version
///////////////////////////////////////////////////////////////////////////////
bool convolve2DSeparable(float* in, float* out, int dataSizeX, int dataSizeY,
float* kernelX, int kSizeX, float* kernelY, int kSizeY)
{
int i, j, k, m, n;
float *tmp, *sum;
// intermediate data buffer
float *inPtr, *outPtr;
// working pointers
float *tmpPtr, *tmpPtr2;
// working pointers
int kCenter, kOffset, endIndex;
// kernel indice
// check validity of params
if(!in || !out || !kernelX || !kernelY) return false;
if(dataSizeX <= 0 || kSizeX <= 0) return false;
// allocate temp storage to keep intermediate result
tmp = new float[dataSizeX * dataSizeY];
if(!tmp) return false; // memory allocation error
// store accumulated sum
sum = new float[dataSizeX];
if(!sum) return false; // memory allocation error
// covolve horizontal direction ///////////////////////
// find center position of kernel (half of kernel size)
kCenter = kSizeX >> 1;
// center index of kernel ar
ray
endIndex = dataSizeX - kCenter;
volution
// init working pointers

// index for full kernel con

inPtr = in;
tmpPtr = tmp;
s from 1D horizontal convolution
// start horizontal convolution (x-direction)
for(i=0; i < dataSizeY; ++i)
{
kOffset = 0;
kernel varies for each sample
// COLUMN FROM index=0 TO index=kCenter-1
for(j=0; j < kCenter; ++j)
{
*tmpPtr = 0;

// store intermediate result

// number of rows
// starting index of partial

// init to 0 before accumula

// ending index of partial k

// COLUMN FROM index=(dataSizeX-kCenter) TO index=(dataSizeX-1)

inPtr += kCenter;
// next row
}
// END OF HORIZONTAL CONVOLUTION //////////////////////
// start vertical direction ///////////////////////////
// find center position of kernel (half of kernel size)
kCenter = kSizeY >> 1;
// center index of vertical
kernel
endIndex = dataSizeY - kCenter;
// index where full kernel c
onvolution should stop
// set working pointers
tmpPtr = tmpPtr2 = tmp;
outPtr = out;
// clear out array before accumulation
for(i = 0; i < dataSizeX; ++i)
sum[i] = 0;
// start to convolve vertical direction (y-direction)
// ROW FROM index=0 TO index=(kCenter-1)
kOffset = 0;
kernel varies for each sample
for(i=0; i < kCenter; ++i)
{
for(k = kCenter + kOffset; k >= 0; --k)
nel
{
for(j=0; j < dataSizeX; ++j)
{
sum[j] += *tmpPtr * kernelY[k];
++tmpPtr;
}
}
for(n = 0; n < dataSizeX; ++n)

// starting index of partial

// convolve with partial ker

// convert and copy from sum

to out
{
*outPtr = sum[n];

// store final result to out

sum[n] = 0;

// reset to zero for next su

++outPtr;

// next element of output

put array
mming
}
tmpPtr = tmpPtr2;
++kOffset;

// reset input pointer

// increase starting index o

sum[j] += tmpPtr kernelY[k];

++tmpPtr;
}
}
for(n = 0; n < dataSizeX; ++n)

// convert and copy from sum

to out
{
*outPtr = sum[n];

// store final result to out

sum[n] = 0;
++outPtr;

// reset before next summing

// next output

put buffer
}
// move to next row
tmpPtr2 += dataSizeX;
tmpPtr = tmpPtr2;
}
// ROW FROM index=(dataSizeY-kCenter) TO index=(dataSizeY-1)
kOffset = 1;
// ending index of partial k
ernel varies for each sample
for(i=endIndex; i < dataSizeY; ++i)
{
for(k = kSizeY-1; k >= kOffset; --k)
// convolve with partial ker
nel
{
for(j=0; j < dataSizeX; ++j)
{
sum[j] += *tmpPtr * kernelY[k];
++tmpPtr;
}
}
for(n = 0; n < dataSizeX; ++n)

// convert and copy from sum

to out
{
*outPtr = sum[n];

// store final result to out

sum[n] = 0;
++outPtr;

// reset to 0 for next sum

// next output

put array
}
// move to next row
tmpPtr2 += dataSizeX;
tmpPtr = tmpPtr2;
++kOffset;

// next input
// increase ending index of

kernel
}
// END OF VERTICAL CONVOLUTION ////////////////////////
// deallocate temp buffers
delete [] tmp;
delete [] sum;
return true;
}
///////////////////////////////////////////////////////////////////////////////
// double precision float version

///////////////////////////////////////////////////////////////////////////////
bool convolve2DSeparable(double* in, double* out, int dataSizeX, int dataSizeY,
double* kernelX, int kSizeX, float* kernelY, int kSizeY
)
{
int i, j, k, m, n;
double *tmp, *sum;
// intermediate data buffer
double *inPtr, *outPtr;
// working pointers
double *tmpPtr, *tmpPtr2;
// working pointers
int kCenter, kOffset, endIndex;
// kernel indice
// check validity of params
if(!in || !out || !kernelX || !kernelY) return false;
if(dataSizeX <= 0 || kSizeX <= 0) return false;
// allocate temp storage to keep intermediate result
tmp = new double[dataSizeX * dataSizeY];
if(!tmp) return false; // memory allocation error
// store accumulated sum
sum = new double[dataSizeX];
if(!sum) return false; // memory allocation error
// covolve horizontal direction ///////////////////////
// find center position of kernel (half of kernel size)
kCenter = kSizeX >> 1;
// center index of kernel ar
ray
endIndex = dataSizeX - kCenter;
volution

// index for full kernel con

// init working pointers

inPtr = in;
tmpPtr = tmp;
s from 1D horizontal convolution

// store intermediate result

// start horizontal convolution (x-direction)

for(i=0; i < dataSizeY; ++i)
{
kOffset = 0;
kernel varies for each sample
// COLUMN FROM index=0 TO index=kCenter-1
for(j=0; j < kCenter; ++j)
{
*tmpPtr = 0;

// number of rows
// starting index of partial

// init to 0 before accumula

for(j = kCenter; j < endIndex; ++j)

{
*tmpPtr = 0;

// init to 0 before accumula

te
for(k = kSizeX-1, m = 0; k >= 0; --k, ++m) // full kernel
{
*tmpPtr += *(inPtr + m) * kernelX[k];
}
++inPtr;
// next input
++tmpPtr;
// next output
}
kOffset = 1;
ernel varies for each sample

// ending index of partial k

// COLUMN FROM index=(dataSizeX-kCenter) TO index=(dataSizeX-1)

// starting index of partial

for(k = kCenter + kOffset; k >= 0; --k)

// convolve with partial ker

nel
{
for(j=0; j < dataSizeX; ++j)
{
sum[j] += *tmpPtr * kernelY[k];
++tmpPtr;
}
}
for(n = 0; n < dataSizeX; ++n)

// convert and copy from sum

to out
{
*outPtr = sum[n];

// store final result to out

sum[n] = 0;

// reset to zero for next su

++outPtr;

// next element of output

put array
mming
}
tmpPtr = tmpPtr2;
++kOffset;

// reset input pointer

// increase starting index o

// convert and copy from sum

to out
{
*outPtr = sum[n];

// store final result to out

sum[n] = 0;

// reset to zero for next su

++outPtr;

// next output

put array
mming
}
// move to next row
tmpPtr2 += dataSizeX;
tmpPtr = tmpPtr2;
}
// ROW FROM index=(dataSizeY-kCenter) TO index=(dataSizeY-1)
kOffset = 1;
// ending index of partial k
ernel varies for each sample
for(i=endIndex; i < dataSizeY; ++i)
{
for(k = kSizeY-1; k >= kOffset; --k)
// convolve with partial ker
nel
{

for(j=0; j < dataSizeX; ++j)

{
sum[j] += *tmpPtr * kernelY[k];
++tmpPtr;
}
}
for(n = 0; n < dataSizeX; ++n)

// convert and copy from sum

to out
{
*outPtr = sum[n];

// store final result to out

sum[n] = 0;

// reset to zero for next su

put array
mming
++outPtr;
partial kernel
}
// move to next row
tmpPtr2 += dataSizeX;
tmpPtr = tmpPtr2;
++kOffset;

// increase ending index of

// next input
// increase ending index of

kernel
}
// END OF VERTICAL CONVOLUTION ////////////////////////
// deallocate temp buffers
delete [] tmp;
delete [] sum;
return true;
}

///////////////////////////////////////////////////////////////////////////////
// 2D Convolution Fast
// In order to improve the performance, this function uses multple cursors of
// input signal. It avoids indexing input array during convolution. And, the
// input signal is partitioned to 9 different sections, so we don't need to
// check the boundary for every samples.
///////////////////////////////////////////////////////////////////////////////
///////////////////////////////////////////////////////////////////////////////
// unsigned char (8-bit) version
///////////////////////////////////////////////////////////////////////////////
bool convolve2DFast(unsigned char* in, unsigned char* out, int dataSizeX, int da
taSizeY,
float* kernel, int kernelSizeX, int kernelSizeY)
{
int i, j, m, n, x, y, t;
unsigned char **inPtr, *outPtr, *ptr;
int kCenterX, kCenterY;
int rowEnd, colEnd;
// ending indice for section
divider
float sum;
// temp accumulation buffer
int k, kSize;
// check validity of params
if(!in || !out || !kernel) return false;
if(dataSizeX <= 0 || kernelSizeX <= 0) return false;

// find center position of kernel (half of kernel size)

kCenterX = kernelSizeX >> 1;
kCenterY = kernelSizeY >> 1;
kSize = kernelSizeX * kernelSizeY;
// total kernel size
// allocate memeory for multi-cursor
inPtr = new unsigned char*[kSize];
if(!inPtr) return false;

// allocation error

// set initial position of multi-cursor, NOTE: it is swapped instead of kern

el
ptr = in + (dataSizeX * kCenterY + kCenterX); // the first cursor is shifted
(kCenterX, kCenterY)
for(m=0, t=0; m < kernelSizeY; ++m)
{
for(n=0; n < kernelSizeX; ++n, ++t)
{
inPtr[t] = ptr - n;
}
ptr -= dataSizeX;
}
// init working pointers
outPtr = out;
rowEnd = dataSizeY - kCenterY;

// bottom row partition divi

colEnd = dataSizeX - kCenterX;

vider

// right column partition di

der

// convolve rows from index=0 to index=kCenterY-1

y = kCenterY;
for(i=0; i < kCenterY; ++i)
{
// partition #1 ***********************************
x = kCenterX;
for(j=0; j < kCenterX; ++j)
// column from index=0 to in
dex=kCenterX-1
{
sum = 0;
t = 0;
for(m=0; m <= y; ++m)
{
for(n=0; n <= x; ++n)
{
sum += *inPtr[t] * kernel[t];
++t;
}
t += (kernelSizeX - x - 1);
// jump to next row
}
// store output
*outPtr = (unsigned char)((float)fabs(sum) + 0.5f);
++outPtr;
++x;
for(k=0; k < kSize; ++k) ++inPtr[k];
// move all cursors to next
}
// partition #2 ***********************************

for(j=kCenterX; j < colEnd; ++j)

X to index=(dataSizeX-kCenterX-1)
{
sum = 0;
t = 0;
for(m=0; m <= y; ++m)
{
for(n=0; n < kernelSizeX; ++n)
{
sum += *inPtr[t] * kernel[t];
++t;
}
}

// column from index=kCenter

// store output
*outPtr = (unsigned char)((float)fabs(sum) + 0.5f);
++outPtr;
++x;
for(k=0; k < kSize; ++k) ++inPtr[k];
// move all cursors to next
}
// partition #3 ***********************************
x = 1;
for(j=colEnd; j < dataSizeX; ++j)
// column from index=(dataSi
zeX-kCenter) to index=(dataSizeX-1)
{
sum = 0;
t = x;
for(m=0; m <= y; ++m)
{
for(n=x; n < kernelSizeX; ++n)
{
sum += *inPtr[t] * kernel[t];
++t;
}
t += x;
// jump to next row
}
// store output
*outPtr = (unsigned char)((float)fabs(sum) + 0.5f);
++outPtr;
++x;
for(k=0; k < kSize; ++k) ++inPtr[k];
// move all cursors to next
}
++y;
lve for next run
}

// add one more row to convo

// convolve rows from index=kCenterY to index=(dataSizeY-kCenterY-1)

{
for(n=0; n <= x; ++n)
{
sum += *inPtr[t] * kernel[t];
++t;
}
t += (kernelSizeX - x - 1);
}
// store output
*outPtr = (unsigned char)((float)fabs(sum) + 0.5f);
++outPtr;
++x;
for(k=0; k < kSize; ++k) ++inPtr[k];
// move all cursors to next
}
// partition #5 ***********************************
for(j = kCenterX; j < colEnd; ++j)
// column from index=kCenter
X to index=(dataSizeX-kCenterX-1)
{
sum = 0;
t = 0;
for(m=0; m < kernelSizeY; ++m)
{
for(n=0; n < kernelSizeX; ++n)
{
sum += *inPtr[t] * kernel[t];
++inPtr[t]; // in this partition, all cursors are used to co
nvolve. moving cursors to next is safe here
++t;
}
}
// store output
*outPtr = (unsigned char)((float)fabs(sum) + 0.5f);
++outPtr;
++x;
}
// partition #6 ***********************************
x = 1;
for(j=colEnd; j < dataSizeX; ++j)
// column from index=(dataSi
zeX-kCenter) to index=(dataSizeX-1)
{
sum = 0;
t = x;
for(m=0; m < kernelSizeY; ++m)
{
for(n=x; n < kernelSizeX; ++n)
{
sum += *inPtr[t] * kernel[t];
++t;
}
t += x;
}
// store output
*outPtr = (unsigned char)((float)fabs(sum) + 0.5f);
++outPtr;
++x;

for(k=0; k < kSize; ++k) ++inPtr[k];

// move all cursors to next

}
}
// convolve rows from index=(dataSizeY-kCenterY) to index=(dataSizeY-1)
y = 1;
for(i= rowEnd; i < dataSizeY; ++i)
// number of rows
{
// partition #7 ***********************************
x = kCenterX;
for(j=0; j < kCenterX; ++j)
// column from index=0 to in
dex=kCenterX-1
{
sum = 0;
t = kernelSizeX * y;
for(m=y; m < kernelSizeY; ++m)
{
for(n=0; n <= x; ++n)
{
sum += *inPtr[t] * kernel[t];
++t;
}
t += (kernelSizeX - x - 1);
}
// store output
*outPtr = (unsigned char)((float)fabs(sum) + 0.5f);
++outPtr;
++x;
for(k=0; k < kSize; ++k) ++inPtr[k];
// move all cursors to next
}
// partition #8 ***********************************
for(j=kCenterX; j < colEnd; ++j)
// column from index=kCenter
X to index=(dataSizeX-kCenterX-1)
{
sum = 0;
t = kernelSizeX * y;
for(m=y; m < kernelSizeY; ++m)
{
for(n=0; n < kernelSizeX; ++n)
{
sum += *inPtr[t] * kernel[t];
++t;
}
}
// store output
*outPtr = (unsigned char)((float)fabs(sum) + 0.5f);
++outPtr;
++x;
for(k=0; k < kSize; ++k) ++inPtr[k];
}
// partition #9 ***********************************
x = 1;
for(j=colEnd; j < dataSizeX; ++j)
// column from index=(dataSi
zeX-kCenter) to index=(dataSizeX-1)
{

sum = 0;
t = kernelSizeX * y + x;
for(m=y; m < kernelSizeY; ++m)
{
for(n=x; n < kernelSizeX; ++n)
{
sum += *inPtr[t] * kernel[t];
++t;
}
t += x;
}
// store output
*outPtr = (unsigned char)((float)fabs(sum) + 0.5f);
++outPtr;
++x;
for(k=0; k < kSize; ++k) ++inPtr[k];
// move all cursors to next
}
++y;
increased
}

// the starting row index is

return true;
}

///////////////////////////////////////////////////////////////////////////////
// Fast 2D Convolution using integer multiplication instead of float.
// Multiply coefficient(factor) to accumulated sum at last.
// NOTE: IT IS NOT FASTER THAN FLOAT MULTIPLICATION, TRY YOURSELF!!!
///////////////////////////////////////////////////////////////////////////////
bool convolve2DFast2(unsigned char* in, unsigned char* out, int dataSizeX, int d
ataSizeY,
int* kernel, float factor, int kernelSizeX, int kernelSizeY)
{
int i, j, m, n, x, y, t;
unsigned char **inPtr, *outPtr, *ptr;
int kCenterX, kCenterY;
int rowEnd, colEnd;
// ending indice for section
divider
int sum;
// temp accumulation buffer
int k, kSize;
// check validity of params
if(!in || !out || !kernel) return false;
if(dataSizeX <= 0 || kernelSizeX <= 0) return false;
// find center position of kernel (half of kernel size)
kCenterX = kernelSizeX >> 1;
kCenterY = kernelSizeY >> 1;
kSize = kernelSizeX * kernelSizeY;
// total kernel size
// allocate memeory for multi-cursor
inPtr = new unsigned char*[kSize];
if(!inPtr) return false;

// allocation error

// set initial position of multi-cursor, NOTE: it is swapped instead of kern

ptr = in + (dataSizeX * kCenterY + kCenterX); // the first cursor is shifted

(kCenterX, kCenterY)
for(m=0, t=0; m < kernelSizeY; ++m)
{
for(n=0; n < kernelSizeX; ++n, ++t)
{
inPtr[t] = ptr - n;
}
ptr -= dataSizeX;
}
// init working pointers
outPtr = out;
rowEnd = dataSizeY - kCenterY;

// bottom row partition divi

colEnd = dataSizeX - kCenterX;

vider

// right column partition di

der

// convolve rows from index=0 to index=kCenterY-1

y = kCenterY;
for(i=0; i < kCenterY; ++i)
{
// partition #1 ***********************************
x = kCenterX;
for(j=0; j < kCenterX; ++j)
// column from index=0 to in
dex=kCenterX-1
{
sum = 0;
t = 0;
for(m=0; m <= y; ++m)
{
for(n=0; n <= x; ++n)
{
sum += *inPtr[t] * kernel[t];
++t;
}
t += (kernelSizeX - x - 1);
// jump to next row
}
// store output
*outPtr = (unsigned char)(fabs(sum * factor) + 0.5f);
++outPtr;
++x;
for(k=0; k < kSize; ++k) ++inPtr[k];
// move all cursors to next
}
// partition #2 ***********************************
for(j=kCenterX; j < colEnd; ++j)
// column from index=kCenter
X to index=(dataSizeX-kCenterX-1)
{
sum = 0;
t = 0;
for(m=0; m <= y; ++m)
{
for(n=0; n < kernelSizeX; ++n)
{
sum += *inPtr[t] * kernel[t];
++t;
}

}
// store output
*outPtr = (unsigned char)(fabs(sum * factor) + 0.5f);
++outPtr;
++x;
for(k=0; k < kSize; ++k) ++inPtr[k];
// move all cursors to next
}
// partition #3 ***********************************
x = 1;
for(j=colEnd; j < dataSizeX; ++j)
// column from index=(dataSi
zeX-kCenter) to index=(dataSizeX-1)
{
sum = 0;
t = x;
for(m=0; m <= y; ++m)
{
for(n=x; n < kernelSizeX; ++n)
{
sum += *inPtr[t] * kernel[t];
++t;
}
t += x;
// jump to next row
}
// store output
*outPtr = (unsigned char)(fabs(sum * factor) + 0.5f);
++outPtr;
++x;
for(k=0; k < kSize; ++k) ++inPtr[k];
// move all cursors to next
}
++y;
lve for next run
}

// add one more row to convo

// convolve rows from index=kCenterY to index=(dataSizeY-kCenterY-1)

for(i= kCenterY; i < rowEnd; ++i)
// number of rows
{
// partition #4 ***********************************
x = kCenterX;
for(j=0; j < kCenterX; ++j)
// column from index=0 to in
dex=kCenterX-1
{
sum = 0;
t = 0;
for(m=0; m < kernelSizeY; ++m)
{
for(n=0; n <= x; ++n)
{
sum += *inPtr[t] * kernel[t];
++t;
}
t += (kernelSizeX - x - 1);
}
// store output
*outPtr = (unsigned char)(fabs(sum * factor) + 0.5f);
++outPtr;

++x;
for(k=0; k < kSize; ++k) ++inPtr[k];

// move all cursors to next

}
// partition #5 ***********************************
for(j = kCenterX; j < colEnd; ++j)
// column from index=kCenter
X to index=(dataSizeX-kCenterX-1)
{
sum = 0;
t = 0;
for(m=0; m < kernelSizeY; ++m)
{
for(n=0; n < kernelSizeX; ++n)
{
sum += *inPtr[t] * kernel[t];
++inPtr[t]; // in this partition, all cursors are used to co
nvolve. moving cursors to next is safe here
++t;
}
}
// store output
*outPtr = (unsigned char)(fabs(sum * factor) + 0.5f);
++outPtr;
++x;
}
// partition #6 ***********************************
x = 1;
for(j=colEnd; j < dataSizeX; ++j)
// column from index=(dataSi
zeX-kCenter) to index=(dataSizeX-1)
{
sum = 0;
t = x;
for(m=0; m < kernelSizeY; ++m)
{
for(n=x; n < kernelSizeX; ++n)
{
sum += *inPtr[t] * kernel[t];
++t;
}
t += x;
}
// store output
*outPtr = (unsigned char)(fabs(sum * factor) + 0.5f);
++outPtr;
++x;
for(k=0; k < kSize; ++k) ++inPtr[k];
// move all cursors to next
}
}
// convolve rows from index=(dataSizeY-kCenterY) to index=(dataSizeY-1)
y = 1;
for(i= rowEnd; i < dataSizeY; ++i)
// number of rows
{
// partition #7 ***********************************
x = kCenterX;
for(j=0; j < kCenterX; ++j)
// column from index=0 to in
dex=kCenterX-1

{
sum = 0;
t = kernelSizeX * y;
for(m=y; m < kernelSizeY; ++m)
{
for(n=0; n <= x; ++n)
{
sum += *inPtr[t] * kernel[t];
++t;
}
t += (kernelSizeX - x - 1);
}
// store output
*outPtr = (unsigned char)(fabs(sum * factor) + 0.5f);
++outPtr;
++x;
for(k=0; k < kSize; ++k) ++inPtr[k];
// move all cursors to next
}
// partition #8 ***********************************
for(j=kCenterX; j < colEnd; ++j)
// column from index=kCenter
X to index=(dataSizeX-kCenterX-1)
{
sum = 0;
t = kernelSizeX * y;
for(m=y; m < kernelSizeY; ++m)
{
for(n=0; n < kernelSizeX; ++n)
{
sum += *inPtr[t] * kernel[t];
++t;
}
}
// store output
*outPtr = (unsigned char)(fabs(sum * factor) + 0.5f);
++outPtr;
++x;
for(k=0; k < kSize; ++k) ++inPtr[k];
}
// partition #9 ***********************************
x = 1;
for(j=colEnd; j < dataSizeX; ++j)
// column from index=(dataSi
zeX-kCenter) to index=(dataSizeX-1)
{
sum = 0;
t = kernelSizeX * y + x;
for(m=y; m < kernelSizeY; ++m)
{
for(n=x; n < kernelSizeX; ++n)
{
sum += *inPtr[t] * kernel[t];
++t;
}
t += x;
}

// store output
*outPtr = (unsigned char)(fabs(sum * factor) + 0.5f);
++outPtr;
++x;
for(k=0; k < kSize; ++k) ++inPtr[k];
// move all cursors to next
}
++y;
increased
}
return true;
}

// the starting row index is

Dsa
No ratings yet
Dsa
7 pages
Code Composer Studio Programs: Cycle - Ii
No ratings yet
Code Composer Studio Programs: Cycle - Ii
18 pages
Capt Pneum Desbts
No ratings yet
Capt Pneum Desbts
521 pages
Explanation Exercise10 Python
No ratings yet
Explanation Exercise10 Python
6 pages
Eliminating The Hardware/Software Divide: Satnam Singh, Microsoft Research Cambridge, UK
No ratings yet
Eliminating The Hardware/Software Divide: Satnam Singh, Microsoft Research Cambridge, UK
146 pages
Approx FFT
No ratings yet
Approx FFT
8 pages
Tugas Arsitektur Komputer Paralel4
No ratings yet
Tugas Arsitektur Komputer Paralel4
9 pages
Computer Graphics Lab Manual For CSE Sixth Semester
No ratings yet
Computer Graphics Lab Manual For CSE Sixth Semester
15 pages
Lab Manual CG
No ratings yet
Lab Manual CG
24 pages
Convolution C
No ratings yet
Convolution C
1 page
Example of 2D Convolution
No ratings yet
Example of 2D Convolution
5 pages
Program
No ratings yet
Program
6 pages
Nombres: Jefferson Pichucho Marcelo Sampedro: Using Namespace Using Namespace Void
No ratings yet
Nombres: Jefferson Pichucho Marcelo Sampedro: Using Namespace Using Namespace Void
16 pages
Practical-12CGR
No ratings yet
Practical-12CGR
5 pages
Finding Inverse Matrix Source Code 1
No ratings yet
Finding Inverse Matrix Source Code 1
9 pages
Computer Graphics Codes
No ratings yet
Computer Graphics Codes
6 pages
FFT Openmp
No ratings yet
FFT Openmp
11 pages
CG Programs 405
No ratings yet
CG Programs 405
18 pages
DSP Hardware
No ratings yet
DSP Hardware
16 pages
Arduino C Code For Image Dehazing
No ratings yet
Arduino C Code For Image Dehazing
25 pages
Cgrs
No ratings yet
Cgrs
21 pages
CG Practicals
No ratings yet
CG Practicals
51 pages
Digital Signal Processing: Name: Roll No: Aim
No ratings yet
Digital Signal Processing: Name: Roll No: Aim
15 pages
joint_matrix_bfloat16_modified
No ratings yet
joint_matrix_bfloat16_modified
4 pages
cse108_lab5
No ratings yet
cse108_lab5
2 pages
Codigo Fonte Gauss Seidel
No ratings yet
Codigo Fonte Gauss Seidel
7 pages
Cgma Lab Programs
No ratings yet
Cgma Lab Programs
50 pages
CG Practicals
No ratings yet
CG Practicals
51 pages
C++ Implementation
No ratings yet
C++ Implementation
2 pages
Ellipse Using Mid Point Algorithm
No ratings yet
Ellipse Using Mid Point Algorithm
2 pages
Clear Method SD - mq4
No ratings yet
Clear Method SD - mq4
10 pages
AFL MPLite V5.80
No ratings yet
AFL MPLite V5.80
9 pages
exp8dsp
No ratings yet
exp8dsp
3 pages
Lab 1: Introduction To Matlab Engr 451: Zachary Armendariz and Luke Jocson
No ratings yet
Lab 1: Introduction To Matlab Engr 451: Zachary Armendariz and Luke Jocson
7 pages
Steady State Stability
No ratings yet
Steady State Stability
10 pages
CG Lab-Record-Full
No ratings yet
CG Lab-Record-Full
46 pages
Lid Driven Cavity Semi Implicit CPP CODE
No ratings yet
Lid Driven Cavity Semi Implicit CPP CODE
10 pages
Raport: Ministerul Educaţiei Din Republica Moldova
No ratings yet
Raport: Ministerul Educaţiei Din Republica Moldova
5 pages
Include
No ratings yet
Include
14 pages
Bresan Harmalgorithm
No ratings yet
Bresan Harmalgorithm
14 pages
DAA_FILE
No ratings yet
DAA_FILE
18 pages
Rabin Karp
No ratings yet
Rabin Karp
23 pages
Fourier Arduino
100% (1)
Fourier Arduino
19 pages
message 9
No ratings yet
message 9
5 pages
ABC
No ratings yet
ABC
28 pages
CG2
No ratings yet
CG2
5 pages
MSP
No ratings yet
MSP
3 pages
Vassillen Chizhov - Multi-dimensional Arrays Indexing
No ratings yet
Vassillen Chizhov - Multi-dimensional Arrays Indexing
3 pages
MatrixOperations1 - Copy
No ratings yet
MatrixOperations1 - Copy
5 pages
Computer Engineering Laboratory Solution Primer
From Everand
Computer Engineering Laboratory Solution Primer
Karan Bhandari
No ratings yet
1.a) Linear Convolution
No ratings yet
1.a) Linear Convolution
12 pages
C.) Write Code For Stencil Pattern (A) Where One Value Approximates All The Other 8 Values of The Tile. A.)
No ratings yet
C.) Write Code For Stencil Pattern (A) Where One Value Approximates All The Other 8 Values of The Tile. A.)
5 pages
Write A Program For Imlementing Perceptron Learning Algorithm
100% (1)
Write A Program For Imlementing Perceptron Learning Algorithm
17 pages
Digital Image Processing Lab Manual# 4
No ratings yet
Digital Image Processing Lab Manual# 4
2 pages
Programming in C Report File: Submitted By: Manish Kumar Gahalout 66/EC/09 Semester-5th, ECE-2
No ratings yet
Programming in C Report File: Submitted By: Manish Kumar Gahalout 66/EC/09 Semester-5th, ECE-2
27 pages
S06 Convolution PDF
No ratings yet
S06 Convolution PDF
6 pages
Understanding Software Engineering Vol 3: Programming Basic Software Functionalities.
From Everand
Understanding Software Engineering Vol 3: Programming Basic Software Functionalities.
Gabriel Clemente
No ratings yet
C Programming
From Everand
C Programming
Netra
No ratings yet
Rust Package 100 Knocks: One-Hour Mastery Series 2024 Edition
From Everand
Rust Package 100 Knocks: One-Hour Mastery Series 2024 Edition
Kanto
No ratings yet
Projects With Microcontrollers And PICC
From Everand
Projects With Microcontrollers And PICC
Guillermo Perez Guillen
5/5 (1)
Dictionary ADT: Types Operations
No ratings yet
Dictionary ADT: Types Operations
5 pages
Pointers: Pointers in C Programming - Study Material
No ratings yet
Pointers: Pointers in C Programming - Study Material
5 pages
LIFFEE Access Method: Muhammad Irfan
No ratings yet
LIFFEE Access Method: Muhammad Irfan
8 pages
PGM Paradigm
No ratings yet
PGM Paradigm
26 pages
A Stream Library Using Erlang Binaries: Jay Nelson
No ratings yet
A Stream Library Using Erlang Binaries: Jay Nelson
8 pages
Siemens Parts: 26.3.4 Parameter Types
No ratings yet
Siemens Parts: 26.3.4 Parameter Types
22 pages
PW 2: Discovering The Environment 2: Goals
No ratings yet
PW 2: Discovering The Environment 2: Goals
2 pages
AMCAT Hash Tables Questions
No ratings yet
AMCAT Hash Tables Questions
3 pages
Aspen Excel Tutorial
No ratings yet
Aspen Excel Tutorial
70 pages
Pointers & Assembly
100% (1)
Pointers & Assembly
16 pages
Leetcode Pro Sheet
No ratings yet
Leetcode Pro Sheet
48 pages
MS Excel 10
No ratings yet
MS Excel 10
126 pages
Codd Rules With Examples
No ratings yet
Codd Rules With Examples
50 pages
Python Computer Engineering 45 46
No ratings yet
Python Computer Engineering 45 46
2 pages
(DSU) Data Structure Using 'C' (22317)
0% (1)
(DSU) Data Structure Using 'C' (22317)
6 pages
Chapter-5-Pointer in C++
No ratings yet
Chapter-5-Pointer in C++
68 pages
Techniques: Two Pointer Technique
No ratings yet
Techniques: Two Pointer Technique
5 pages
11 Numpy Cheat Sheet
No ratings yet
11 Numpy Cheat Sheet
1 page
Cognizant Interview Process
No ratings yet
Cognizant Interview Process
9 pages
9cgmv A Guide To Experimental Algorithmics PDF
100% (2)
9cgmv A Guide To Experimental Algorithmics PDF
272 pages
Sei Cert C Coding Standard 2016 v01
No ratings yet
Sei Cert C Coding Standard 2016 v01
534 pages
10987C ENU PowerPoint Day 3
No ratings yet
10987C ENU PowerPoint Day 3
125 pages
Starting To Write Immunity Debugger Pycommands My Cheatsheet
No ratings yet
Starting To Write Immunity Debugger Pycommands My Cheatsheet
10 pages
Comparator - Comparable
No ratings yet
Comparator - Comparable
12 pages
R Nuts and Bolts
No ratings yet
R Nuts and Bolts
9 pages
LKS Large Knapsack (Link To The Question)
No ratings yet
LKS Large Knapsack (Link To The Question)
4 pages
Assignment 2: CS 4040 Software Architecture and Design
No ratings yet
Assignment 2: CS 4040 Software Architecture and Design
4 pages
Practical First
No ratings yet
Practical First
4 pages
Computer Science Syllabus Class 11
No ratings yet
Computer Science Syllabus Class 11
5 pages
Syllabus 5th Sem
No ratings yet
Syllabus 5th Sem
3 pages

Convolution

Uploaded by

Convolution

Uploaded by

#include <cmath>

for(i=0; i < dataSizeY; ++i)

for(n=0; n < kernelSizeX; ++n) // kernel columns

// check validity of params

the range of convolution, the current column of kernel sh

// set to 0 before accumulat

// out of bound, move to nex

// move input data 1 raw up

// reset kernel to (0,0)

the range of convolution, the current column of kernel sh

if(m <= rowMax && m > rowMin)

// out of bound, move to nex

// move input data 1 raw up

// reset kernel to (0,0)

for(i= 0; i < dataSizeY; ++i)

the range of convolution, the current column of kernel sh

// set to 0 before accumulat

// out of bound, move to nex

// move input data 1 raw up

// reset kernel to (0,0)

float *inPtr, *inPtr2, *outPtr, *kPtr;

// to check boundary of inpu

// check validity of params

the range of convolution, the current column of kernel sh

// set to 0 before accumulat

// move input data 1 raw up

// reset kernel to (0,0)

the range of convolution, the current column of kernel sh

// set to 0 before accumulat

// out of bound, move to nex

// move input data 1 raw up

// reset kernel to (0,0)

// covolve horizontal direction ///////////////////////

// index for full kernel con

// init working pointers

// store intermediate result

// start horizontal convolution (x-direction)

// init to 0 before accumula

// ending index of partial k

// COLUMN FROM index=(dataSizeX-kCenter) TO index=(dataSizeX-1)

for(k = kSizeX-1, m=0; k >= kOffset; --k, ++m) // convolve with pa

// starting index of partial

// convolve with partial ker

// convert and copy from sum

// next element of output

// reset input pointer

// convert and copy from sum

// convert and copy from sum

// deallocate temp buffers

// index for full kernel con

// init working pointers

// store intermediate result

// start horizontal convolution (x-direction)

// init to 0 before accumula

// ending index of partial k

// COLUMN FROM index=(dataSizeX-kCenter) TO index=(dataSizeX-1)

for(i = 0; i < dataSizeX; ++i)

// starting index of partial

// convolve with partial ker

// convert and copy from sum

// next element of output

// reset input pointer

// convert and copy from sum

// ROW FROM index=(dataSizeY-kCenter) TO index=(dataSizeY-1)

// convert and copy from sum

// store accumulated sum

// index for full kernel con

// init working pointers

// store intermediate result

// start horizontal convolution (x-direction)

// init to 0 before accumula

// ending index of partial k

// COLUMN FROM index=(dataSizeX-kCenter) TO index=(dataSizeX-1)

// init to 0 before accumula

// starting index of partial

// convolve with partial ker

float inPtr, inPtr2, outPtr, kPtr;

sum[j] += tmpPtr kernelY[k];