0% found this document useful (0 votes)

7 views3 pages

Cuda Add Mult

The document contains CUDA code for vector addition and matrix multiplication. It includes the necessary setup for CUDA, memory allocation on both host and device, kernel definitions, and execution of the operations. The results are printed to the console after computation, and memory is properly freed at the end of each operation.

Uploaded by

rolexbiden

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as TXT, PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

7 views3 pages

Cuda Add Mult

Uploaded by

rolexbiden

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as TXT, PDF, TXT or read online on Scribd

You are on page 1/ 3

!

nvcc --version

-----------------------------------------------
!pip install git+https://github.com/andreinechaev/nvcc4jupyter.git

-----------------------------------------------
%load_ext nvcc_plugin

-----------------------------------------------
# VECTOR ADDITION
%%cu

#include <stdio.h>

// CUDA kernel for vector addition

__global__ void vectorAdd(int* a, int* b, int* c, int size)
{
int tid = blockIdx.x * blockDim.x + threadIdx.x;
if (tid < size) {
c[tid] = a[tid] + b[tid];
}
}

int main()
{
int size = 100; // Size of the vectors
int* a, * b, * c; // Host vectors
int* dev_a, * dev_b, * dev_c; // Device vectors

// Allocate memory for host vectors

a = (int*)malloc(size * sizeof(int));
b = (int*)malloc(size * sizeof(int));
c = (int*)malloc(size * sizeof(int));

// Initialize host vectors

for (int i = 0; i < size; i++) {
a[i] = i;
b[i] = 2 * i;
}

// Allocate memory on the device for device vectors

cudaMalloc((void**)&dev_a, size * sizeof(int));
cudaMalloc((void**)&dev_b, size * sizeof(int));
cudaMalloc((void**)&dev_c, size * sizeof(int));

// Copy host vectors to device

cudaMemcpy(dev_a, a, size * sizeof(int), cudaMemcpyHostToDevice);
cudaMemcpy(dev_b, b, size * sizeof(int), cudaMemcpyHostToDevice);

// Launch kernel for vector addition

int blockSize = 256;
int gridSize = (size + blockSize - 1) / blockSize;
vectorAdd<<<gridSize, blockSize>>>(dev_a, dev_b, dev_c, size);

// Copy result from device to host

cudaMemcpy(c, dev_c, size * sizeof(int), cudaMemcpyDeviceToHost);

// Print result
for (int i = 0; i < size; i++) {
printf("%d + %d = %d\n", a[i], b[i], c[i]);
}

// Free device memory

cudaFree(dev_a);
cudaFree(dev_b);
cudaFree(dev_c);

// Free host memory

free(a);
free(b);
free(c);

return 0;
}

-----------------------------------------------
# MATRIX MULTIPLICATION

%%cu

#include <stdio.h>

// CUDA kernel for matrix multiplication

__global__ void matrixMul(int* a, int* b, int* c, int rowsA, int colsA, int colsB)
{
int row = blockIdx.y * blockDim.y + threadIdx.y;
int col = blockIdx.x * blockDim.x + threadIdx.x;
int sum = 0;
if (row < rowsA && col < colsB) {
for (int i = 0; i < colsA; i++) {
sum += a[row * colsA + i] * b[i * colsB + col];
}
c[row * colsB + col] = sum;
}
}

int main() {
int rowsA = 10; // Rows of matrix A
int colsA = 10; // Columns of matrix A
int rowsB = colsA; // Rows of matrix B
int colsB = 10; // Columns of matrix B

int* a, * b, * c; // Host matrices

int* dev_a, * dev_b, * dev_c; // Device matrices

// Allocate memory for host matrices

a = (int*)malloc(rowsA * colsA * sizeof(int));
b = (int*)malloc(rowsB * colsB * sizeof(int));
c = (int*)malloc(rowsA * colsB * sizeof(int));

// Initialize host matrices

for (int i = 0; i < rowsA * colsA; i++) {
a[i] = i;
}
for (int i = 0; i < rowsB * colsB; i++) {
b[i] = 2 * i;
}
// Allocate memory on the device for device matrices
cudaMalloc((void**)&dev_a, rowsA * colsA * sizeof(int));
cudaMalloc((void**)&dev_b, rowsB * colsB * sizeof(int));
cudaMalloc((void**)&dev_c, rowsA * colsB * sizeof(int));

// Copy host matrices to device

cudaMemcpy(dev_a, a, rowsA * colsA * sizeof(int), cudaMemcpyHostToDevice);
cudaMemcpy(dev_b, b, rowsB * colsB * sizeof(int), cudaMemcpyHostToDevice);

// Define grid and block dimensions

dim3 blockSize(16, 16);
dim3 gridSize((colsB + blockSize.x - 1) / blockSize.x, (rowsA + blockSize.y -
1) / blockSize.y);

// Launch kernel for matrix multiplication

matrixMul<<<gridSize, blockSize>>>(dev_a, dev_b, dev_c, rowsA, colsA, colsB);

// Copy result from device to host

cudaMemcpy(c, dev_c, rowsA * colsB * sizeof(int), cudaMemcpyDeviceToHost);

// Print result
printf("Result:\n");
for (int i = 0; i < rowsA; i++) {
for (int j = 0; j < colsB; j++) {
printf("%d ", c[i * colsB + j]);
}
printf("\n");
}

// Free device memory

cudaFree(dev_a);
cudaFree(dev_b);
cudaFree(dev_c);

// Free host memory

free(a);
free(b);
free(c);

return 0;
}

01 Cuda C Basics
No ratings yet
01 Cuda C Basics
32 pages
Cuda C/C++ Basics: NVIDIA Corporation
No ratings yet
Cuda C/C++ Basics: NVIDIA Corporation
67 pages
CUDA Exercises
No ratings yet
CUDA Exercises
185 pages
Lecture 11 Programming On Gpus Part 1 Zxu2acms60212 40212 S15lec 11 Gpupdf
No ratings yet
Lecture 11 Programming On Gpus Part 1 Zxu2acms60212 40212 S15lec 11 Gpupdf
121 pages
CUDA Part-1
No ratings yet
CUDA Part-1
52 pages
Matrix Mult
100% (1)
Matrix Mult
55 pages
Introduction To CUDA C
No ratings yet
Introduction To CUDA C
67 pages
周03
No ratings yet
周03
65 pages
Intro To CUDA
No ratings yet
Intro To CUDA
76 pages
LPIC-1 Primer
From Everand
LPIC-1 Primer
John Greene
4.5/5 (3)
Introduction To CUDA C 3
No ratings yet
Introduction To CUDA C 3
67 pages
Threads
No ratings yet
Threads
54 pages
CUDA - Part 1 LMS
No ratings yet
CUDA - Part 1 LMS
51 pages
CUDA Programming Invert
No ratings yet
CUDA Programming Invert
36 pages
CAT Quantitative Aptitude PDF
No ratings yet
CAT Quantitative Aptitude PDF
5 pages
2023 CSC14120 Lecture05 CUDAMemories
No ratings yet
2023 CSC14120 Lecture05 CUDAMemories
48 pages
CUDA PPT Anurita Unit3
No ratings yet
CUDA PPT Anurita Unit3
42 pages
TCS Reasoning Ability One Shot Notes - Watermark
No ratings yet
TCS Reasoning Ability One Shot Notes - Watermark
685 pages
Introduccion CUDA C
No ratings yet
Introduccion CUDA C
51 pages
2023 CSC14120 Lecture01 CUDAIntroduction
No ratings yet
2023 CSC14120 Lecture01 CUDAIntroduction
32 pages
Department of Computer Engineering BE Laboratory Practice-I A.Y 2021-22 SEM1
No ratings yet
Department of Computer Engineering BE Laboratory Practice-I A.Y 2021-22 SEM1
45 pages
Gpu History and Cuda Programming Basics
No ratings yet
Gpu History and Cuda Programming Basics
44 pages
Rishi
No ratings yet
Rishi
30 pages
CUDAProg Model
No ratings yet
CUDAProg Model
24 pages
217 Lec2
No ratings yet
217 Lec2
24 pages
Computer Engineering Laboratory Solution Primer
From Everand
Computer Engineering Laboratory Solution Primer
Karan Bhandari
No ratings yet
GPU Programming: CUDA
No ratings yet
GPU Programming: CUDA
29 pages
Csnb594csnb4423 Lab 5 01a Harveen Velan Sw0104101
No ratings yet
Csnb594csnb4423 Lab 5 01a Harveen Velan Sw0104101
19 pages
Cuuda Nvidai Guide - Part3
No ratings yet
Cuuda Nvidai Guide - Part3
15 pages
Moving To Parallel - Addition of 2 Matrices
No ratings yet
Moving To Parallel - Addition of 2 Matrices
14 pages
Introduction To CUDA: CAP 4730 Spring 2012
No ratings yet
Introduction To CUDA: CAP 4730 Spring 2012
35 pages
5 Computation
No ratings yet
5 Computation
13 pages
PDC Assignment
No ratings yet
PDC Assignment
9 pages
Lab7 GPU
No ratings yet
Lab7 GPU
10 pages
HPC (Pra 04)
No ratings yet
HPC (Pra 04)
11 pages
GPU Series III CUDA Compilation Host Side 1721302802
No ratings yet
GPU Series III CUDA Compilation Host Side 1721302802
8 pages
20 Quiz 14
No ratings yet
20 Quiz 14
12 pages
Lab Report 6
No ratings yet
Lab Report 6
12 pages
Google Colab Solution Activity
No ratings yet
Google Colab Solution Activity
5 pages
3 Cuda
No ratings yet
3 Cuda
5 pages
Group A Assignment 4 (A) : Two Large Vectors
No ratings yet
Group A Assignment 4 (A) : Two Large Vectors
5 pages
HPC 4 B
No ratings yet
HPC 4 B
5 pages
The Suez Canal Transit Guide PDF
50% (2)
The Suez Canal Transit Guide PDF
30 pages
Hetero Lecture Slides 002 Lecture 1 Lecture-1-5-Cuda-API
No ratings yet
Hetero Lecture Slides 002 Lecture 1 Lecture-1-5-Cuda-API
11 pages
Ejercicio 2 Práctica 3: CUDA Desempeño en Función de La Homogeneidad para Acceder A Memoria y de La Regularidad Del Código
No ratings yet
Ejercicio 2 Práctica 3: CUDA Desempeño en Función de La Homogeneidad para Acceder A Memoria y de La Regularidad Del Código
8 pages
Lab 1 Parallel
No ratings yet
Lab 1 Parallel
4 pages
Cuda
No ratings yet
Cuda
4 pages
Input: Output: 1. Sub String Program
No ratings yet
Input: Output: 1. Sub String Program
8 pages
3 Some Commonly Used CUDA API: 3.1 Function Type Qualifiers
No ratings yet
3 Some Commonly Used CUDA API: 3.1 Function Type Qualifiers
7 pages
CUDA
No ratings yet
CUDA
3 pages
LP 1,,1
No ratings yet
LP 1,,1
5 pages
CUDA Additionof2Vector
No ratings yet
CUDA Additionof2Vector
2 pages
Addition Cuda
No ratings yet
Addition Cuda
2 pages
CUDA MatrixMultiplication
No ratings yet
CUDA MatrixMultiplication
2 pages
Bearings (Y11)
No ratings yet
Bearings (Y11)
15 pages
Cuda Firstprograms PDF
No ratings yet
Cuda Firstprograms PDF
6 pages
Allocate The Device Memory Where We Will Copy M
No ratings yet
Allocate The Device Memory Where We Will Copy M
2 pages
Vector Addition
No ratings yet
Vector Addition
3 pages
Sounds To Stabilize The Planet Holon
100% (1)
Sounds To Stabilize The Planet Holon
52 pages
Parallel Scan in C CUda
No ratings yet
Parallel Scan in C CUda
3 pages
BECOA157 Parallel Matrix Multiplication
No ratings yet
BECOA157 Parallel Matrix Multiplication
3 pages
OS
No ratings yet
OS
8 pages
Quant
No ratings yet
Quant
82 pages
cs239 Ejer1
No ratings yet
cs239 Ejer1
2 pages
Mulmatrix Cu
No ratings yet
Mulmatrix Cu
3 pages
Adv Apti
No ratings yet
Adv Apti
77 pages
Blu Ray LG BP420 ENG PDF
No ratings yet
Blu Ray LG BP420 ENG PDF
62 pages
TP1: Converting Vector Addition To CUDA.: Listing 1 An Example of Vector Addition Implemented in C
No ratings yet
TP1: Converting Vector Addition To CUDA.: Listing 1 An Example of Vector Addition Implemented in C
1 page
Chilled Water Fan Coil Units - Zamil Air Conditioners
No ratings yet
Chilled Water Fan Coil Units - Zamil Air Conditioners
24 pages
Chemistry Chemistry For Engineers Final Exam
No ratings yet
Chemistry Chemistry For Engineers Final Exam
58 pages
The Monk
No ratings yet
The Monk
304 pages
DeviceFunc Cu
100% (1)
DeviceFunc Cu
1 page
Audit Report Master
No ratings yet
Audit Report Master
66 pages
CH1-Sequences and Seriess
No ratings yet
CH1-Sequences and Seriess
17 pages
BAC VXC SpareParts Pv00EN
No ratings yet
BAC VXC SpareParts Pv00EN
1 page
4 Week Bodyweight
No ratings yet
4 Week Bodyweight
76 pages
Istighfaraat (Seeking Forgiveness) - Sidi Abu Madyan Al-Ghawth
No ratings yet
Istighfaraat (Seeking Forgiveness) - Sidi Abu Madyan Al-Ghawth
6 pages
ETABS Concrete Frame Design: IS 456:2000 Beam Section Design
No ratings yet
ETABS Concrete Frame Design: IS 456:2000 Beam Section Design
2 pages
Benergy 12V 100AH Lifepo4 Battery Pack - For 72V Battery
No ratings yet
Benergy 12V 100AH Lifepo4 Battery Pack - For 72V Battery
9 pages
Sy Llable
No ratings yet
Sy Llable
28 pages
NUR168 Project 031822
No ratings yet
NUR168 Project 031822
11 pages
WTP 3022 Tiling Works
No ratings yet
WTP 3022 Tiling Works
10 pages
Workshop Practice 1 (Mec 104) Edited Version 2
No ratings yet
Workshop Practice 1 (Mec 104) Edited Version 2
8 pages
Literature Review Pneumonia
100% (1)
Literature Review Pneumonia
4 pages
Package Treeclim': October 8, 2020
No ratings yet
Package Treeclim': October 8, 2020
23 pages
IT Essentials - Jeopardy Game Chapter 1
No ratings yet
IT Essentials - Jeopardy Game Chapter 1
33 pages
Astronomy 297 Chapter 2 Review
No ratings yet
Astronomy 297 Chapter 2 Review
6 pages
BOF Slag: Turning Waste Into Value
No ratings yet
BOF Slag: Turning Waste Into Value
12 pages
Despiece Ei24id81ss0a
No ratings yet
Despiece Ei24id81ss0a
14 pages
TC74VHC240F, TC74VHC240FK TC74VHC244F, TC74VHC244FK
No ratings yet
TC74VHC240F, TC74VHC240FK TC74VHC244F, TC74VHC244FK
10 pages
E-Series SHD Butt Welding Machines
No ratings yet
E-Series SHD Butt Welding Machines
4 pages
Sanfoundry
No ratings yet
Sanfoundry
3 pages
CAR Part 8
No ratings yet
CAR Part 8
4 pages
Siemens Power Engineering Guide 7E 259
No ratings yet
Siemens Power Engineering Guide 7E 259
1 page

Cuda Add Mult

Uploaded by

Cuda Add Mult

Uploaded by

!

// CUDA kernel for vector addition

// Allocate memory for host vectors

// Initialize host vectors

// Allocate memory on the device for device vectors

// Copy host vectors to device

// Launch kernel for vector addition

// Copy result from device to host

// Free device memory

// Free host memory

// CUDA kernel for matrix multiplication

int* a, * b, * c; // Host matrices

// Allocate memory for host matrices

// Initialize host matrices

// Copy host matrices to device

// Define grid and block dimensions

// Launch kernel for matrix multiplication

// Copy result from device to host

// Free device memory

// Free host memory

You might also like