0% found this document useful (0 votes)

18 views3 pages

Vector Addition

Uploaded by

aishwaryaraut1207

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as TXT, PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

18 views3 pages

Vector Addition

Uploaded by

aishwaryaraut1207

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as TXT, PDF, TXT or read online on Scribd

You are on page 1/ 3

#include <iostream>

#include <cuda_runtime.h>
#include <conio.h>
using namespace std;

global void addVectors(int* A, int* B, int* C, int n)

{
int i = blockIdx.x * blockDim.x + threadIdx.x;
if (i < n)
{
C[i] = A[i] + B[i];
}
}

int main()
{
int n;
cout << "Enter the size of vectors: ";
cin >> n;

int* A, * B, * C;
int size = n * sizeof(int);

// Allocate memory on the host

cudaMallocHost(&A, size);
cudaMallocHost(&B, size);
cudaMallocHost(&C, size);

// Initialize vector A
cout << "Enter values for vector A:" << endl;
for (int i = 0; i < n; i++)
{
cout << "A[" << i << "]: ";
cin >> A[i];
}

// Initialize vector B
cout << "Enter values for vector B:" << endl;
for (int i = 0; i < n; i++)
{
cout << "B[" << i << "]: ";
cin >> B[i];
}

// Get the number of threads per block from the user

int threadsPerBlock;
cout << "Enter the number of threads per block: ";
cin >> threadsPerBlock;

// Calculate the number of blocks

int numBlocks = (n + threadsPerBlock - 1) / threadsPerBlock;

// Allocate memory on the device

int* dev_A, * dev_B, * dev_C;
cudaMalloc(&dev_A, size);
cudaMalloc(&dev_B, size);
cudaMalloc(&dev_C, size);

// Copy data from host to device

cudaMemcpy(dev_A, A, size, cudaMemcpyHostToDevice);
cudaMemcpy(dev_B, B, size, cudaMemcpyHostToDevice);

// Create CUDA events for timing

cudaEvent_t start, stop;
cudaEventCreate(&start);
cudaEventCreate(&stop);

// Record the start event

cudaEventRecord(start);

// Launch the kernel

addVectors<<<numBlocks, threadsPerBlock>>>(dev_A, dev_B, dev_C, n);

// Record the stop event

cudaEventRecord(stop);

// Synchronize to ensure kernel execution is complete

cudaDeviceSynchronize();

// Calculate the elapsed time

float milliseconds = 0;
cudaEventElapsedTime(&milliseconds, start, stop);
cout << "Execution Time: " << milliseconds << " ms" << endl;

// Copy data from device to host

cudaMemcpy(C, dev_C, size, cudaMemcpyDeviceToHost);

// Print the results

cout << "Resultant vector C:" << endl;
for (int i = 0; i < n; i++)
{
cout << C[i] << " ";
}
cout << endl;

// Free memory
cudaFree(dev_A);
cudaFree(dev_B);
cudaFree(dev_C);
cudaFreeHost(A);
cudaFreeHost(B);
cudaFreeHost(C);

// Destroy the events

cudaEventDestroy(start);
cudaEventDestroy(stop);
getch();
return 0;
}

output:

Enter the size of vectors: 5

Enter values for vector A:
A[0]: 4
A[1]: 6
A[2]: 8
A[3]: 2
A[4]: 3
Enter values for vector B:
B[0]: 8
B[1]: 4
B[2]: 2
B[3]: 6
B[4]: 4
Enter the number of threads per block: 3
Execution Time: 0.006112 ms
Resultant vector C:
12 10 10 8 7

Addition_Cuda
No ratings yet
Addition_Cuda
2 pages
cuda
No ratings yet
cuda
4 pages
LP 1,,1
No ratings yet
LP 1,,1
5 pages
217 Lec2
No ratings yet
217 Lec2
24 pages
PDC assignment
No ratings yet
PDC assignment
9 pages
4. Cuda Add Mult
No ratings yet
4. Cuda Add Mult
3 pages
2023-CSC14120-Lecture01-CUDAIntroduction
No ratings yet
2023-CSC14120-Lecture01-CUDAIntroduction
32 pages
CUDA PPT Anurita Unit3
No ratings yet
CUDA PPT Anurita Unit3
42 pages
CUDA Additionof2Vector
No ratings yet
CUDA Additionof2Vector
2 pages
Gpu History and Cuda Programming Basics
No ratings yet
Gpu History and Cuda Programming Basics
44 pages
Rishi
No ratings yet
Rishi
30 pages
GPU Series III CUDA Compilation Host Side 1721302802
No ratings yet
GPU Series III CUDA Compilation Host Side 1721302802
8 pages
Cuda Firstprograms PDF
No ratings yet
Cuda Firstprograms PDF
6 pages
vertopal.com_Lab7_GPU (1)
No ratings yet
vertopal.com_Lab7_GPU (1)
10 pages
CUDA Exercises
No ratings yet
CUDA Exercises
185 pages
7. Moving to Parallel - Addition of 2 Matrices
No ratings yet
7. Moving to Parallel - Addition of 2 Matrices
14 pages
BECOA157 Parallel Matrix Multiplication
No ratings yet
BECOA157 Parallel Matrix Multiplication
3 pages
01 Cuda c Basics
No ratings yet
01 Cuda c Basics
32 pages
Introduction To CUDA: CAP 4730 Spring 2012
No ratings yet
Introduction To CUDA: CAP 4730 Spring 2012
35 pages
CUDA MatrixMultiplication
No ratings yet
CUDA MatrixMultiplication
2 pages
Google Colab Solution Activity
No ratings yet
Google Colab Solution Activity
5 pages
3-CUDA
No ratings yet
3-CUDA
5 pages
CUDA Programming Invert
No ratings yet
CUDA Programming Invert
36 pages
Lecture 11 Programming On Gpus Part 1 Zxu2acms60212 40212 S15lec 11 Gpupdf
No ratings yet
Lecture 11 Programming On Gpus Part 1 Zxu2acms60212 40212 S15lec 11 Gpupdf
121 pages
Group A Assignment 4 (A) : Two Large Vectors
No ratings yet
Group A Assignment 4 (A) : Two Large Vectors
5 pages
cuuda nvidai guide_Part3
No ratings yet
cuuda nvidai guide_Part3
15 pages
20 Quiz 14
No ratings yet
20 Quiz 14
12 pages
Intro To CUDA
No ratings yet
Intro To CUDA
76 pages
Cuda C/C++ Basics: NVIDIA Corporation
No ratings yet
Cuda C/C++ Basics: NVIDIA Corporation
67 pages
CUDAProgModel
No ratings yet
CUDAProgModel
24 pages
Lecture2 Cuda Basic 2010
No ratings yet
Lecture2 Cuda Basic 2010
44 pages
GPU Programming: CUDA
No ratings yet
GPU Programming: CUDA
29 pages
2023 CSC14120 Lecture05 CUDAMemories
No ratings yet
2023 CSC14120 Lecture05 CUDAMemories
48 pages
06-CUDA Thread Organization
No ratings yet
06-CUDA Thread Organization
27 pages
Threads
No ratings yet
Threads
54 pages
Input: Output: 1. Sub String Program
No ratings yet
Input: Output: 1. Sub String Program
8 pages
Lab 1 Parallel
No ratings yet
Lab 1 Parallel
4 pages
Introduction To CUDA C 3
No ratings yet
Introduction To CUDA C 3
67 pages
CUDA_part-1
No ratings yet
CUDA_part-1
52 pages
Ejercicio 2 Práctica 3: CUDA Desempeño en Función de La Homogeneidad para Acceder A Memoria y de La Regularidad Del Código
No ratings yet
Ejercicio 2 Práctica 3: CUDA Desempeño en Función de La Homogeneidad para Acceder A Memoria y de La Regularidad Del Código
8 pages
cuda_mode_lecture2
No ratings yet
cuda_mode_lecture2
33 pages
Clenqueuereadbuffer (Queue, C - Buffer,, 0, N, C, 0, ,)
No ratings yet
Clenqueuereadbuffer (Queue, C - Buffer,, 0, N, C, 0, ,)
3 pages
G80 Cuda
No ratings yet
G80 Cuda
25 pages
HPC Int2 Key
No ratings yet
HPC Int2 Key
10 pages
3 Some Commonly Used CUDA API: 3.1 Function Type Qualifiers
No ratings yet
3 Some Commonly Used CUDA API: 3.1 Function Type Qualifiers
7 pages
CUDA_part-1-LMS
No ratings yet
CUDA_part-1-LMS
51 pages
Introduccion CUDA C
No ratings yet
Introduccion CUDA C
51 pages
002 - Introduction To CUDA Programming - 1
No ratings yet
002 - Introduction To CUDA Programming - 1
54 pages
Introduction To CUDA C
No ratings yet
Introduction To CUDA C
67 pages
Lecture3 Fundamentals of CUDA(Part1)_2025
No ratings yet
Lecture3 Fundamentals of CUDA(Part1)_2025
52 pages
Class 10
No ratings yet
Class 10
13 pages
CUDA_1
No ratings yet
CUDA_1
45 pages
CUDA Introduction
No ratings yet
CUDA Introduction
39 pages
hw2
No ratings yet
hw2
12 pages
Data Parallelism, Task Parallelism, CPU,GPU
No ratings yet
Data Parallelism, Task Parallelism, CPU,GPU
13 pages
Data Parallelism, Task Parallelism, CPU,GPU (1)
No ratings yet
Data Parallelism, Task Parallelism, CPU,GPU (1)
13 pages
GPU Computing 2
No ratings yet
GPU Computing 2
28 pages
CUDA Compute Unified Device Architecture
No ratings yet
CUDA Compute Unified Device Architecture
26 pages
Computer Engineering Laboratory Solution Primer
From Everand
Computer Engineering Laboratory Solution Primer
Karan Bhandari
No ratings yet
Build your own Blockchain: Make your own blockchain and trading bot on your pc
From Everand
Build your own Blockchain: Make your own blockchain and trading bot on your pc
Magelan Cybersecurity
No ratings yet
Unit-4 Linker Loader
100% (1)
Unit-4 Linker Loader
13 pages
Oop Lesson Plan Cs3391 Jec
No ratings yet
Oop Lesson Plan Cs3391 Jec
4 pages
Java Programming: Grade 10 - Einstein S.Y 2022-2023
No ratings yet
Java Programming: Grade 10 - Einstein S.Y 2022-2023
7 pages
C Sharp U-II Notes
No ratings yet
C Sharp U-II Notes
16 pages
Proble Solution Os
No ratings yet
Proble Solution Os
7 pages
Python OOPs Assignment
No ratings yet
Python OOPs Assignment
19 pages
Bit Soft Computing Lab Manual
No ratings yet
Bit Soft Computing Lab Manual
2 pages
Lab 4 Classes
No ratings yet
Lab 4 Classes
4 pages
Crypto Watermarking Method For Medical Images 5721 NDgZaOt
No ratings yet
Crypto Watermarking Method For Medical Images 5721 NDgZaOt
13 pages
Implementation of Three Address Code
No ratings yet
Implementation of Three Address Code
9 pages
WT Practical Oral Questions
No ratings yet
WT Practical Oral Questions
5 pages
Sliit Academy: Higher National Diploma in Information Technology - Year 1, Semester 1
No ratings yet
Sliit Academy: Higher National Diploma in Information Technology - Year 1, Semester 1
23 pages
Weak and Strong Reinforcement Number For A Graph
No ratings yet
Weak and Strong Reinforcement Number For A Graph
7 pages
Lexical Analysis
No ratings yet
Lexical Analysis
44 pages
C++ Programming Lab Manual R18 JNTUH
No ratings yet
C++ Programming Lab Manual R18 JNTUH
25 pages
Oop Homework
100% (1)
Oop Homework
8 pages
Unions Intersection Minus Assignment 5
No ratings yet
Unions Intersection Minus Assignment 5
4 pages
Image Captioning Final
No ratings yet
Image Captioning Final
31 pages
cpp20 Refcard 29th Jan
No ratings yet
cpp20 Refcard 29th Jan
1 page
Lab 2 Asp Net MVC
No ratings yet
Lab 2 Asp Net MVC
4 pages
Y3A Practice Book Answers White Rose Maths Edition
No ratings yet
Y3A Practice Book Answers White Rose Maths Edition
18 pages
Spa&Saloon-Srinivasa V
No ratings yet
Spa&Saloon-Srinivasa V
38 pages
OSY Winter 23
No ratings yet
OSY Winter 23
17 pages
DN3.0 Upskilling Practice Assessment Questions
No ratings yet
DN3.0 Upskilling Practice Assessment Questions
9 pages
XII CS Material 2022-23
No ratings yet
XII CS Material 2022-23
308 pages
CourseHandout Object Oriented Programming and Design
No ratings yet
CourseHandout Object Oriented Programming and Design
11 pages
Mathematics - Chapter 2 - 20-JUN-2024 - xcNtk086PO - 240621 - 124616
No ratings yet
Mathematics - Chapter 2 - 20-JUN-2024 - xcNtk086PO - 240621 - 124616
7 pages
Core Python Programming and Problem Anal
No ratings yet
Core Python Programming and Problem Anal
232 pages
Dồn Biến (MV)
No ratings yet
Dồn Biến (MV)
4 pages
Practical Task 1 (4 Hours) Basic Programming
No ratings yet
Practical Task 1 (4 Hours) Basic Programming
7 pages

Vector Addition

Uploaded by

Vector Addition

Uploaded by

#include <iostream>

__global__ void addVectors(int* A, int* B, int* C, int n)

// Allocate memory on the host

// Get the number of threads per block from the user

// Calculate the number of blocks

// Allocate memory on the device

// Copy data from host to device

// Create CUDA events for timing

// Record the start event

// Launch the kernel

// Record the stop event

// Synchronize to ensure kernel execution is complete

// Calculate the elapsed time

// Copy data from device to host

// Print the results

// Destroy the events

Enter the size of vectors: 5

You might also like

global void addVectors(int* A, int* B, int* C, int n)