HW 1 Xsede

This document provides instructions for homework 1 which involves optimizing matrix multiplication. Students will implement a function to perform C = C + AB matrix multiplication for square matrices. The goal is to make the computation as fast as possible by applying optimization techniques like blocking/tiling to utilize cache better, copying matrices to aligned buffers, and vectorizing small matrix multiplications. Students are given pseudocode for the basic 3 nested loop implementation and techniques to try like blocking at different cache levels, copying, and vectorization.

Uploaded by

Allen Prasad

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

50 views8 pages

HW 1 Xsede

Uploaded by

Allen Prasad

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 8

CS 267 HW 1

Ben Brock
Optimizing Matrix Multiply
- In HW 1, you’ll be optimizing matrix multiply

- C = C + AB, where A, B, and C are dense matrices

- For simplicity, we’ll consider the case of square matrices

Problem Pseudocode
for i = 1 to N:
for j = 1 to N:
for k = 1 to N:
c[i, j] = c[i, j] + a[i, k] * b[k, j]

3 nested loops => n3 complexity

Your Job: Implement This Interface

void square_dgemm (int n, double* A, double* B,

double* C);

You write this function, we call your function in a test harness.

Your job is to make it run as fast as possible.

Optimization Techniques
1) Blocking
a) L1 blocking
b) Register blocking
c) L2 blocking
2) Copy optimization
a) Copy to an aligned buffer
b) Transpose?
3) Vectorization
a) Write small, fixed-size (n=8-16) GEMM, examine assembly
b) Intrinsics
Blocking (or Tiling)
Copy Optimization

Blocked Matrix Multiply
No ratings yet
Blocked Matrix Multiply
6 pages
Mat PTR
No ratings yet
Mat PTR
8 pages
Irjet V5i3362
No ratings yet
Irjet V5i3362
4 pages
Ass 1 Unit 26 16-17
0% (1)
Ass 1 Unit 26 16-17
3 pages
Optimize Matrix Multiplication Utilizing Opencl Fpga Kernel
No ratings yet
Optimize Matrix Multiplication Utilizing Opencl Fpga Kernel
8 pages
Optimizing Sparse Matrix Vector Multiplication On SMPS: Eun-Jin Im and Katherine Yelick
No ratings yet
Optimizing Sparse Matrix Vector Multiplication On SMPS: Eun-Jin Im and Katherine Yelick
9 pages
Lab6 - Linear Algebra in C On A Microcontroller
No ratings yet
Lab6 - Linear Algebra in C On A Microcontroller
8 pages
LinearAlgebra Matlab HW3 V2s
No ratings yet
LinearAlgebra Matlab HW3 V2s
5 pages
Optimize Matrix Multiplication Order
No ratings yet
Optimize Matrix Multiplication Order
19 pages
DAA Mini Project-1
No ratings yet
DAA Mini Project-1
14 pages
Efficiient Matrix Multiply C#
No ratings yet
Efficiient Matrix Multiply C#
9 pages
Matrix Multiplication Lab Guide
No ratings yet
Matrix Multiplication Lab Guide
6 pages
Assign 01
No ratings yet
Assign 01
19 pages
Performance Experiments With Matrix Multiplication A Trivial Problem?
No ratings yet
Performance Experiments With Matrix Multiplication A Trivial Problem?
1 page
Computer Architecture Final Project
No ratings yet
Computer Architecture Final Project
29 pages
FPGA
No ratings yet
FPGA
6 pages
Class18 - Linalg II Handout PDF
No ratings yet
Class18 - Linalg II Handout PDF
48 pages
HPC Matrix Algorithms Lecture
No ratings yet
HPC Matrix Algorithms Lecture
15 pages
Cabais Finals Lab Act#2
No ratings yet
Cabais Finals Lab Act#2
9 pages
Code Optimization Sept. 25, 2003: "The Course That Gives CMU Its Zip!"
No ratings yet
Code Optimization Sept. 25, 2003: "The Course That Gives CMU Its Zip!"
57 pages
Matrix Multiplications and Collective Communication: Michael Hanke
No ratings yet
Matrix Multiplications and Collective Communication: Michael Hanke
38 pages
How To Multiply: 5.5 Integer Multiplication
No ratings yet
How To Multiply: 5.5 Integer Multiplication
16 pages
Intro Spu Optimizations Part 1
No ratings yet
Intro Spu Optimizations Part 1
62 pages
Cannon Strassen DNS Algorithm
No ratings yet
Cannon Strassen DNS Algorithm
10 pages
Code Generation
No ratings yet
Code Generation
20 pages
Matrix Operations Complexity Analysis
No ratings yet
Matrix Operations Complexity Analysis
5 pages
47 A4 (Chain Multiplication)
No ratings yet
47 A4 (Chain Multiplication)
2 pages
MIT18 335JF10 Lec2a Hand
No ratings yet
MIT18 335JF10 Lec2a Hand
7 pages
LEC12-Optimization and New Trends
No ratings yet
LEC12-Optimization and New Trends
23 pages
Advanced Computer Architecture 1
No ratings yet
Advanced Computer Architecture 1
14 pages
Lecture 19ppt
No ratings yet
Lecture 19ppt
18 pages
Data Structure N Algorithm
No ratings yet
Data Structure N Algorithm
2 pages
C++ Matrix Multiplication Program - The Crazy Programmer
No ratings yet
C++ Matrix Multiplication Program - The Crazy Programmer
1 page
Parallel Processing
No ratings yet
Parallel Processing
35 pages
Daa 02 R1 2
No ratings yet
Daa 02 R1 2
63 pages
Matrix Multiplication Algorithm
No ratings yet
Matrix Multiplication Algorithm
9 pages
Dynamic Matrix Multiplication Guide
No ratings yet
Dynamic Matrix Multiplication Guide
27 pages
Matrix Operations for Beginners
No ratings yet
Matrix Operations for Beginners
3 pages
Strassen's Algorithm & Optimization
No ratings yet
Strassen's Algorithm & Optimization
8 pages
Dense Matrix Parallel Algorithms
No ratings yet
Dense Matrix Parallel Algorithms
55 pages
Department of Computer Scienc2
No ratings yet
Department of Computer Scienc2
5 pages
High Speed Matrix Multiplication
No ratings yet
High Speed Matrix Multiplication
6 pages
Pila
No ratings yet
Pila
4 pages
Lecture 20ppt
No ratings yet
Lecture 20ppt
25 pages
Matrix-Matrix Multiplication
No ratings yet
Matrix-Matrix Multiplication
8 pages
Bhagaban - Dynamic - Programming Intro - Matrix - Elemnts - Unit - II - 4
No ratings yet
Bhagaban - Dynamic - Programming Intro - Matrix - Elemnts - Unit - II - 4
37 pages
Matrix Chain Multiplication
No ratings yet
Matrix Chain Multiplication
4 pages
Exploring Matrix Applications in The Digital World Using C Programming
No ratings yet
Exploring Matrix Applications in The Digital World Using C Programming
19 pages
Final Report
No ratings yet
Final Report
3 pages
Unit 2 Basic Optimization Techniques For Serial Code
No ratings yet
Unit 2 Basic Optimization Techniques For Serial Code
31 pages
23 Code Optimization 06-03-2024
No ratings yet
23 Code Optimization 06-03-2024
21 pages
Strassen's Matrix Multiplication Algorithm: Problem Description
No ratings yet
Strassen's Matrix Multiplication Algorithm: Problem Description
5 pages
Matrix Chain Mult
No ratings yet
Matrix Chain Mult
11 pages
Sheet 2: Problem 1: Matrix Multiplication Using CREW PRAM
No ratings yet
Sheet 2: Problem 1: Matrix Multiplication Using CREW PRAM
3 pages
Matrix Algebra
No ratings yet
Matrix Algebra
25 pages
HPC Unit 5 B
No ratings yet
HPC Unit 5 B
31 pages
Matrix Chain Multiplication
No ratings yet
Matrix Chain Multiplication
13 pages
Sensors and Actuators B: Chemical: Mariajose Gonzalez-Guerrero, Frank A. Gomez T
No ratings yet
Sensors and Actuators B: Chemical: Mariajose Gonzalez-Guerrero, Frank A. Gomez T
8 pages
Fracture Analysis of A Total Hip Prosthesis Based On Reverse Engineering - Milena Babic - Ozren Veric
No ratings yet
Fracture Analysis of A Total Hip Prosthesis Based On Reverse Engineering - Milena Babic - Ozren Veric
11 pages
Robinhood Securities LLC: Tax Information Account 667446561
No ratings yet
Robinhood Securities LLC: Tax Information Account 667446561
6 pages
Engineering Survey
No ratings yet
Engineering Survey
8 pages
Microsoft Word - Secondary-Driving S 1
No ratings yet
Microsoft Word - Secondary-Driving S 1
9 pages
NJ Driver Exam for New Applicants
No ratings yet
NJ Driver Exam for New Applicants
9 pages
Test PDF
No ratings yet
Test PDF
1 page
Electricity Generation From Speed Breakers 2016
No ratings yet
Electricity Generation From Speed Breakers 2016
5 pages
Optimization of A Profile Extrusion Die For Flow Balance: Fibers and Polymers April 2014
No ratings yet
Optimization of A Profile Extrusion Die For Flow Balance: Fibers and Polymers April 2014
10 pages
Additive Manufacturing
No ratings yet
Additive Manufacturing
35 pages
Grade B+ Universities Name
No ratings yet
Grade B+ Universities Name
13 pages
CREO Lab Report For Mechanical Engineering
No ratings yet
CREO Lab Report For Mechanical Engineering
11 pages