CUDA Matrix Addition - 1D Memory, threads and blocks in 1D Matrix Addition in CUDA C using Texture a

Shanavas_P_S · November 26, 2011, 7:39am

#include<stdio.h>

#include<cutil_inline.h>

#define BLOCK_SIZE 128

texture<float,1>texVecA;

texture<float,1>texVecB;

__constant__ int ciMatSizeM;

__constant__ int ciMatSizeN;

__global__ static void AddKernel(float *d_Result)

{

	const int tid = blockDim.x * blockIdx.x + threadIdx.x;

	if(tid<(ciMatSizeM * ciMatSizeN))

	{

		float flValA = tex1Dfetch(texVecA,tid);

		float flValB = tex1Dfetch(texVecB,tid);

		d_Result[tid] = flValA + flValB;

	}

}

void printMatrix(float *pflMat, int iMatSizeM, int iMatSizeN)

{

	for(int idxM = 0; idxM < iMatSizeM; idxM++)

	{

		for(int idxN = 0; idxN < iMatSizeN; idxN++)

		{

			printf("%f\t",pflMat[(idxM * iMatSizeN) + idxN]);

		}

		printf("\n");

	}

	printf("\n");

}

int main()

{

	int iMatSizeM=0,iMatSizeN=0;

	printf("Enter size of Matrix(M*N):");

	scanf("%d %d",&iMatSizeM,&iMatSizeN);

	float *h_flMat1 = NULL, *h_flMat2 = NULL, *h_flMatSum = NULL;

	h_flMat1 = (float*)malloc(sizeof(float) * iMatSizeM * iMatSizeN);

	h_flMat2 = (float*)malloc(sizeof(float) * iMatSizeM * iMatSizeN);

	h_flMatSum = (float*)malloc(sizeof(float) * iMatSizeM * iMatSizeN);

	for(int j=0;j<(iMatSizeM*iMatSizeN);j++)

	{

		h_flMat1[j]=(float)rand()/(float)RAND_MAX;

		h_flMat2[j]=(float)rand()/(float)RAND_MAX;

	}

	printf("Matrix 1\n");

	printMatrix(h_flMat1, iMatSizeM, iMatSizeN);

	printf("Matrix 2\n");

	printMatrix(h_flMat2, iMatSizeM, iMatSizeN);

	float *d_flMat1 = NULL, *d_flMat2 = NULL, *d_flMatSum = NULL;

	cudaMalloc(&d_flMat1,iMatSizeM*iMatSizeN*sizeof(float));

	cudaMalloc(&d_flMat2,iMatSizeM*iMatSizeN*sizeof(float));

	cudaMalloc(&d_flMatSum,iMatSizeM*iMatSizeN*sizeof(float));

	cudaMemcpy(d_flMat1,h_flMat1,iMatSizeM * iMatSizeN * sizeof(float), cudaMemcpyHostToDevice);

	cudaMemcpy(d_flMat2,h_flMat2,iMatSizeM * iMatSizeN * sizeof(float), cudaMemcpyHostToDevice);

	cudaMemcpy(d_flMatSum,h_flMatSum,iMatSizeM * iMatSizeN * sizeof(float), cudaMemcpyHostToDevice);

	cudaMemcpyToSymbol(ciMatSizeM,&iMatSizeM,sizeof(float),0);

	cudaMemcpyToSymbol(ciMatSizeN,&iMatSizeN,sizeof(float),0);

	

	cudaBindTexture(0,texVecA,d_flMat1,(iMatSizeM * iMatSizeN * sizeof(float)));

	cudaBindTexture(0, texVecB, d_flMat2, (iMatSizeM * iMatSizeN * sizeof(float)));

	

	dim3 blocks(1,1,1);

	dim3 threads(BLOCK_SIZE,1,1);

	blocks.x=((iMatSizeM * iMatSizeN) / BLOCK_SIZE) + (((iMatSizeM * iMatSizeN) % BLOCK_SIZE) == 0 ? 0 : 1);

	AddKernel<<<blocks,threads>>>(d_flMatSum);

	cudaThreadSynchronize();

	cudaMemcpy(h_flMatSum,d_flMatSum,iMatSizeM * iMatSizeN * sizeof(float), cudaMemcpyDeviceToHost);

	cudaUnbindTexture(texVecA);

	cudaUnbindTexture(texVecB);

	

	cudaFree(d_flMat1);

	cudaFree(d_flMat2);

	cudaFree(d_flMatSum);

	printf("Matrix Sum\n");

	printMatrix(h_flMatSum, iMatSizeM, iMatSizeN);

}

pasoleatis · November 26, 2011, 11:01am

What is your question?

Topic		Replies	Views
CUDA Matrix Addition - 1D Memory, threads and blocks in 1D using global memory CUDA Programming and Performance	1	2662	November 27, 2011
CUDA Matrix Addition - 2D Memory, threads and blocks in 2D Matrix Addition in CUDA C using Texture a CUDA Programming and Performance	1	14747	November 27, 2011
CUDA Matrix Addition - 1D Memory, threads and blocks in 1D Matrix Addition in CUDA C using global m CUDA Programming and Performance	0	1097	November 26, 2011
Matrix Addition CUDA Programming and Performance	1	1187	June 14, 2012
basic matrix addition CUDA Programming and Performance	3	1929	March 9, 2012
Hello World Matrix Adder program Add two matrix ( used shared memory for optimum performance) CUDA Programming and Performance	3	3249	March 4, 2010
Matrix Addition CUDA Programming and Performance	2	2113	June 14, 2012
Matrix Addition Failing Simple matrix addition acting up... CUDA Programming and Performance	0	4002	July 16, 2010
I got the wrong result from matrix summation CUDA Programming and Performance	2	573	June 1, 2011
2matrix addition CUDA Programming and Performance	3	959	April 28, 2010

CUDA Matrix Addition - 1D Memory, threads and blocks in 1D Matrix Addition in CUDA C using Texture a

Related topics