728x90 프로그래밍 언어/CUDA - Examples1 [CUDA] 벡터 합 예제 해당 포스트에서는 CUDA를 이용하여 어떻게 벡터합을 계산하는지를 고려한다. 두 벡터의 합 1. Process (1) cudaMallc()을 호출하여 입력 배열 dev_a, dev_b, dev_c에 대한 공간을 각각 디바이스에 할당한다. (2) cudaMemcpy()를 사용하여 - cudaMemcpyHostToDevice: 입력데이터를 디바이스로 복사 - cudaMemcpyDeviceToHost: 결과데이터를 호스트로 복사 (3) 모두 사용한 Device의 메모리를 해제한다. 2. code #include #include "cuda_runtime.h" #define N 10 __global__ void add(int *a, int *b, int *c){ int tid = blockIdx.x; // Dev.. 2022. 4. 4. 이전 1 다음 728x90