#pragma unroll, __restrict__
#pragma unroll는 CUDA C++에서 반복문 루프 언롤링(loop unrolling)을 지시하는 컴파일러 지시문입니다. 이 지시문을 사용하면 컴파일러는 지정된 반복문을 자동으로 풀어서 언롤된 버전을 생성합니다. 이렇게 하면 반복문의 각 반복이 개별적으로 실행되어 실행 성능이 향상될 수 있습니다.주요 이점:성능 최적화:루프 언롤링을 통해 루프 오버헤드를 줄이고, 명령어 병렬성을 높여 성능을 개선할 수 있습니다.메모리 접근 최적화:연속적인 메모리 접근 패턴을 보장하여 캐시 효율성을 높일 수 있습니다. __restrict__ 키워드는 C와 C++에서 사용되는 제한자(restrict qualifier)입니다. CUDA에서도 같은 용도로 사용되며, 특정 포인터가 가리키는 메모리 영역이 겹치지 않음을 컴..
2024.07.02