no image
AT_DISPATCH_FLOATING_TYPES, AT_ASSERTM
AT_DISPATCH_FLOATING_TYPES 매크로는 Pc 텐서의 데이터 타입에 따라 적절한 scalar_t 타입을 선택하고, 그 타입을 사용하여 dist_kernel4 커널을 호출합니다. 매크로의 첫 번째 인자는 텐서의 타입이고, 두 번째 인자는 디스패치 이름(주로 디버깅 용도), 세 번째 인자는 람다 함수입니다.
2024.07.02
#pragma unroll, __restrict__
#pragma unroll는 CUDA C++에서 반복문 루프 언롤링(loop unrolling)을 지시하는 컴파일러 지시문입니다. 이 지시문을 사용하면 컴파일러는 지정된 반복문을 자동으로 풀어서 언롤된 버전을 생성합니다. 이렇게 하면 반복문의 각 반복이 개별적으로 실행되어 실행 성능이 향상될 수 있습니다.주요 이점:성능 최적화:루프 언롤링을 통해 루프 오버헤드를 줄이고, 명령어 병렬성을 높여 성능을 개선할 수 있습니다.메모리 접근 최적화:연속적인 메모리 접근 패턴을 보장하여 캐시 효율성을 높일 수 있습니다. __restrict__ 키워드는 C와 C++에서 사용되는 제한자(restrict qualifier)입니다. CUDA에서도 같은 용도로 사용되며, 특정 포인터가 가리키는 메모리 영역이 겹치지 않음을 컴..
2024.07.02
DCNv2 CUDA 11.8 compatibility issue
https://github.com/lucasjinreal/DCNv2_latest GitHub - lucasjinreal/DCNv2_latest: DCNv2 supports decent pytorch such as torch 1.5+ (now 1.8+)DCNv2 supports decent pytorch such as torch 1.5+ (now 1.8+) - lucasjinreal/DCNv2_latestgithub.com
2024.07.01
no image
RuntimeError: DataLoader worker (pid 144028) is killed by signal: Bus error. It is possible that dataloader's workers are out of shared memory. Please try to raise your shared memory limit.
Docker 내 공유메모리 공간이 부족해서 난 에러다. 아래는 컨테이너를 실행할 때 공유 메모리 크기를 1GB로 설정하는 예시입니다:docker run --shm-size=1g -it /bin/bash
2024.06.28
no image
ImportError: /lib/aarch64-linux-gnu/libstdc++.so.6: version `GLIBCXX_3.4.29' not found
https://github.com/pybind/pybind11/discussions/3453 libstdc++.so.6: version `GLIBCXX_3.4.29' not found · pybind pybind11 · Discussion #3453I run this in pybind11 mkdir build cd build cmake .. make check -j 4 got ERROR: ...... Traceback (most recent call last): File "/home/shizuku/code/python/pybind11/tests/test_cmake_build/subdirector...github.com
2024.06.27
Terabee ToF sensor 값 읽기
https://github.com/Terabee TerabeeWe digitze movement. Terabee has 36 repositories available. Follow their code on GitHub.github.com 여기 SDK랑 다 있네요,, Python, C/C++ 다 됩니다  하하하하하하 괜히 16진수 값 분석하고 있었네요 하하하
2024.05.13
공유기에 잡히는 Ip 전부 확인하기
nmap -sP 192.168.0.1/24
2024.05.10
TensorRT Jetson
Jetson Dockerfile에서 TensorRT 라이브러리 경로는 /usr/include/aarch64-linux-gnu/ 안에 있음Ubuntu에 있는 것처럼 따로 TensorRT 경로 지정해줄필요 없음
2024.05.10
16진수 표현
ToF센서에서 16진수로 표현안되고 저렇게 받아와지는게 있는데 { ASCII코드로 표현되는건 저렇게 바뀜받은 데이터: b'(\xd5{T\n'
2024.05.10