no image
머신비젼 사례
https://www.youtube.com/watch?v=jwWJW5uTG6Y surface normal 으로도 볼 수 있겠구만!https://www.tomomi-research.com/en/foresight-stereo_en
2024.09.05
no image
H100 vs RTX4090
https://www.reddit.com/r/LocalLLaMA/comments/188boew/multiple_4090s_instead_of_h100/ From the LocalLLaMA community on RedditExplore this post and more from the LocalLLaMA communitywww.reddit.com https://bizon-tech.com/gpu-benchmarks/NVIDIA-H100-(SXM5)-vs-NVIDIA-RTX-4090/633vs637 NVIDIA H100 (SXM5) vs. NVIDIA RTX 4090| GPU Benchmarks for AI/ML, deep learning 2024 | BIZONIn this article, we are co..
2024.08.26
H100 vs RTX4090
https://www.reddit.com/r/LocalLLaMA/comments/188boew/multiple_4090s_instead_of_h100/ From the LocalLLaMA community on RedditExplore this post and more from the LocalLLaMA communitywww.reddit.com 내 조건에선 4090 승!
2024.08.26
no image
vscode CMake Debug
CMake 파일 디버깅 main file debuging  인자 집어넣기 .vscode/settings.json{ "files.associations": { "string": "cpp", "ostream": "cpp" }, "cmake.debugConfig": { "args": [ "0", "0" ] } }
2024.07.10
no image
AT_DISPATCH_FLOATING_TYPES, AT_ASSERTM
AT_DISPATCH_FLOATING_TYPES 매크로는 Pc 텐서의 데이터 타입에 따라 적절한 scalar_t 타입을 선택하고, 그 타입을 사용하여 dist_kernel4 커널을 호출합니다. 매크로의 첫 번째 인자는 텐서의 타입이고, 두 번째 인자는 디스패치 이름(주로 디버깅 용도), 세 번째 인자는 람다 함수입니다.
2024.07.02
#pragma unroll, __restrict__
#pragma unroll는 CUDA C++에서 반복문 루프 언롤링(loop unrolling)을 지시하는 컴파일러 지시문입니다. 이 지시문을 사용하면 컴파일러는 지정된 반복문을 자동으로 풀어서 언롤된 버전을 생성합니다. 이렇게 하면 반복문의 각 반복이 개별적으로 실행되어 실행 성능이 향상될 수 있습니다.주요 이점:성능 최적화:루프 언롤링을 통해 루프 오버헤드를 줄이고, 명령어 병렬성을 높여 성능을 개선할 수 있습니다.메모리 접근 최적화:연속적인 메모리 접근 패턴을 보장하여 캐시 효율성을 높일 수 있습니다. __restrict__ 키워드는 C와 C++에서 사용되는 제한자(restrict qualifier)입니다. CUDA에서도 같은 용도로 사용되며, 특정 포인터가 가리키는 메모리 영역이 겹치지 않음을 컴..
2024.07.02
DCNv2 CUDA 11.8 compatibility issue
https://github.com/lucasjinreal/DCNv2_latest GitHub - lucasjinreal/DCNv2_latest: DCNv2 supports decent pytorch such as torch 1.5+ (now 1.8+)DCNv2 supports decent pytorch such as torch 1.5+ (now 1.8+) - lucasjinreal/DCNv2_latestgithub.com
2024.07.01
no image
RuntimeError: DataLoader worker (pid 144028) is killed by signal: Bus error. It is possible that dataloader's workers are out of shared memory. Please try to raise your shared memory limit.
Docker 내 공유메모리 공간이 부족해서 난 에러다. 아래는 컨테이너를 실행할 때 공유 메모리 크기를 1GB로 설정하는 예시입니다:docker run --shm-size=1g -it /bin/bash
2024.06.28
no image
ImportError: /lib/aarch64-linux-gnu/libstdc++.so.6: version `GLIBCXX_3.4.29' not found
https://github.com/pybind/pybind11/discussions/3453 libstdc++.so.6: version `GLIBCXX_3.4.29' not found · pybind pybind11 · Discussion #3453I run this in pybind11 mkdir build cd build cmake .. make check -j 4 got ERROR: ...... Traceback (most recent call last): File "/home/shizuku/code/python/pybind11/tests/test_cmake_build/subdirector...github.com
2024.06.27