Jetson Xavier NX 是 NVIDIA 推出的嵌入式 AI 计算平台,配备 Volta 架构 GPU(384 个 CUDA Core + 48 个 Tensor Core),支持 CUDA、cuDNN、TensorRT 等主流 AI 加速库,适用于边缘计算、无人机、机器人等场景。
nvcc -V
以下是一个简单的 CUDA Hello World 示例:
#include <stdio.h>
__global__ void hello_kernel() {
printf("Hello from CUDA thread %d!\n", threadIdx.x);
}
int main() {
hello_kernel<<<1, 8>>>();
cudaDeviceSynchronize();
return 0;
}
编译: nvcc hello_cuda.cu -o hello_cuda
运行: ./hello_cuda
__shared__)提高访问效率| 库名 | 功能 |
|---|---|
| cuBLAS | GPU 加速的 BLAS 数学库 |
| cuDNN | 深度学习加速 |
| TensorRT | 神经网络模型推理加速 |
| OpenCV-GPU | OpenCV with CUDA 支持 |
| NPP | 图像处理 CUDA 库 |
| 工具名称 | 功能 |
|---|---|
| Nsight Systems | 系统级分析(线程、内存、设备) |
| Nsight Compute | kernel 性能剖析 |
| tegrastats | Jetson 实时资源监控 |
sudo tegrastats
/usr/local/cuda/samples/sudo nvpmodel -m 0 # Max-N 性能模式
sudo jetson_clocks
如需进一步定制样例或项目框架,可联系我们进行个性化支持。