读薄《Professional CUDA C Programming》——CUDA执行模型

三、CUDA执行模型通过第二章的练习，已经了解了如何在网格和线程块中组织线程以获得最佳的性能。尽管可通过反复试验找到最佳的执行配置，但可能仍然会感到疑惑，为什么选择这样的执行配置会更好。你可能想知道是否有一些选择网格和块配置的准则。本章将回答这些问题，并从硬件方面深入介绍内核启动配置和性能分析的信息。 CUDA执行模型概述一般来说，执行模型会提供一个操作视图，说明如何在特定的计算...

Jul 1, 2020 2020-07-01T20:19:00+08:00 66 min

读薄《Professional CUDA C Programming》——CUDA编程模型

二、CUDA编程模型 CUDA编程模型概述 CUDA编程结构站在程序员的角度，可以从以下几个不同层面来看待并行计算：领域层(Domain level) 逻辑层(Logic level) 硬件层(Hardware level) 这三个层面对应了并行计算编程的不同阶段：算法设计阶段，最关心的应是在领域层如何解析数据和函数，以便在并行环境中能正确、高效地解决...

Jul 1, 2020 2020-07-01T20:19:00+08:00 15 min

读薄《Professional CUDA C Programming》——基于CUDA的异构并行编程

一、基于CUDA的异构并行编程并行计算并行计算的主要目标是提高计算速度。并行计算的软件和硬件层面是紧密联系的，传说中的软硬件协同。并行计算通常涉及两个不同的计算技术领域：计算机架构（硬件方面），关注的是在结构层次上支持并行性。并行程序设计（软件方面），关注的是充分使用架构的计算能力来并发地解决问题。并行性在并行算法的实现中，分析数据的相关性是最基本的内容，...

Jul 1, 2020 2020-07-01T20:19:00+08:00 10 min

GPU

Hanlding cuda error messages http://cuda-programming.blogspot.com/2013/01/handling-cuda-error-messages.html void cuda_safe(cudaError_t error, char* message) { if (error != cudaSuccess) { ...

Jul 1, 2020 2020-07-01T20:19:00+08:00 2 min

1
...
6
7
8
8 / 8

Recent Update

读薄《Professional CUDA C Programming》——CUDA执行模型

读薄《Professional CUDA C Programming》——CUDA编程模型

读薄《Professional CUDA C Programming》——基于CUDA的异构并行编程

GPU

Trending Tags