商品名称:包邮 CUDA C编程全新指南 如何使用GPU技术 CUDAC语言编程教程 CUDA概念编程技术 高性能计算技术丛书 计算机书籍
商品销量:
收藏数量:
店铺名称: 山东书虫图书专营店
旺旺: 山东书虫图书专营店
公司名称:
行业: 书籍音像/
地址: 山东省济南市
店铺名称:山东书虫图书专营店
CUDA C编程权wei指南 | \||
\ | 定价 | \99.00 | \
出版社 | \机械工业出版社 | \|
版次 | \1 | \|
出版时间 | \2017年6月 | \|
开本 | \16开 | \|
作者 | \程润伟 | \|
装帧 | \平装 | \|
页数 | \\ | |
字数 | \\ | |
ISBN编码 | \9787111565475 | \|
重量 | \\ |
译者序
\推荐序
\自序
\作者简介
\技术审校者简介
\前言
\致谢
\第1章 基于CUDA的异构并行计算1
\1.1 并行计算1
\1.1.1 串行编程和并行编程2
\1.1.2 并行性3
\1.1.3 计算机架构4
\1.2 异构计算6
\1.2.1 异构架构7
\1.2.2 异构计算范例9
\1.2.3 CUDA:一种异构计算平台10
\1.3 用GPU输出Hello World12
\1.4 使用CUDA C编程难吗15
\1.5 总结16
\1.6 习题16
\第2章 CUDA编程模型18
\2.1 CUDA编程模型概述18
\2.1.1 CUDA编程结构19
\2.1.2 内存管理20
\2.1.3 线程管理24
\2.1.4 启动一个CUDA核函数29
\2.1.5 编写核函数30
\2.1.6 验证核函数31
\2.1.7 处理错误32
\2.1.8 编译和执行32
\2.2 给核函数计时35
\2.2.1 用CPU计时器计时35
\2.2.2 用nvprof工具计时39
\2.3 组织并行线程40
\2.3.1 使用块和线程建立矩阵索引40
\2.3.2 使用二维网格和二维块对矩阵求和44
\2.3.3 使用一维网格和一维块对矩阵求和47
\2.3.4 使用二维网格和一维块对矩阵求和48
\2.4 设备管理50
\2.4.1 使用运行时API查询GPU信息50
\2.4.2 确定zui优GPU53
\2.4.3 使用nvidia-smi查询GPU信息53
\2.4.4 在运行时设置设备54
\2.5 总结54
\2.6 习题55
\第3章 CUDA执行模型56
\3.1 CUDA执行模型概述56
\3.1.1 GPU架构概述57
\3.1.2 Fermi架构59
\3.1.3 Kepler架构61
\3.1.4 配置文件驱动优化65
\3.2 理解线程束执行的本质67
\3.2.1 线程束和线程块67
\3.2.2 线程束分化69
\3.2.3 资源分配74
\3.2.4 延迟隐藏76
\3.2.5 占用率78
\3.2.6 同步81
\3.2.7 可扩展性82
\3.3 并行性的表现83
\3.3.1 用nvprof检测活跃的线程束84
\3.3.2 用nvprof检测内存操作85
\3.3.3 增大并行性86
\3.4 避免分支分化88
\3.4.1 并行归约问题88
\3.4.2 并行归约中的分化89
\3.4.3 改善并行归约的分化93
\3.4.4 交错配对的归约95
\3.5 展开循环97
\3.5.1 展开的归约97
\3.5.2 展开线程的归约99
\3.5.3 完全展开的归约101
\本书主要介绍了如何使用GPU和利用CUDAC语言对其进行编程的。首先从基本的CUDA概念及结构讲起,一步一步地引导读者进入CUDA的内部世界,由浅入深地介绍了其编程要求及其内部架构,使读者对其有了整体印象后,逐步深入了解其内部机能,后介绍了GPU的一些专用函数和注意事项。
\ \辽宁盘锦 ID539640 :
灵芝孢子粉哪里的产地比较好破壁灵芝孢子粉多少一斤
评论时间:2024年05月04日
西藏林芝 ID650895 :
灵芝孢子粉的副作用孢子粉的副作用
评论时间:2024年05月04日
四川阿坝 ID275210 :
灵芝孢子粉用多少度水冲三萜
评论时间:2024年05月04日
免除您出门送修、自行检测等麻烦,为您提供轻松、高效、无忧的保障。
Q:自提点可以保留货物几天??
A:货物到达自提点后可以保留三个工作日。
对于到家服务范围内的商品,不代表该商品同时符合保内条件。