作者 |
[美] 丹尼尔·卡斯沃姆(Daniel Kusswurm) |
丛书名 |
计算机科学丛书 |
出版社 |
机械工业出版社 |
ISBN |
9787111686088 |
简要 |
简介 |
内容简介书籍计算机书籍 本书全面更新至x86-64,主要面向软件开发人员,旨在通过实用的案例帮助读者快速理解x86-64汇编语言程序设计的概念并掌握编程方法。书中首先介绍x86-64平台,包括Core体系结构、数据类型、寄存器、内存寻址模式和基本指令集等;然后讨论AVX、AVX2和AVX-512,包括寄存器集、指令集和增强功能等,并利用这些指令集编写性能增强函数和算法;zui后讨论提高程序性能的编码策略及技巧。此外,书中包含大量可免费下载的源代码,便于读者实践。 |
目录 |
出版者的话 译者序 前言 关于作者 关于技术评审专家 第1章 x86-64 Core体系结构 1 1.1 历史回顾 1 1.2 数据类型 3 1.2.1 基本数据类型 3 1.2.2 数值数据类型 3 1.2.3 SIMD数据类型 4 1.2.4 其他数据类型 5 1.3 内部体系结构 5 1.3.1 通用寄存器 6 1.3.2 RFLAGS寄存器 7 1.3.3 指令指针 8 1.3.4 指令操作数 9 1.3.5 内存寻址 10 1.4 x86-64与x86-32编程的区别 11 1.4.1 无效指令 12 1.4.2 不推荐的指令 13 1.5 指令集概述 13 1.6 本章小结 15 第2章 x86-64 Core程序设计:第1部分 17 2.1 简单的整数算术运算 17 2.1.1 加法和减法 18 2.1.2 逻辑运算 20 2.1.3 移位运算 22 2.2 高级整数算术运算 25 2.2.1 乘法和除法 25 2.2.2 使用混合类型的运算 28 2.3 内存寻址和条件代码 33 2.3.1 内存寻址模式 33 2.3.2 条件代码 37 2.4 本章小结 40 第3章 x86-64 Core程序设计:第2部分 42 3.1 数组 42 3.1.1 一维数组 42 3.1.2 二维数组 48 3.2 结构 56 3.3 字符串 58 3.3.1 字符计数 58 3.3.2 字符串拼接 61 3.3.3 比较数组 65 3.3.4 数组反转 68 3.4 本章小结 71 第4章 AVX指令集 72 4.1 AVX概述 72 4.2 SIMD编程概念 73 4.3 环绕与饱和算术运算 74 4.4 AVX执行环境 75 4.4.1 寄存器集 75 4.4.2 数据类型 76 4.4.3 指令语法 76 4.5 AVX标量浮点数 77 4.5.1 浮点数编程概念 78 4.5.2 标量浮点寄存器集 80 4.5.3 控制状态寄存器 80 4.5.4 指令集概述 81 4.6 AVX打包浮点值 82 4.7 AVX打包整数 85 4.8 x86-AVX和x86-SSE之间的区别 87 4.9 本章小结 88 第5章 AVX程序设计:标量浮点数 90 5.1 标量浮点算术运算 90 5.1.1 单精度浮点数运算 90 5.1.2 双精度浮点数运算 93 5.2 标量浮点值的比较和转换 97 5.2.1 浮点值比较 97 5.2.2 浮点值转换 106 5.3 标量浮点数组和矩阵 111 5.3.1 浮点数组 111 5.3.2 浮点矩阵 114 5.4 调用约定 118 5.4.1 基本堆栈帧 118 5.4.2 使用非易失性通用寄存器 122 5.4.3 使用非易失性XMM寄存器 126 5.4.4 函数序言和函数结语的宏 131 5.5 本章小结 136 第6章 AVX程序设计:打包浮点数 137 6.1 打包浮点算术运算 137 6.2 打包浮点值比较 142 6.3 打包浮点值转换 146 6.4 打包浮点数组 150 6.4.1 打包浮点平方根 150 6.4.2 打包浮点数组的最小值和最大值 154 6.4.3 打包浮点最小二乘法 158 6.5 打包浮点矩阵 163 6.5.1 矩阵转置 163 6.5.2 矩阵乘法 170 6.6 本章小结 175 第7章 AVX程序设计:打包整数 176 7.1 打包整数加法和减法运算 176 7.2 打包整数移位 181 7.3 打包整数乘法 184 7.4 打包整数图像处理 189 7.4.1 像素的最小值和最大值 189 7.4.2 像素平均强度 196 7.4.3 像素转换 200 7.4.4 图像直方图 206 7.4.5 图像阈值化 213 7.5 本章小结 223 第8章 AVX2 224 8.1 AVX2执行环境 224 8.2 AVX2打包浮点数 224 8.3 AVX2打包整数 226 8.4 x86指令集扩展 226 8.4.1 半精度浮点数 227 8.4.2 乘法加法融合 227 8.4.3 通用寄存器指令集扩展 228 8.5 本章小结 229 第9章 AVX2程序设计:打包浮点数 230 9.1 打包浮点算术运算 230 9.2 打包浮点数组 236 9.2.1 简单计算 236 9.2.2 列均值 241 9.2.3 相关系数 246 9.3 矩阵乘法和转置 252 9.4 矩阵求逆 258 9.5 混合和排列指令 269 9.6 数据收集指令 273 9.7 本章小结 279 第10章 AVX2程序设计:打包整数 280 10.1 打包整数基础 280 10.1.1 基本算术运算 280 10.1.2 打包和解包 284 10.1.3 大小提升 289 10.2 打包整数图像处理 293 10.2.1 像素剪裁 293 10.2.2 RGB像素的最小值和最大值 298 10.2.3 RGB图像到灰度图像的转换 304 10.3 本章小结 310 第11章 AVX2程序设计:扩展指令集 312 11.1 FMA程序设计 312 11.1.1 卷积 312 11.1.2 标量FMA 314 11.1.3 打包FMA 322 11.2 通用寄存器指令 329 11.2.1 不影响标志位的乘法和移位 329 11.2.2 增强型位操作 333 11.3 半精度浮点转换 336 11.4 本章小结 339 第12章 AVX-512 340 12.1 AVX-512概述 340 12.2 AVX-512执行环境 341 12.2.1 寄存器集 341 12.2.2 数据类型 342 12.2.3 指令语法 342 12.3 指令集概述 345 12.3.1 AVX512F 345 12.3.2 AVX512CD 346 12.3.3 AVX512BW 347 12.3.4 AVX512DQ 347 12.3.5 操作掩码寄存器 348 12.4 本章小结 348 第13章 AVX-512程序设计:浮点数 349 13.1 标量浮点数 349 13.1.1 合并屏蔽 349 13.1.2 零屏蔽 352 13.1.3 指令级舍入 355 13.2 打包浮点数 358 13.2.1 打包浮点数算术运算 358 13.2.2 打包浮点值比较 365 13.2.3 打包浮点列均值 369 13.2.4 向量叉积 376 13.2.5 矩阵向量乘法 384 13.2.6 卷积 392 13.3 本章小结 395 第14章 AVX-512程序设计:打包整数 396 14.1 基本算术运算 396 14.2 图像处理 400 14.2.1 像素转换 401 14.2.2 图像阈值化 406 14.2.3 图像统计 411 14.2.4 RGB到灰度的转换 420 14.3 本章小结 426 第15章 优化策略和技术 427 15.1 处理器微体系结构 427 15.1.1 处理器体系结构概述 427 15.1.2 微体系结构流水线功能 428 15.1.3 执行引擎 430 15.2 优化汇编语言代码 431 15.2.1 基本技术 432 15.2.2 浮点算术运算 433 15.2.3 程序分支 433 15.2.4 数据对齐 435 15.2.5 SIMD技术 435 15.3 本章小结 436 第16章 高级程序设计 437 16.1 CPUID指令 437 16.2 非时态内存存储 450 16.3 数据预获取 454 16.4 多线程 461 16.5 本章小结 471 附录A 472 |