作者 |
[美]特雷弗·格兰特(Trevor Grant),[加]霍尔顿·卡劳(Holden Karau),[俄]鲍里斯·卢布林斯基(Boris Lublinsky),[美]理查德·刘(Richard Liu),[美]伊兰·菲洛年科(Ilan Filonenko) |
丛书名 |
O’Reilly精品图书系列 |
出版社 |
机械工业出版社 |
ISBN |
9787111699378 |
简要 |
简介 |
内容简介书籍计算机书籍 Kubeflow是基于K8S的机器学习工具包,是为数据科学家和数据工程师构建生产级别的机器学习实现而设计的。本书采用循序渐进的方式,从 Kubeflow 的安装、使用和设计开篇,随后从模型训练的整个周期展开,涵盖了数据探索、特征准备、模型训练/调优、模型服务、模型测试、模型监测和模型版本管理等各个环节,既有相关的理论知识也囊括了真实的使用案例,能够让读者在学习 Kubeflow 知识的同时全面了解机器学习的相关知识,是入门和深入学习Kubeflow以及机器学习的良好指南。 |
目录 |
序言 1 前言 3 第1章 Kubeflow及其适用对象 13 1.1 模型开发生命周期 13 1.2 Kubeflow 适合什么场景 14 1.3 为什么需要容器化 14 1.4 为什么需要 Kubernetes 15 1.5 Kubeflow的设计和核心组件 15 1.6 Kubeflow的替代方案 19 1.7 案例研究 21 1.8 总结 22 第2章 你好,Kubeflow 24 2.1 搭建Kubeflow 24 2.2 训练和部署模型 30 2.3 超越本地部署 34 2.4 总结 34 第3章 Kubeflow设计:超越基础 35 3.1 中央仪表盘 36 3.2 支持组件 43 3.3 总结 50 第4章 Kubeflow Pipeline 51 4.1 Pipeline入门 51 4.2 Kubeflow Pipeline组件介绍 60 4.3 Pipeline高级主题 68 4.4 总结 72 第5章 数据准备和特征准备 73 5.1 选择正确的工具 74 5.2 本地数据准备和特征准备 74 5.3 分布式工具 78 5.4 将其整合到一个Pipeline中 92 5.5 将整个notebook作为数据准备Pipeline阶段使用 94 5.6 总结 95 第6章 制品和元数据存储 96 6.1 Kubeflow ML Metadata 97 6.2 基于Kubeflow的MLflow元数据工具 102 6.3 总结 110 第7章 训练机器学习模型 111 7.1 用TensorFlow构建推荐器 111 7.2 部署TensorFlow训练作业 117 7.3 分布式训练 120 7.4 使用scikit-learn训练模型 125 7.5 总结 132 第8章 模型推断 133 8.1 模型服务 133 8.2 模型监控 136 8.3 模型更新 137 8.4 推理要求概述 138 8.5 Kubeflow中的模型推理 138 8.6 TensorFlow Serving 139 8.7 Seldon Core 143 8.8 KFServing 158 8.9 总结 174 第9章 多工具使用案例 175 9.1 CT扫描去噪示例 175 9.2 共享Pipeline 186 9.3 总结 186 第10章 超参调优和自动化机器学习 187 10.1 AutoML概述 187 10.2 使用Kubeflow Katib进行超参调优 188 10.3 Katib概念 189 10.4 安装Katib 191 10.5 运行第一个Katib实验 192 10.6 调优分布式训练作业 200 10.7 神经网络架构搜索 201 10.8 Katib的优势 204 10.9 总结 205 附录A Argo执行器配置和权衡 207 附录B 特定于云的工具和配置 208 附录C 在应用程序中使用模型服务 210 |