关注微信公众号查券更方便
大模型算法:强化学习、微调与对齐(全彩)详解强化学习 RLHF GRPO DPO SFT CoT DeepSeek蒸馏 微调与对齐 效果优化及其实践
大规模语言模型:从理论到实践(第2版)详解LLM 预训练 指令微调 SFT 强化学习MoE 多模态 智能体 RAG 大模型效率优化DeepSeek推理模型 评估
深度学习入门4:强化学习 DeepSeek强化学习算法基础(图灵出品)
深度学习入门全套:Python理论+框架+NLP+强化学习 京东套装4册(图灵出品) deepseek教程
动手学强化学习(上交大ACM班俞勇团队作品,chatgpt背后理论剖析)图灵奖得主John Hopcroft推荐的强化学习入门书 deepseek机器学习(异步图书出品)
深度强化学习 DeepSeek-R1强化学习算法基础 图解强化学习(图灵出品)
动手学机器学习 deepseek机器学习(异步图书出品) 图灵奖得主John Hopcroft推荐的强化学习入门书
强化学习(第2版)(博文视点出品) 2024年图灵奖得主作品 必知ChatGPT背后的技术,DeepSeek核心基础,强化学习领域奠基性经典著作!
Easy RL 强化学习教程(easyrl蘑菇书带你了解chatgpt背后的技术) deepseek机器学习(异步图书出品)
动手学系列:深度学习PyTorch+强化学习+机器学习 京东套装3册(异步图书出品) deepseek教程
动手学自然语言处理 deepseek 自然语言(异步图书出品) 图灵奖得主John Hopcroft推荐的强化学习入门书
【正版包邮】机器学习方法 第2版(1-4) 4册 清华大学出版社 李航 著 无监督学习 监督学习 深度学习 强化学习
强化学习与随机优化
控制系统与强化学习
多智能体强化学习:基础与现代方法
深度强化学习实战(异步图书出品) deepseek教程
强化学习与随机优化:序贯决策的通用框架
概率机器学习 基础篇 概率机器学习 强化学习 概率模型 决策理论 信息论 优化理论
机器学习公式详解+ChatGPT原理与应用开发+Easy RL强化学习教程(全3册) deepseek教程
强化学习:基础·理论·前沿
深度强化学习图解deepseek教程
深度强化学习控制:前沿理论与方法
强化学习:原理与Python实战 deepseek教程
扩散模型——核心原理与强化学习优化 强化学习 生成模型 人工智能 轨迹优化 价值函数 多任务泛化 异步图书出品
深度强化学习算法原理与实战:基于MATLAB
人工智能系列:多智能体协同+领会人工智能+深度强化学习+人工智能(全4册)强化学习方法 人工智能 deepseek教程
Datawhale全4册:深度学习详解+机器学习公式详解+强化学习教程+ChatGPT原理与应用开发 deepseek教程
京选阅读 全新强化学习 第二版 强化学习 AI人工智能参考书 经典导论性教材机器 强化学习第二版
大模型算法:强化学习、微调与对齐
深度学习实战:基于 TensorFlow 2.X 的计算机视觉开发应用 DeepSeek聊天机器人动手学python深度学习人工智能机器学习强化学习神经网络linux入门书籍教材智能风控