
会员
强化学习:原理与Python实战
肖智清更新时间:2023-10-19 17:44:38
最新章节:封底开会员,本书免费读 >
本书从原理和实战两个方面介绍了强化学习。原理方面,深入介绍了主流强化学习理论和算法,覆盖资格迹等经典算法和MuZero等深度强化学习算法;实战方面,每章都配套了编程案例,以方便读者学习。全书从逻辑上分为三部分。第1章:从零开始介绍强化学习的背景知识,介绍环境库Gym的使用。第2~15章:基于折扣奖励离散时间Markov决策过程模型,介绍强化学习的主干理论和常见算法。采用数学语言推导强化学习的基础理论,进而在理论的基础上讲解算法,并为算法提供配套代码实现。基础理论的讲解突出主干部分,算法讲解全面覆盖主流的强化学习算法,包括经典的非深度强化学习算法和近年流行的强化学习算法。Python实现和算法讲解一一对应,还给出了深度强化学习算法的TensorFlow和PyTorch对照实现。第16章:介绍其他强化学习模型,包括平均奖励模型、连续时间模型、非齐次模型、半Markov模型、部分可观测模型等,以便更好了解强化学习研究的全貌。
品牌:机械工业出版社
上架时间:2023-08-01 00:00:00
出版社:机械工业出版社
本书数字版权由机械工业出版社提供,并由其授权上海阅文信息技术有限公司制作发行
强化学习:原理与Python实战最新章节
查看全部- 封底
- 作者简介
- 16.8 练习与模拟面试
- 16.7 本章小结
- 16.6 案例:老虎
- 16.5 部分可观测Markov决策过程
- 16.4 半Markov决策过程
- 16.3 非齐次Markov决策过程
- 16.2 连续时间Markov决策过程
- 16.1 平均奖励离散时间Markov决策过程
肖智清
主页
最新上架
- 会员
大模型应用开发:核心技术与领域实践
本书由科大讯飞与中国科大的大模型的资深专家联合撰写,一本书打通大模型的技术原理与应用实践壁垒,深入大模型3步工作流程,详解模型微调、对齐优化、提示工程等核心技术及不同场景的微调方案,全流程讲解6个典型场景的应用开发实践。本书共10章,从逻辑上分为“基础知识”“原理与技术”“应用开发实践”三部分。基础知识(第1章)介绍大模型定义、应用现状、存在的问题,以及发展趋势。原理与技术(第2和3章)详细讲解大计算机12.3万字 - 会员
ChatGPT:AIGC时代商业应用赋能
2023年以来,OpenAI相继发布了聊天机器人模型ChatGPT、新一代多模态大模型GPT-4等产品,以强大的能力俘获了大量用户,颠覆了用户对于AI的认知。本书以ChatGPT为中心,对ChatGPT的相关知识进行详细的讲解。本书共12章,前5章从ChatGPT概述、技术底座、内容变革、产业格局、商业展望5个方面对ChatGPT进行了解读,帮助用户全面了解ChatGPT,对其形成完整的认知。第6计算机12.8万字 - 会员
奇点到来:AIGC引爆增长新范式
增长是企业利用计算机、大数据、人工智能等新技术实现经营增长的新思路和新方法,本书作为该领域的入门级读物,介绍了AIGC在增长领域的技术和实战应用。本书分为4部分,第1部分、第2部分、第4部分主要针对有兴趣了解AIGC背后技术原理、增长模式的变化以及截至2023年3月业界、学术界的最新技术进展的读者;第3部分包含AI的基础知识、基础模型,并从实战应用角度介绍作为应用开发者如何高效上手与利用最新的开源计算机21.9万字 - 会员
AIGC:让生成式AI成为自己的外脑
《AIGC:让生成式AI成为自己的外脑》针对近期较为火热的AIGC技术及其相关话题,介绍AIGC的技术原理、专业知识和应用。全书共分为九章。第一章介绍AIGC技术的基本概念和发展历程;第二、三章介绍AIGC的基础技术栈和拓展技术栈;第四、五章分别讨论了AIGC技术在文本生成和图像生成两个领域的现状和前景;第六章列举了目前较为热门的AIGC技术应用;第七章描述了AIGC的上、中、下游产业链及未来前景计算机12.8万字 - 会员
文心一言:人人都能上手的AI工具
本书作为文心一言的学习指南,全面、细致地介绍了文心一言PC端和App的各项功能和使用方法,力求通过简洁明了的语言和图文并茂的形式,让读者快速掌握文心一言的各项功能。全书共8章,首先简单介绍了人工智能发展的几个阶段及文心一言的相关研发背景;随后介绍了文心一言的基础页面及功能等内容,以及文心一言在学习、工作、生活娱乐方面的应用及相关案例;接着介绍了文心一言的插件,以及文心一言App的功能和使用技巧;最计算机10.7万字 - 会员
机器学习教程(微课视频版)
本书兼顾机器学习基础、经典方法和深度学习方法,对组成机器学习的基础知识和基本算法进行了比较细致的介绍,对广泛应用的经典算法如线性回归、逻辑回归、朴素贝叶斯、支持向量机、决策树和集成学习等算法都给出了深入的分析并讨论了无监督学习的基本方法,对深度学习和强化学习进行了全面的叙述,比较深入地讨论了反向传播算法、多层感知机、CNN、RNN和LSTM等深度神经网络的核心知识和结构;对于强化学习,不仅介绍了经计算机20.6万字 - 会员
人工智能基础与应用
本书主要介绍了人工智能的基础知识和实用技术。本书共8章,包括“人工智能:开启智慧新时代”“Python:人工智能开发语言”“线性回归:预测未来趋势”“分门别类:帮你‘分而治之’”“物以类聚:发现新簇群”“个性化推荐:主动满足你的需求”“语音识别:让机器对你言听计从”“人脸识别:机器也认识你”。本书以培养学生人工智能素养、人工智能思维和人工智能基本应用能力为设计理念,在内容的选取和安排上符合学生的学计算机12.9万字 - 会员
基于信息增强的图神经网络学习方法研究
本书深入剖析了图神经网络领域所面临的两大核心挑战:深度加深模型退化和监督信息过度依赖。针对这两大挑战,本书提出了一系列解决思路,涵盖模型结构设计、训练策略优化等方面的内容。全书共7章,第1章主要介绍了图神经网络研究的背景与意义,阐述了近年来国内外网络表示学习与图神经网络的研究现状,分析了图神经网络当前面临的挑战及其主要问题等;第2章主要对图神经网络进行概要论述,包括基础的理论、典型的模型方法及应用计算机8.1万字 - 会员
当我点击时,算法在想什么?
我们生活在一个由算法构筑的世界:这些基于数据的算法不仅掌控着社会的运转、筛选着我们的网络见闻,还构成了自动驾驶、智能家居、前沿医疗、智慧城市乃至元宇宙发展的根本。它们是人类步入智能化新纪元的关键驱动力。随着我们对数字技术的依赖日益加深,数学家和数据研究者得以透过它们窥探我们的日常生活。他们通过收集我们的购物记录、消费倾向、兴趣爱好和旅行路径等数据,试图解码我们的日常行为模式。但是,这些数据驱动的分计算机15.2万字