世界冠军带你从零实践强化学习_哔哩哔哩_bilibili (original) (raw)
世界冠军带你从零实践强化学习
21.7万
2592
2020-07-11 07:55:30
未经作者授权,禁止转载
3872
3638
1.2万
百度NeurIPS全球顶会冠军团队亲自授课,5大核心算法讲解+5次实战,带你从零实践强化学习! 课程平台链接:https://aistudio.baidu.com/aistudio/course/introduce/1335 【主讲老师】科老师:飞桨强化学习PARL团队核心成员,百度高级研发工程师。所在团队曾两度夺得NeurIPS强化学习赛事冠军,并获得百度最高奖等荣誉。
后厂村第一炼丹师<( ̄︶ ̄)>
关注 7.7万
这谁看了不迷糊啊,夸克好用的离谱! 写手一条城 4.3万 15
视频选集
(1/20)
自动连播
Lesson1-1-强化学习初印象、概念、应用
18:45
Lesson1-2-强化学习与监督学习区别、算法核心、分类、框架库与环境库
12:43
Lesson1-3-GYM实战、PARL介绍、总结、环境安装
14:59
Lesson2-1-MDP、Q表格
15:18
Lesson2-2-强化概念、TD更新、Sarsa引入
09:54
Lesson2-3-Sarsa算法介绍与代码解析
14:39
Lesson2-4-on_policy与off_policy对比、Q-learning解析
15:00
Lesson3-0-关于作业与Lesson2的补充说明
06:41
Lesson3-1-函数逼近与神经网络
13:37
Lesson3-2-DQN算法解析
15:21
Lesson3-3-PARLDQN代码解析
14:14
Lesson3-4-DQN训练展示、总结
11:19
Lesson4-1-随机策略与策略梯度
15:09
Lesson4-2-PolicyGradeint算法
13:54
Lesson4-3-PolicyGradient代码
14:35
Lesson4-4-总结、作业、公式推导
10:03
Lesson5-0-对Lesson4PPT的修正
03:51
Lesson5-1-连续动作空间与DDPG
14:01
Lesson5-2-DDPG代码与总结
15:34
Lesson5-3-四轴飞行器与创意赛
13:31
180.5万
1.8万
【大白话03】一文理清强化学习RL基本原理 | 原理图解+公式推导
12.8万
226
8.3万
309
4.4万
317
26.1万
932
我竟然半天就学会了强化学习(PPO、Q-learning、DQN、A3C)算法原理及实战玩转超级马里奥
6.0万
167
4.3万
55
3.7万
41
2.1万
5
强化学习第一节(RL基本概念+工具+基本算法)【个人知识分享】
3.0万
73
不愧是李宏毅老师讲的【强化学习】简直太详细!!!导师不教你的,李宏毅老师亲自教你,这还不赶紧学起来!!!-人工智能/强化算法/机器学习
30.3万
1615
1.2万
4
27.4万
1407
PyTorch深度学习快速入门教程(绝对通俗易懂!)【小土堆】
816.0万
6.4万
(2025版)李宏毅强化学习系列课程全集,我愿称这个系列为天花板级别的课程!--人工智能/深度学习/强化学习
4.7万
139
【全748集】字节大佬终于把 强化学习教程做成了动画片,2025最新版,适合所有零基础小白学习,学完即可就业!拿走不谢,学不会我退出IT圈!
4.4万
248
(2025版)李宏毅机器学习深度学习系列课程全集,公认体验感最好的入门课程!--人工智能/机器学习/深度学习
94.8万
2063
5.4万
182
[Agentic RL][01] 练习两天半,完全从零开始实现PPO算法(基于Qwen2.5-0.5B),不依赖第三方强化学习框架,从原理讲解到代码实现
10.9万
158
6.1万
50
展开
小窗
顶部