世界冠军带你从零实践强化学习_哔哩哔哩_bilibili (original) (raw)

世界冠军带你从零实践强化学习

21.7万

2592

2020-07-11 07:55:30

未经作者授权，禁止转载

3872

3638

1.2万

百度NeurIPS全球顶会冠军团队亲自授课，5大核心算法讲解+5次实战，带你从零实践强化学习！课程平台链接：https://aistudio.baidu.com/aistudio/course/introduce/1335 【主讲老师】科老师：飞桨强化学习PARL团队核心成员，百度高级研发工程师。所在团队曾两度夺得NeurIPS强化学习赛事冠军，并获得百度最高奖等荣誉。

飞桨PaddlePaddle 发消息

后厂村第一炼丹师<(￣︶￣)>

关注 7.7万

这谁看了不迷糊啊，夸克好用的离谱! 写手一条城 4.3万 15

视频选集

（1/20）

自动连播

Lesson1-1-强化学习初印象、概念、应用

18:45

Lesson1-2-强化学习与监督学习区别、算法核心、分类、框架库与环境库

12:43

Lesson1-3-GYM实战、PARL介绍、总结、环境安装

14:59

Lesson2-1-MDP、Q表格

15:18

Lesson2-2-强化概念、TD更新、Sarsa引入

09:54

Lesson2-3-Sarsa算法介绍与代码解析

14:39

Lesson2-4-on_policy与off_policy对比、Q-learning解析

15:00

Lesson3-0-关于作业与Lesson2的补充说明

06:41

Lesson3-1-函数逼近与神经网络

13:37

Lesson3-2-DQN算法解析

15:21

Lesson3-3-PARLDQN代码解析

14:14

Lesson3-4-DQN训练展示、总结

11:19

Lesson4-1-随机策略与策略梯度

15:09

Lesson4-2-PolicyGradeint算法

13:54

Lesson4-3-PolicyGradient代码

14:35

Lesson4-4-总结、作业、公式推导

10:03

Lesson5-0-对Lesson4PPT的修正

03:51

Lesson5-1-连续动作空间与DDPG

14:01

Lesson5-2-DDPG代码与总结

15:34

Lesson5-3-四轴飞行器与创意赛

13:31

【强化学习的数学原理】课程：从零开始到透彻理解（完结）

西湖大学WindyLab

180.5万

1.8万

【大白话03】一文理清强化学习RL基本原理 | 原理图解+公式推导

吃花椒的麦

12.8万

226

强化学习纲要第一课概括与基础上

8.3万

309

2. 强化学习基础之马尔可夫决策过程

4.4万

317

零基础学习强化学习算法：ppo

26.1万

932

我竟然半天就学会了强化学习（PPO、Q-learning、DQN、A3C）算法原理及实战玩转超级马里奥

6.0万

167

深度强化学习与多智能体强化学习第一课

4.3万

55

课程13：编写强化学习环境

南方小鱼儿

3.7万

41

【学习小记】：一个小时从强化学习0基础到理解GRPO

2.1万

5

强化学习第一节（RL基本概念+工具+基本算法）【个人知识分享】

二营长向强化学习开炮

3.0万

73

不愧是李宏毅老师讲的【强化学习】简直太详细！！！导师不教你的，李宏毅老师亲自教你，这还不赶紧学起来！！！-人工智能/强化算法/机器学习

有情的码农

30.3万

1615

强化学习从原理到实践第1章强化学习概述

1.2万

4

【强化学习】超简单！一小时带你完全入门

27.4万

1407

PyTorch深度学习快速入门教程（绝对通俗易懂！）【小土堆】

816.0万

6.4万

(2025版)李宏毅强化学习系列课程全集，我愿称这个系列为天花板级别的课程！--人工智能/深度学习/强化学习

李宏毅深度学习课堂

4.7万

139

【全748集】字节大佬终于把强化学习教程做成了动画片，2025最新版，适合所有零基础小白学习，学完即可就业！拿走不谢，学不会我退出IT圈！

智能体开发

4.4万

248

（2025版）李宏毅机器学习深度学习系列课程全集，公认体验感最好的入门课程！--人工智能/机器学习/深度学习

李宏毅深度学习课堂

94.8万

2063

强化学习基础（本科生课程）北京邮电大学鲁鹏

5.4万

182

[Agentic RL][01] 练习两天半，完全从零开始实现PPO算法（基于Qwen2.5-0.5B），不依赖第三方强化学习框架，从原理讲解到代码实现

偷星九月333

10.9万

158

更简单的强化学习,代码实战

6.1万

50

展开

投稿志愿填报和大学专业相关内容，赢现金流量！

小窗

顶部