世界冠军带你从零实践强化学习_哔哩哔哩_bilibili (original) (raw)

世界冠军带你从零实践强化学习

21.7万

2592

2020-07-11 07:55:30

未经作者授权,禁止转载

3872

3638

1.2万

百度NeurIPS全球顶会冠军团队亲自授课,5大核心算法讲解+5次实战,带你从零实践强化学习! 课程平台链接:https://aistudio.baidu.com/aistudio/course/introduce/1335 【主讲老师】科老师:飞桨强化学习PARL团队核心成员,百度高级研发工程师。所在团队曾两度夺得NeurIPS强化学习赛事冠军,并获得百度最高奖等荣誉。

百度

人工智能

编程

飞桨

深度学习

强化学习

PARL

飞桨PaddlePaddle 发消息

后厂村第一炼丹师<( ̄︶ ̄)>

关注 7.7万

这谁看了不迷糊啊,夸克好用的离谱! 写手一条城 4.3万 15

视频选集

(1/20)

自动连播

Lesson1-1-强化学习初印象、概念、应用

18:45

Lesson1-2-强化学习与监督学习区别、算法核心、分类、框架库与环境库

12:43

Lesson1-3-GYM实战、PARL介绍、总结、环境安装

14:59

Lesson2-1-MDP、Q表格

15:18

Lesson2-2-强化概念、TD更新、Sarsa引入

09:54

Lesson2-3-Sarsa算法介绍与代码解析

14:39

Lesson2-4-on_policy与off_policy对比、Q-learning解析

15:00

Lesson3-0-关于作业与Lesson2的补充说明

06:41

Lesson3-1-函数逼近与神经网络

13:37

Lesson3-2-DQN算法解析

15:21

Lesson3-3-PARLDQN代码解析

14:14

Lesson3-4-DQN训练展示、总结

11:19

Lesson4-1-随机策略与策略梯度

15:09

Lesson4-2-PolicyGradeint算法

13:54

Lesson4-3-PolicyGradient代码

14:35

Lesson4-4-总结、作业、公式推导

10:03

Lesson5-0-对Lesson4PPT的修正

03:51

Lesson5-1-连续动作空间与DDPG

14:01

Lesson5-2-DDPG代码与总结

15:34

Lesson5-3-四轴飞行器与创意赛

13:31

【强化学习的数学原理】课程:从零开始到透彻理解(完结)

西湖大学WindyLab

180.5万

1.8万

【大白话03】一文理清强化学习RL基本原理 | 原理图解+公式推导

吃花椒的麦

12.8万

226

强化学习纲要 第一课 概括与基础 上

周博磊

8.3万

309

2. 强化学习基础之马尔可夫决策过程

CV-xueba

4.4万

317

零基础学习强化学习算法:ppo

RethinkFun

26.1万

932

我竟然半天就学会了强化学习(PPO、Q-learning、DQN、A3C)算法原理及实战玩转超级马里奥

小北AI丶

6.0万

167

深度强化学习与多智能体强化学习 第一课

-xurunnan-

4.3万

55

课程13:编写强化学习环境

南方小鱼儿

3.7万

41

【学习小记】:一个小时从强化学习0基础到理解GRPO

NextTryTV

2.1万

5

强化学习第一节(RL基本概念+工具+基本算法)【个人知识分享】

二营长向强化学习开炮

3.0万

73

不愧是李宏毅老师讲的【强化学习】简直太详细!!!导师不教你的,李宏毅老师亲自教你,这还不赶紧学起来!!!-人工智能/强化算法/机器学习

有情的码农

30.3万

1615

强化学习从原理到实践 第1章 强化学习概述

蓝斯诺特

1.2万

4

【强化学习】超简单!一小时带你完全入门

PenicillinLP

27.4万

1407

PyTorch深度学习快速入门教程(绝对通俗易懂!)【小土堆】

我是土堆

816.0万

6.4万

(2025版)李宏毅强化学习系列课程全集,我愿称这个系列为天花板级别的课程!--人工智能/深度学习/强化学习

李宏毅深度学习课堂

4.7万

139

【全748集】字节大佬终于把 强化学习教程做成了动画片,2025最新版,适合所有零基础小白学习,学完即可就业!拿走不谢,学不会我退出IT圈!

智能体开发

4.4万

248

(2025版)李宏毅机器学习深度学习系列课程全集,公认体验感最好的入门课程!--人工智能/机器学习/深度学习

李宏毅深度学习课堂

94.8万

2063

强化学习基础 (本科生课程) 北京邮电大学 鲁鹏

CV-xueba

5.4万

182

[Agentic RL][01] 练习两天半,完全从零开始实现PPO算法(基于Qwen2.5-0.5B),不依赖第三方强化学习框架,从原理讲解到代码实现

偷星九月333

10.9万

158

更简单的强化学习,代码实战

蓝斯诺特

6.1万

50

展开

投稿志愿填报和大学专业相关内容,赢现金流量!

小窗

客服

顶部