用ChatGPT和强化学习玩转《我的世界》,Plan4MC攻克24个复杂任务在开放式的环境中学习多种任务是通用智能体的重要能力。《我的世界》(Minecraft)作为一款受欢迎的开放...人工智能# 强化学习1年前1150
清北联合出品!一篇Survey整明白「Transformer+强化学习」的来龙去脉Transformer模型自发布后,很快就成了自然语言处理和计算机视觉领域在有监督学习设置下的主流神经架构。...人工智能# 强化学习1年前300
西山居AI技术专家黄鸿波:游戏中强化学习与行为树融合实战2022年8月6日-7日,AISummit 全球人工智能技术大会如期举办。在7日下午举办的《人工智能前沿探索》...人工智能# 强化学习1年前280
从Transformer到扩散模型,一文了解基于序列建模的强化学习方法大规模生成模型在近两年为自然语言处理甚至计算机视觉带来的巨大的突破。最近这股风潮也影响到了强化学...人工智能# 强化学习1年前270
训练提速17%,第四范式开源强化学习研究框架,支持单、多智能体训练OpenRL 是由第四范式强化学习团队开发的基于 PyTorch 的强化学习研究框架,支持单智能体、多智能体、自...人工智能# 强化学习1年前210
首次引入!用因果推理做部分可观测强化学习这篇《Fast Counterfactual Inference for History-Based Reinforcement Learning》提出一种快速因果推...人工智能# 强化学习1年前210
南洋理工发布量化交易大师TradeMaster,涵盖15种强化学习算法近日,量化平台大家庭迎来了一位新成员,基于强化学习的开源平台: TradeMaster— 交易大师。 ...人工智能# 强化学习1年前200
强化学习中的Transformer发展到哪一步了?清华、北大等联合发布TransformRL综述强化学习(RL)为顺序决策提供了一种数学形式,深度强化学习(DRL)近年来也取得巨大进展。然而,样本效...人工智能# 强化学习1年前200
深度强化学习处理真实世界的自动驾驶arXiv论文“Tackling Real-World Autonomous Driving using Deep Reinforcement Learning“,上传于2022年...人工智能# 强化学习1年前150
再掀强化学习变革!DeepMind提出「算法蒸馏」:可探索的预训练强化学习Transformer在当下的序列建模任务上,Transformer可谓是最强大的神经网络架构,并且经过预训练的Transformer模型可...人工智能# 强化学习1年前70