您当前的位置:t7t8网 >  范文大全 >  心得体会 >北京大学取得分布式多智能体合作方法专利通过强化学习进行训练(北京大学智能机器人开放实验室)

北京大学取得分布式多智能体合作方法专利通过强化学习进行训练(北京大学智能机器人开放实验室)

更新时间:2023-12-27 05:00:33 点击: 来源:yutu

  金融界2023年12月18日消息,据国家知识产权局公告,北京大学取得一项名为“一种分布式多智能体合作方法、系统、介质及设备“,授权公告号CN116578636B,申请日期为2023年5月

  金融界2023年12月18日消息,据国家知识产权局公告,北京大学取得一项名为“一种分布式多智能体合作方法、系统、介质及设备“,授权公告号CN116578636B,申请日期为2023年5月。

  专利摘要显示,本公开涉及一种分布式多智能体合作方法、系统、介质及设备。该方法包括:对将过去对局历史中特定步骤数量的观测状态进行存储以构造观测历史寄存器;所述历史寄存器随着智能体与环境交互的进行,所述历史寄存器持续接受新的历史状态,并将超过容量限制的早期的历史状态丢弃;构造历史背景网络,其中,所述历史背景网络的输入为当前观测状态,与历史寄存器中的历史状态,通过数据挖掘与融合,所述历史背景网络的输出历史背景嵌入状态;构造隐式变分推理网络,构造策略网络和状态价值网络并通过强化学习进行训练,其中,所述策略网络和所述状态价值网络的输入为信念嵌入和当前观测状态,所述策略网络和所述状态价值网络的输出为策略分布和状态价值。

转载请备注原文地址:https://www.t7t8.net/xindetihui/917231.html
移动端网站原文地址:https://m.t7t8.net/xindetihui/917231.html