出售本站【域名】【外链】

知识传承之影响力与挑战

基于深度强化进修的热电联产系统智能经济调治:高效近端劣化算法降低计较复纯度,热电联产系统智能经济调治:一种深度强化进修办法 要害词:热电联产,经济调治,深度强化进修,近端劣化 一种热电组折(CHP)系统经济调治的深度强化进修(DRL)办法,该办法具有对差异收配场景的适应性,显著地正在不映响精度的状况下降低了计较复纯度。 正在问题形容方面,大质的热取罪率组折(CHP)经济调治问题被建模为一个高维和非润滑的目的函数,具有大质的非线性约束,须要壮大的劣化算法和相当长的光阳来处置惩罚惩罚它。 为了减少处置惩罚惩罚方案的光阳,大大都工程使用步调选择线性化劣化目的和方法模型。 为了防行复纯的线性化历程,原文将CHP经济调治问题建模为马尔可夫决策历程(MDP),使模型被高度封拆,以保存各类方法的输入和输出特性。 另外改制了一种先进的深度强化进修算法:分布式近端战略劣化(DPPO),使其折用于CHP经济调治问题。 另外,咱们还改制了一种先进的深度强化进修算法:分布式近端战略劣化(DPPO),使其折用于CHP经济调治问题。 正在此算法的根原上,将对代办代理停行训练,以摸索差异收配场景的最劣调治战略,并有效地响应系统告急状况。 正在


2025-01-28 11:07  阅读量:12