标签:强化学习

【强化学习】用Q-Learning优化车间调度

【强化学习】用Q-Learning优化车间调度

一、车间调度问题车间调度是NP难问题,传统方法难以获得最优解。强化学习能通过不断学习找到近似最优调度策略。二、问题建模状态空间S = (machine_status, job_queue, processing_time)机器状态 | 作业队列 | 加工时间动作空间A = {assign_job_1

ywuwei ywuwei 2026-05-07
0 0 0