一、车间调度问题车间调度是NP难问题,传统方法难以获得最优解。强化学习能通过不断学习找到近似最优调度策略。二、问题建模状态空间S = (machine_status, job_queue, processing_time)机器状态 | 作业队列 | 加工时间动作空间A = {assign_job_1