Идея обучения с подкреплением заключается в том, что вы не обязательно знаете, какие действия вы можете предпринять, поэтому вы изучаете последовательность действий, которые вы должны предпринять, выбирая то, что вы считаете хорошей идеей, а затем наблюдая за реакцией мира. Как в настольной игре, где вы можете реагировать на то, как играет ваш противник.