ПРИМЕНЕНИЕ ГЛУБОКОГО ОБУЧЕНИЯ С ПОДКРЕПЛЕНИЕМ В ЗАДАЧАХ ДИНАМИЧЕСКОЙ МАРШРУТИЗАЦИИ ТРАФИКА В САМООРГАНИЗУЮЩИХСЯ БЕСПРОВОДНЫХ СЕТЯХ
Аннотация
В данной статье исследуется применение алгоритмов глубокого обучения с подкреплением (Deep Reinforcement Learning) для решения задач оптимизации маршрутов в мобильных самоорганизующихся сетях (MANET). Рассматриваются механизмы адаптивного выбора путей передачи данных в условиях высокой динамики топологии сети и ограниченности энергетических ресурсов узлов. Описана архитектура нейронной сети, способной обучаться оптимальным стратегиям управления трафиком на основе текущих метрик качества обслуживания, таких как задержка, джиттер и вероятность потери пакетов. Результаты моделирования подтверждают превосходство предлагаемого подхода над классическими протоколами маршрутизации по критериям пропускной способности и устойчивости к отказам узлов.