ПРИМЕНЕНИЕ ГЛУБОКОГО ОБУЧЕНИЯ С ПОДКРЕПЛЕНИЕМ В ЗАДАЧАХ ДИНАМИЧЕСКОЙ МАРШРУТИЗАЦИИ ТРАФИКА В САМООРГАНИЗУЮЩИХСЯ БЕСПРОВОДНЫХ СЕТЯХ

Аннотация

В данной статье исследуется применение алгоритмов глубокого обучения с подкреплением (Deep Reinforcement Learning) для решения задач оптимизации маршрутов в мобильных самоорганизующихся сетях (MANET). Рассматриваются механизмы адаптивного выбора путей передачи данных в условиях высокой динамики топологии сети и ограниченности энергетических ресурсов узлов. Описана архитектура нейронной сети, способной обучаться оптимальным стратегиям управления трафиком на основе текущих метрик качества обслуживания, таких как задержка, джиттер и вероятность потери пакетов. Результаты моделирования подтверждают превосходство предлагаемого подхода над классическими протоколами маршрутизации по критериям пропускной способности и устойчивости к отказам узлов.

Ключевые слова

самоорганизующиеся сетимаршрутизация трафикаобучение с подкреплениемнейронные сетиMANETкачество обслуживанияинтеллектуальные системы связибеспроводные технологии