Banca de DEFESA: Gabriel Pimenta de Freitas Cardoso

Uma banca de DEFESA de MESTRADO foi cadastrada pelo programa.
DISCENTE : Gabriel Pimenta de Freitas Cardoso
DATA : 28/05/2024
HORA: 10:00
LOCAL: VIDEOCONFERÊNCIA
TÍTULO:

DEEP REINFORCEMENT LEARNING AND HYPER HEURISTICS APPLIED TO RESOURCE ALLOCATION IN 6G COMMUNICATIONS SYSTEMS WITH D2D COMMUNICATIONS AND SENSING


PALAVRAS-CHAVES:

 Deep Reinforcement Learning, PPO, Hiper Heurística, Comunicações e Sensoreamento.


PÁGINAS: 121
RESUMO:

Este trabalho propõe uma estratégia para a realização conjunta da alocação de espectro e do controle de potências em sistemas de comunicações móveis de 5G e gerações futuras com sensoreamento integrado. A aplicação tratada neste trabalho se situa em um contexto relacionado à Indústria 4.0, abarcando um cenário industrial com comunicações primárias, comunicações D2D e sensores. A solução proposta para realizar a alocação de recursos nesse sistema é composta pela conjunção de duas técnicas no estado da arte: algoritmos de Deep Reinforcement Learning (DRL) e Hiper-Heurísticas (HH). O primeiro algoritmo que forma a estratégia conjunta proposta neste trabalho foi desenvolvido utilizando-se redes neurais treinadas por meio de técnicas de DRL para controle de potências. O segundo algoritmo, que completa a estratégia proposta, foi desenvolvido através de técnicas relacionadas à aplicação de HHs em conjunção com algoritmos de DRL, para realização da alocação do espectro disponível. A estratégia conjunta teve como objetivos principais: proteger as comunicações primárias, almejando-se reduzir a taxa de outage para garantia de uma comunicação de qualidade; além de proteger os sensores do sistema, objetivando-se reduzir a taxa de outage dos sensores para garantir que a probabilidade de detecção estivesse acima de um limiar pré definido. Como objetivo secundário, o algoritmo proposto buscou-se maximizar a taxa de transmissão das comunicações D2D. Os resultados mostraram que o algoritmo de controle de potências que obteve o melhor desempenho, em comparação com outros algoritmos da área no estado da arte, foi o Proximal Policy Optimization (PPO). Esse algoritmo proposto, separadamente ao de alocação do espectro, foi capaz, em um Resource Block (RB), de reduzir a taxa de outage das comunicações primárias de 64.35% para 11.75%, reduzir a taxa de outage dos sensores de 38.5% para 4.4% e aumentar a SNIR das comunicações D2Ds de -25.6 dB para -7.5 dB, se comparado com os resultados obtidos por um algoritmo aleatório. Para a estratégia completa, isto é, com algoritmos de DRL e HH realizando tanto o controle de potências quanto a alocação do espectro, os resultados indicaram que, em comparação com uma alocação de recursos baseada em escolhas aleatórias, a estratégia conjunta foi capaz de reduzir a taxa de outage das comunicações primárias de 65.8% para 13.3%, reduzir a taxa de outage dos sensores de 48.1% para 3.3% e aumentar a SNIR das comunicações D2Ds de -24.3 dB para -11.2 dB em sistemas com múltiplos RBs. Além disso, o algoritmo se mostrou escalável para sistemas com diferentes quantidades de comunicações, sensores e RBs, sendo aplicável em diferentes configurações do sistema. 


MEMBROS DA BANCA:
Externo à Instituição - JOSE MARCOS CAMARA BRITO - INATEL
Interno - 1323316 - HUGERLES SALES SILVA
Interno - 1279605 - LEONARDO RODRIGUES ARAUJO XAVIER DE MENEZES
Presidente - 2376576 - PAULO ROBERTO DE LIRA GONDIM
Notícia cadastrada em: 14/05/2024 16:42
SIGAA | Secretaria de Tecnologia da Informação - STI - (61) 3107-0102 | Copyright © 2006-2024 - UFRN - app09_Prod.sigaa03