Banca de DEFESA: Sana Alamgeer

Uma banca de DEFESA de DOUTORADO foi cadastrada pelo programa.
DISCENTE : Sana Alamgeer
DATA : 09/09/2022
HORA: 13:45
LOCAL: Sala de Seminários (Espaço Sérgio Barroso)
TÍTULO:

Deep Learning Based Objective Quality Assessment of Multidimensional Visual Content


PALAVRAS-CHAVES:

Avaliação da Qualidade Visual, Campos de Luz 4D, Atenção Visual, Aprendizado Profundo, Recursos de Gargalo


PÁGINAS: 153
RESUMO:

Na última década, houve um tremendo aumento na popularidade dos aplicativos multimídia, aumentando assim o conteúdo multimídia. Quando esses conteúdos são gerados, transmitidos, reconstruídos e compartilhados, seus valores de pixel originais são transformados. Nesse cenário, torna-se mais crucial e exigente avaliar a qualidade visual do conteúdo visual afetado para que os requisitos dos usuários finais sejam atendidos. Neste trabalho, investigamos recursos espaciais, temporais e angulares eficazes desenvolvendo algoritmos sem referência que avaliam a qualidade visual de conteúdo visual multidimensional distorcido. Usamos algoritmos de aprendizado de máquina e aprendizado profundo para obter precisão de previsão. Para avaliação de qualidade de imagem bidimensional (2D), usamos padrões binários locais multiescala e informações de saliência e treinamos/testamos esses recursos usando o Random Forest Regressor. Para avaliação de qualidade de vídeo 2D, apresentamos um novo conceito de saliência espacial e temporal e pontuações de qualidade objetivas personalizadas. Usamos um modelo leve baseado em Rede Neural Convolucional (CNN) para treinamento e teste em patches selecionados de quadros de vídeo. Para avaliação objetiva da qualidade de imagens de campo de luz (LFI) em quatro dimensões (4D), propomos sete métodos de avaliação de qualidade LFI (LF-IQA) no total. Considerando que o LFI é composto por multi-views densas, Inspired by Human Visual System (HVS), propomos nosso primeiro método LFIQA que é baseado em uma arquitetura CNN de dois fluxos. O segundo e terceiro métodos LF-IQA também são baseados em uma arquitetura de dois fluxos, que incorpora CNN, Long Short-Term Memory (LSTM) e diversos recursos de gargalo. O quarto LF-IQA é baseado nas camadas CNN e Atrous Convolution (ACL), enquanto o quinto método usa as camadas CNN, ACL e LSTM. O sexto método LF-IQA também é baseado em uma arquitetura de dois fluxos, na qual EPIs horizontais e verticais são processados no domínio da frequência. Por último, mas não menos importante, o sétimo método LF-IQA é baseado em uma Rede Neural Convolucional de Gráfico. Para todos os métodos mencionados acima, realizamos experimentos intensivos e os resultados mostram que esses métodos superaram os métodos de última geração em conjuntos de dados de qualidade populares.


MEMBROS DA BANCA:
Externo à Instituição - CARLOS ALEXANDRE DE BARROS MELLO - UFPE
Externo à Instituição - CARLA LIBERAL PAGLIARI - IME
Interno - 3374036 - JOAO LUIZ AZEVEDO DE CARVALHO
Externo ao Programa - 1220587 - LI WEIGANG
Presidente - 1609346 - MYLENE CHRISTINE QUEIROZ DE FARIAS
Notícia cadastrada em: 08/09/2022 08:05
SIGAA | Secretaria de Tecnologia da Informação - STI - (61) 3107-0102 | Copyright © 2006-2024 - UFRN - app13_Prod.sigaa07