Defesa de Dissertação de Mestrado em Ciência da Computação
DATA: 01/09/2017
HORÁRIO: 9:00
LOCAL: 3504
“Uma abordagem baseada em classificadores de larga margem para geração de dados artificiais em bases desbalanceadas”
Mestrando: Marcelo Ladeira Marques
Orientador: Carlos Cristiano Hasenclever Borges
Coorientador: Saulo Moraes Villela
Banca Examinadora:
Prof. Carlos Cristiano Hasenclever Borges, D.Sc.
Prof. Saulo Moraes Villela, D.Sc.
Prof. Raul Fonseca Neto, D.Sc.
Prof. Antônio de Pádua Braga, Ph.D.
Resumo:
O presente trabalho tem como proposta o desenvolvimento de uma abordagem capaz de melhorar os resultados obtidos por algoritmos de classificação quando aplicados em bases desbalanceadas. O método realiza um procedimento iterativo baseado em classificadores de larga margem, visando gerar amostras sintéticas com o intuito de reduzir o nível de desbalanceamento. No processo são utilizados vetores suporte como referência para a geração das novas instâncias, permitindo posicioná-las em regiões com uma maior representatividade. Além disso, a estratégia permite que as novas amostras ultrapassem os limites das amostras utilizadas como referência para sua geração, o que possibilita uma extrapolação dos limites da classe minoritária, objetivando, assim, alcançar um maior reconhecimento dessa classe de interesse. São apresentados experimentos comparativos com demais técnicas, entre elas o Synthetic Minority Over-sampling TEchnique (SMOTE), os quais fornecem fortes evidências da aplicabilidade da abordagem proposta.