No próximo dia 25, o professor do departamento de Estatística da UFJF, Marcus Alexandre Nunes, apresentará palestra sobre sua tese de doutorado, com o título “Análise de dados RNA-Seq com excesso de zeros”.
Marcus Nunes possui graduação em Bacharelado em Matemática Aplicada e mestrado em Matemática Pura com Ênfase em Probabilidade e Estatística, ambos pela Universidade Federal do Rio Grande do Sul, e doutorado em Estatística pela Pennsylvania Sate University.
A palestra, aberta ao público e com entrada gratuita, terá início às 15h30, na sala 3504 do Instituto de Ciências Exatas da UFJF. Outras informações pelo telefone (32) 2102-3306 (departamento de Estatística).
Confira abaixo o resumo da palestra:
Título: Análise de Dados RNA-Seq com Excesso de Zeros
Resumo:
As tecnologias de sequenciamento de RNA next-gen estão revolucionando a análise de dados genéticos. Também chamadas de massively parallel signature sequencing (MPSS), estes métodos geram grandes quantidades de dados devido à produção e identificação de milhões de pequenas sequências de código genético. Estas sequências são alinhadas a um genoma de referência e suas ocorrências são contadas. As contagens obtidas por este procedimento são definidas como a expressão gênica dos genes.
Entretanto, uma grande parte destas contagens são zeros. Os Modelos Lineares Generalizados convencionais utilizados para testar a diferença na expressão gênica neste tipo de dado não são capazes de lidar satisfatoriamente com este tipo de dado. Por isso propomos um método capaz de lidar com esta característica dos dados RNA-Seq utilizando o método Hurdle. Mostramos como ajustar estes modelo aos dados de contagem e desenvolvemos um Teste de Razão de Verossimilhança para comparar o ajuste de dois diferentes modelos e assim poder escolher aquele que melhor se ajusta ao dados que analisamos. Também derivamos delineamentos quase ótimos para estes modelos utilizando uma variação do algoritmo de permuta.
Apresentamos simulações para demonstrar o desempenho do nosso método quando comparado a métodos já existentes na literatura da área. Para obtermos um entendimento das principais características do método, apresentamos resultados utilizando diversos parâmetros. Para verificar o poder do teste e o comportamento assintótico do estimador, simulamos exemplos simples onde analisamos apenas um gene por vez. Para verificar o comportamento do teste em situações similares ao mundo real, simulamos conjuntos de dados que se parecem com aqueles encontrados em experimentos de RNA-Seq.