Fechar menu lateral

Oficina de Tecnologia Linguística – Anotação de Corpora Multimodais para Frames

A Oficina de Tecnologia Linguística: Anotação de Corpora Multimodais para Frames é um curso prático de criação de conjuntos de dados multimodais anotados por humanos, os quais são chamados de Gold Standard Datasets. Tais datasets podem ser empregados para o treinamento de modelos de Inteligência Artificial, que, por sua vez, apresentam potencial de aplicação para diversas tarefas de processamento automático de línguas e imagens, tais como legendagem automática, geração de imagens, busca semântica multimodal, tradução automática multimodal, entre outras. Ao longo do curso, será apresentada a metodologia de anotação multimodal desenvolvida pela FrameNet Brasil e utilizada para a constituição do gold standard dataset da ReINVenTA – Research and Innovation Network for Visual and Textual Analysis of Multimodal Objects – rede de pesquisa coordenada pela UFJF e formada ainda pela UFMG, UFU, PUC-MG e UFPB, com financiamento da FAPEMIG e do CNPq.

O curso será ofertado em duas modalidades, simultaneamente.

Para alunos da UFJF com matrícula ativa na graduação, a oficina será ofertada como uma disciplina presencial do semestre 2022.4.
Para os demais públicos, será ofertada como curso de extensão online, através da plataforma Google Classroom e contará com 30 horas de atividades síncronas e 15 horas de atividades assíncronas. Os resultados das tarefas de anotação realizadas durante o curso serão incoporados ao dataset da ReINVenTA.

As inscrições estão abertas até as 17h do dia 13/02/2023.

Público Alvo

A oficina é aberta à participação de interessados em tecnologia linguística e análise semântica computacional. Uma vez que os participantes precisam assinar um termo de consentimento para uso dos dados gerados no dataset da ReINVenTA, devem ser maiores de idade. Por fim, é necessário que os participantes sejam falantes nativos do português brasileiro.

Carga Horária

  • 30 horas de atividades síncronas
    De segunda a sexta-feira, das 14h às 17h, no período de 27/02 a 10/03/2023.
    Realizadas no Laboratório FrameNet Brasil (para os alunos da UFJF) e via Google Meet (para os demais públicos).
  • 15 horas de atividades assíncronas
    A serem concluídas até 17/03/2023.

Conteúdo

1. Fundamentos da Anotação Computacional

1.1 – Requisitos para um projeto de anotação
1.2 – Implicações metodológicas
1.3 – Avaliação

2. Anotação Computacional de Objetos Multimodais

2.1 – Modos Comunicativos 2.2 – Gêneros Multimodais

3. O Dataset Multimodal da ReINVenTA

3.1 – Framed Multi 30k 3.2 – Frame2
3.3 – Auditor

4. Prática de Anotação Computacional

Mais informações podem ser obtidas através do email projeto.framenetbr@ufjf.br.