O Laboratório FrameNet Brasil de Linguística Computacional, vinculado à Universidade Federal de Juiz de Fora (UFJF), realizou o depósito de duas patentes para sistemas de aprimoramento de tradução por máquina utilizando semântica. Os processos são realizados por meio do apoio institucional do Centro Regional de Inovação e Transferência de Tecnologia (Critt).
“O depósito das patentes consolida, em dois produtos de inovação de grande impacto prático, anos de pesquisa desenvolvida no Laboratório FrameNet Brasil e no Programa de Pós-graduação em Linguística. E não estou falando só de pesquisa aplicada; apesar de as patentes serem produtos de pesquisa aplicada a um problema real e imediato – o da tradução por máquina -, o conhecimento acumulado para sua geração depende fortemente de pesquisa básica na área de Linguística Cognitiva. Por isso, é tão importante ressaltar a necessidade de investimento público em pesquisa básica: é ela que possibilita que se desenvolvam aplicações de impacto imediato”, destaca o pesquisador e coordenador da FrameNet Brasil, Tiago Torrent.
“Por isso, é tão importante ressaltar a necessidade de investimento público em pesquisa básica: é ela que possibilita que se desenvolvam aplicações de impacto imediato”
As invenções que resultaram nas patentes são fruto do trabalho de Torrent, do professor Ely Matos, do doutorando Alexandre Diniz e do então bolsista de Iniciação ao Desenvolvimento Tecnológico e de Inovação, Mateus Marim. Ambas as patentes referem-se a métodos implementados computacionalmente, que se fundamentam na melhora do desempenho de algoritmo de tradução por máquina. Essa melhora, por sua vez, é obtida por meio de enriquecimento semântico com injeção terminológica de domínio específico.
Para exemplificar a atuação das invenções, os pesquisadores tomam um esporte como exemplo: o rugby. “Nesta situação, usando um tradutor comercial, demonstra-se que a sentença ‘No rugby, o abertura é o jogador mais habilidoso do time’ é traduzida como ‘In rugby, the opener is the most skilled player on the team’. O problema seria a tradução de ‘abertura’ por ‘opener’, uma vez que a equivalência adequada seria ‘fly-half’”, elucidam. A equipe argumenta que um tradutor humano proficiente não teria dificuldade em fazer a substituição da forma adequada. “O problema dos sistemas probabilísticos e neurais em uso é que eles são cegos às propriedades semânticas e atuam, unicamente, na manipulação das formas linguísticas.”
Os métodos propostos pelo laboratório incluem o tratamento de informação semântica junto às palavras, antes do processamento da tradução e, depois, do processamento, o que faz com que o algoritmo utilizado tenha a capacidade de encontrar a melhor opção de tradução para o domínio específico em que se encontra a sentença. De acordo com os pesquisadores, um grande ponto favorável às tecnologias desenvolvidas pelo grupo é que o método pode ser incorporado a algoritmos de tradução comerciais.
Outras informações:
Laboratório de Linguística Computacional – FrameNet Brasil
Centro Regional de Inovação e Transferência de Tecnologia