Fechar menu lateral

Projetos

A FrameNet Brasil é um núcleo de desenvolvimento de soluções em Linguística Computacional que congrega pesquisadores dos departamentos de Letras e de Ciências da Computação da Universidade Federal de Juiz de Fora.

 

Projetos em Desenvolvimento

Atualmente, a FrameNet Brasil abriga dos seguintes projetos:

 

Frames e Construções

O projeto Frames e Construções objetiva implementar um repertório de construções para o Português do Brasil – um Constructicon –, o qual seja eletronicamente acessível e constitua um input confiável para o desenvolvimento de soluções em Tecnologia da Informação (TI) focadas no Processamento da Linguagem Natural (PLN). Assim, caracteriza-se como projeto de inovação tecnológica, na medida em que busca aplicar as teorias da Semântica de Frames e da Gramática das Construções ao desenvolvimento de produtos de TI.

Em linhas gerais, o projeto busca, a partir da análise de sentenças extraídas de corpora, identificar pareamentos de forma e sentido – construções – cuja utilização evoque cenas estruturadas da experiência humana – frames. Identificadas as construções, estas são formalizadas em termos computacionais com o auxílio do software FrameNet Desktop, sendo armazenadas em um Constructicon.

Dessa forma, esse empreendimento complementa o macro-projeto dentro do qual é desenvolvido: a FrameNet Brasil (FN-Br). Enquanto a FN-Br levanta e formaliza lexemas – ou Unidades Lexicais – que evocam frames, um Constructicon caracteriza-se como um repertório de combinações de lexemas ou mesmo de posições sintáticas, estruturas cujo reconhecimento, tratamento e interpretação são fundamentais para o processamento da língua natural.

 

Gêneros, tipologias textuais e análise linguística: constituição de recursos didáticos para o trabalho contextualizado dos conhecimentos linguísticos em uma abordagem orientada pelos gêneros textuais

Este projeto tem como objetivo desenvolver um recurso didático disponível online a partir do qual será possível identificar gêneros e tipos textuais nos quais os variados conhecimentos linguísticos se instanciam com maior relevância. Nesse recurso, professores, coordenadores pedagógicos e graduandos em Letras poderão realizar buscas parametrizadas por gêneros e tipos textuais, obtendo como retorno os conhecimentos linguísticos mais instanciados em cada texto; ou, inversamente, por conhecimentos linguístico, obtendo como resultado os gêneros e tipos textuais em que se instanciam com maior frequência relativa. Adicionalmente, os materiais didáticos desenvolvidos no âmbito do projeto, pelos alunos do Programa de Mestrado Profissional em Letras (PROFLETRAS) a ele vinculados também serão disponibilizados, através do mesmo recurso, de modo a fornecer aos professores exemplos de como preparar materiais que associem gêneros e tipos textuais a recursos linguísticos a serem trabalhados na escola.

 

Projetos Anteriores

FLAME

O projeto FLAME (Frame-based Language Aid Multilingual Experiment), apoiando-se na experiência de desenvolvimento do Dicionário FrameNet Brasil da Copa do Mundo – doravante Copa –, objetiva desenvolver novo aplicativo temático multilíngue (Português – Inglês – Espanhol – Francês) para os Jogos Olímpicos de 2016, a serem realizados no Rio de Janeiro, cobrindo todas as modalidades olímpicas, o evento dos jogos em si, além do turismo.

De maneira semelhante ao projeto Copa – já disponível para acesso público e gratuito em http://www.dicionariodacopa.com.br – tal aplicativo será disponibilizado aos usuários através de um webservice ao qual poderão se conectar diversas opções de interfaces, desenvolvidas segundo o dispositivo no qual funcionarão. Assim, com o desenvolvimento de um único produto tecnológico, o sistema de consultas oferecido via webservice, infinitos dispositivos – tais como computadores, tablets, smartphones e mesmo totens espalhados pelos pontos turísticos do Rio de Janeiro, caso existam – poderão oferecer uma experiência diferenciada em tecnologia linguística.

No que concerne ao público-alvo, o FLAME será desenvolvido em duas versões: uma com foco nos turistas e pessoal envolvido na organização e outra com foco na imprensa especializada que virá ao Brasil com o papel de repercutir as notícias da mídia brasileira acerca dos jogos. A primeira dessas versões apresentará aos consulentes não só o sentido e a tradução da palavra pesquisada, seguido de sentenças exemplo nas quatro línguas, mas, ainda, apresentará a cena que aquela palavra evoca, incluindo-se a possibilidade de visualização da mesma através de vídeos semanticamente anotados. Haverá ainda a possibilidade de Já a versão para especialistas, além de oferecer todas as opções acima, apresenta ainda as configurações sintáticas mais frequentes nas quais um dado item lexical aparece nas quatro línguas alvo, facilitando o processo de tradução.

O aplicativo também deverá ser desenvolvido apoiado em ferramentas da Web Semântica, tais como as Ontologias, a fim de que seus dados possam ser expostos, compartilhados e interligados na forma de Linked Open Data. A exposição neste formato permitirá não apenas o uso de mecanismos de inferência sobre os dados, mas também a sua associação com outros recursos já disponíveis na Web. Assim, após consultar uma dado verbete do dicionário, o usuário que quiser se informar mais sobre o assunto poderá seguir links sugeridos pelo próprio sistema, a partir do mapeamento dos frames semânticos evocados pelas palavras para sistemas formais de organização do conhecimento (ontologias).

O FLAME é mais um desdobramento da FrameNet Brasil, iniciativa de pesquisa lexicográfica, em desenvolvimento na Universidade Federal de Juiz de Fora (UFJF) desde 2008, com o apoio da FAPEMIG, do CNPq e da própria UFJF, cujo objetivo é construir para o Português usado no Brasil (PB) a contraparte linguística da rede semântica conhecida como FrameNet (www.framenet.icsi.berkeley.edu), criada há dezesseis anos, a partir do Inglês, por um grupo de pesquisadores do ICSI (International Computer Science Institute), em Berkeley, na Califórnia, sob a liderança do linguista Charles Fillmore.

O Projeto FLAME apresenta grande potencial de inovação tecnológica dados a apresentação inovadora do conteúdo do dicionário, não mais restrito a listas de palavras e sentenças-exemplo, mas enriquecido com representações em esquema e em vídeos semanticamente anotados das cenas conceptuais evocadas pelos verbetes; o mecanismo de inferência de equivalentes de tradução mais adequados ao contexto de consulta, tirando do usuário a responsabilidade por escolher o melhor significado para a palavra consultada; e sua ligação a outras bases de dados, rompendo na prática os limites entre dicionário e enciclopédia e transformando a aplicação em um verdadeiro portal de conhecimento acerca dos Jogos Olímpicos.

 

Copa 2014 FrameNet Brasil

O projeto Copa 2014 FrameNet Brasil desenvolveu, em meio eletrônico, um dicionário temático trilíngue (Português – Inglês –Espanhol) abrangendo os domínios do Futebol e do Turismo. Tal dicionário, com foco no uso humano, tem como audiência privilegiada a imprensa esportiva internacional, pessoas envolvidas na organização da Copa do Mundo FIFA 2014 e na recepção aos turistas estrangeiros, além dos próprios turistas. Em sintonia com as mudanças correntes na área das Tecnologias da Informação, o dicionário é um recurso lexical acessível eletronicamente de qualquer parte do mundo através do endereço http://www.dicionariodacopa.com.br.

Desenvolveu-se em parceria estabelecida com a equipe da Profa. Dra. Rove Chishman, da UNISINOS, o projeto FrameCorp, em cujo âmbito se abriga o subprojeto Kicktionary-Br, que teve como objetivo construir para o Português do Brasil a contraparte do recurso lexical multilíngüe criado no ICSI pelo Dr. Thomas Schmidt para a linguagem do futebol (http://www.kicktionary.de).

O Dicionário FrameNet Brasil da Copa do Mundo tem organização de verbetes e sistema de consulta diferente daqueles usados pelos dicionários comuns, mesmo os eletrônicos. Por ser baseado na Semântica de Frames, possibilita uma consulta por cenas relevantes dos domínios do Futebol e do Turismo, em situações nas quais o usuário porventura esteja envolvido ou sobre as quais precise falar ou escrever.

Nesse sentido, caracteriza-se como projeto de inovação tecnológica de construção de recurso computacional lexicográfico para usuários humanos. Tal projeto, à semelhança do que propõe Schmidt (2007) para seu empreendimento, explora produtivamente a interface entre teorias semânticas linguísticas, métodos de pesquisa em linguística de corpus e tecnologias de hipermídia.