IA identifica casos de violência contra a mulher a partir de prontuários médicos

Tiago Torrent é professor da Faculdade de Letras da UFJF e desenvolve pesquisas de IA aplicada à saúde, educação e acessibilidade. (Foto: Twin Alvarenga/UFJF)

Uma inteligência artificial (IA) que contribui para identificar casos de violência contra as mulheres começou recentemente a ser utilizada pela Secretaria de Saúde do Recife. A ferramenta ClarIA faz uso de análise semântica para transformar relatos escritos de prontuários de saúde em informações estruturadas e interpretáveis por sistemas computacionais, aumentando significativamente as chances de proteção das vítimas.

O modelo é resultado de anos de pesquisa em linguística computacional e foi criado pelo FrameNet Brasil, laboratório de Linguística Computacional da Universidade Federal de Juiz de Fora (UFJF). Tiago Torrent é professor do Programa de Pós-Graduação em Linguística da UFJF e está à frente do laboratório. Ele coordena o ReINVenTA e desenvolve pesquisas de IA aplicada à saúde, educação e acessibilidade, assunto do 25º episódio do IdPesquisa, já disponível no YouTube e Spotify.

IA aplicada à saúde
No âmbito da Compreensão de Linguagem Natural, a Semântica de Frames e a Gramática de Construções focam em como a mente humana interpreta o significado de uma frase com base na experiência, no contexto e nas estruturas de conhecimento prévio. A união dessas duas teorias é a base do FrameNet Brasil, que desenvolve pesquisas e implementações de cunho prático que mudam a vida das pessoas. No caso da IA de detecção de violência, o papel do laboratório foi etiquetar textos presentes em prontuários médicos.

“‘Esse é o paciente’, ‘esse é o sintoma’, ‘essa é a condição em saúde’, ‘esse foi o dia em que ocorreu’. E aí a gente tem milhares de sentenças etiquetadas, todas anônimas. Isso é entregue para uma IA para seu treinamento, de modo que ao fornecer sentenças desconhecidas ela consiga etiquetar com base no que aprendeu, então a gente consegue escalar o projeto”, explica o professor. Com a ClarIA, foram anotadas cerca de 2.500 sentenças de amostra e, após o treinamento do modelo, foram entregues 25.000.000 de sentenças.

A FrameNet Brasil é um laboratório de Linguística Computacional que desenvolve soluções inovadoras para a compreensão de linguagem natural, unindo tecnologia, Semântica de Frames e Gramática das Construções (Foto: UFJF)

Integrante do FrameNet Brasil desde 2019, quando ainda cursava a graduação em Sistemas de Informação na UFJF, Arthur Lorenzi é recém-doutor em Linguística e colega de pesquisa de Torrent. Ele estuda a linguística computacional e seu trabalho é conectar a teoria da Semântica de Frames com a inteligência artificial.

Arthur Lorenzi trabalha com sistemas de recomendação e estruturas gramaticais, e fez parte da construção da ClarIA, a implementação mais recente do FrameNet Brasil. (Foto: Arquivo pessoal)

“A ideia é pegar as inteligências artificiais e fazê-las identificar no texto as estruturas semânticas de violência. Primeiro, os linguistas modelam essas estruturas no laboratório e o que eu faço depois é montar a inteligência artificial que vai achar isso no texto automaticamente”, explica Lorenzi. No caso da ClarIA, ele está envolvido desde o início, da criação e adaptação da ferramenta em si, que identifica as estruturas, ao próprio sinal de alerta emitido mais tarde pelo prontuário.

“A principal importância desse trabalho é que a gente tenta pegar essas tecnologias novas de inteligência artificial e fazer um uso que seja ético, responsável e que beneficie a comunidade. Como são ferramentas que conseguem trabalhar numa escala de dados muito grande, a gente vê até um potencial para ela ser inclusiva, porque todas as mulheres têm direito a esse acolhimento”, completa.

Educação
Claudia Ferraz também é orientanda de doutorado do professor Torrent e faz parte do FrameNet Brasil desde 2023. Atualmente, faz doutorado sanduíche em Groningen, nos Países Baixos, e não está diretamente envolvida no projeto ClarIA. Sua pesquisa faz parte de uma outra vertente de pesquisa do laboratório, que se interessa pela área da educação.

Para Claudia Ferraz, metodologia e dataset resultantes da sua pesquisa podem ser estendidos a cenários de interação social para além da sala de aula, contribuindo para o entendimento da comunicação humana, e servirem como recurso de “padrão ouro” para o aprendizado de máquina. (Foto: Arquivo pessoal)

“Minha pesquisa propõe uma metodologia para a anotação semântica multimodal de interações em sala de aula”, afirma. O objetivo é registrar de forma sistemática as correlações entre professora e alunos, os modos comunicativos e os materiais envolvidos na construção de sentido, capturando como esse processo se desenrola a partir de diferentes perspectivas e posições de percepção.

Para operacionalizar a proposta, Claudia, em conjunto com Torrent, Janina Wildfeuer e integrantes do FrameNet Brasil, desenvolveram uma ferramenta de anotação que integra múltiplas camadas de dados, como fala, gestos, olhares e materiais didáticos, em uma representação semântica unificada. Com isso, aponta a doutoranda, uma das contribuições da pesquisa é para melhorias no processo de ensino-aprendizagem.

“Ao fornecer uma metodologia para analisar sistematicamente como professores e alunos coordenam suas interações, a pesquisa permite uma compreensão profunda de como o sentido é construído em sala de aula. Isso pode levar ao desenvolvimento de estratégias pedagógicas mais eficazes e treinamentos para professores baseados em evidências sobre o que realmente gera engajamento e compreensão”, explica.

Acessibilidade
Outra vertente de pesquisa do laboratório está voltada para a área de acessibilidade, a qual se dedica Mariane de Carvalho Pinto, integrante do FrameNet Brasil desde 2022, quando ainda era orientanda de iniciação científica da professora Natália Sathler Sigiliano – que também atua no laboratório. A experiência de Mariane acabou se estendendo para o mestrado e, hoje, ela segue no doutorado sob orientação do professor Tiago.

Mariane de Carvalho Pinto pesquisa caminhos tecnológicos que procuram tornar mais ágil e acessível o processo de criação de roteiros audiodescritivos. (Foto: Arquivo pessoal)

Nesses quatro anos, Mariane se envolveu em diferentes etapas e frentes de trabalho no laboratório, da anotação de textos e vídeos à geração de legendas para imagens. Atualmente, a pesquisadora se volta para a área de acessibilidade, especialmente para a audiodescrição: “de forma muito simplificada, esse é um recurso que funciona como uma espécie de “tradução” em palavras das informações visuais, fundamental para pessoas cegas ou com baixa visão”, afirma.

Segundo Mariane, a produção de roteiros de audiodescrição, apesar da importância, ainda é um processo bastante detalhado, demorado e, por isso, caro, o que faz com que muitas produções não contem com esse recurso. Diante disso, a doutoranda investiga como as anotações multimodais desenvolvidas no laboratório podem contribuir para o uso de inteligência artificial na geração de roteiros de audiodescrição. “A ideia é pensar em caminhos tecnológicos que ajudem a tornar esse processo mais ágil e acessível, ampliando, assim, o acesso a conteúdos audiovisuais”, esclarece.

Confira o conteúdo também em podcast, disponível no Spotify.