NLP2

Processamento de Linguagem Natural para o Português
Líderes: Marcelo Finger, Sandra M. Aluísio e Thiago A. S. Pardo

O objetivo deste desafio de pesquisa é reunir dados abertos e ferramentas para habilitar o PLN (Processamento de Linguagem Natural) de alto nível para o português (escrito e falado). O grupo de pesquisa concentrou-se em:

  • uma perspectiva sintática, um corpus multigênero de textos sintaticamente anotados para construir modelos robustos de marcação e análise;
  • uma perspectiva linguística e computacional, um corpus geral do português brasileiro que pode servir, entre outras coisas, como base para modelos fundamentais; e
  • para a linguagem falada, corpora multitarefa para reconhecimento de fala, síntese de múltiplos falantes, identificação de locutores e clonagem de voz. As aplicações incluem tarefas relacionadas à análise de sentimentos, extração e categorização de aspectos de opiniões e detecção de notícias falsas.
Sites de Projetos (Externos)

NLP2 – Portal Web

POeTiSA – Processamento em Português: Rumo à Análise Sintática

TaRSila – Tarefa de Anotação para o Reconhecimento e Síntese de fala da Língua Portuguesa

Carolina -Corpus Geral do Português Brasileiro Contemporâneo

ProIndL

Fortalecimento das Línguas Indígenas Brasileiras com IA
Líderes: Luciana Storto e Claudio Pinhanez

Este desafio de pesquisa explora três questões-chave: 

  • Como as tecnologias de IA podem melhorar a documentação e esforços relacionados às línguas indígenas brasileiras?
  • Como as ferramentas atuais devem ser adaptadas para trabalhar com línguas de recursos limitados e em perigo de extinção?
  • Como as ferramentas de IA podem ser desenvolvidas para comunidades indígenas de maneira ética?

A equipe investigou maneiras de capacitar comunidades indígenas a usar ferramentas de IA, ao mesmo tempo em que acomoda restrições relevantes, e envolveu-se com comunidades indígenas para operar de maneira ética. A equipe trabalhou com algumas comunidades indígenas em São Paulo explorando questões linguísticas relacionadas à língua Guarani Mbya e desenvolver uma ferramenta de apoio a jovens estudantes dessa língua.

KEML

Aprendizado de Máquinas com Conhecimento Aprimorado
Líderes: Sarajane Peres e Fabio Cozman

O objetivo amplo deste desafio de pesquisa tem sido mesclar aprendizado baseado em dados e raciocínio baseado em conhecimento; embora a IA seja agora muito bem-sucedida devido às inovações no aprendizado de máquina, mais atenção deve ser dada ao raciocínio com garantias formais. A equipe de pesquisa trabalhou em um agente conversacional que combina várias fontes de informação sobre o oceano, olhando tanto para interfaces baseadas na web quanto para interfaces baseadas em robôs. Atualmente, um esforço significativo é dedicado à avaliação de modelos de linguagem grandes para obter garantias de factualidade. A equipe também investigou combinações neuro-simbólicas de programação probabilística e redes neurais para abordar a argumentação automatizada.

OceanML

Aprendizado de Máquina Baseado em Oceanografia
Líderes:
Eduardo Tannuri e Zhao Liang

Este desafio de pesquisa visa combinar o conhecimento da física com métodos baseados em dados para a previsão de variáveis oceânicas, com foco especial na região costeira brasileira (conhecida como Blue Amazon), uma zona econômica exclusiva de cerca de 200 milhas náuticas no oceano Atlântico. Integrando algoritmos de aprendiza-do de máquina de ponta com um rico histórico de modelagem física, a equipe melhorou as previsões computacionais atuais e reduziu o tamanho dos conjuntos de dados necessários para obter essas previsões. Os resultados são aplicados a situações com impacto social, como previsão de enchentes e marés de tempestade, estimativa de movimentos de vazamentos de petróleo e posicionamento ideal de turbinas eólicas e hidrelétricas.

MClimate

Tomada de Decisões Multicritério sobre o Clima
Líderes: Alexandre Delbem e Antonio Saraiva

A modelagem climática mostrou avanços notáveis nas últimas décadas. No entanto, o desafio de relacionar medições climáticas a modelos matemáticos permanece, especialmente no que diz respeito a eventos climáticos extremos. Novas possibilidades surgem com avanços em aprendizado de máquina em redes neurais informadas por física. Este desafio de pesquisa investiga a otimização de muitos objetivos de hiperparâmetros para encontrar trade-offs apropriados entre critérios de desempenho (como precisão, custo computacional e complexidade ou tamanho do modelo) e restrições físicas (organizadas como margens para maximizar). A equipe examina modelos baseados em física que podem competir ou cooperar, modelos causais e restrições baseadas em conhecimento no aprendizado de máquina baseado em dados.

OBIA@C4AI

Observação e Discussão do Impacto da Inteligência Artificial
Líderes: Cristina Oliveira e João Veiga

O objetivo deste grande desafio é mapear, entender e debater o impacto da IA no Brasil e estender essa análise a outros países emergentes. Os interesses da equipe variam desde desinformação até regulamentação e comportamento ético. Dado o amplo impacto da IA, essas questões urgentes só podem ser abordadas com sucesso a partir de uma perspectiva multidisciplinar. Desde junho de 2022, a equipe tem participado como um ramo acadêmico no Observatório Brasileiro de IA liderado pelo NIC.br (a agência que regula e controla a internet brasileira). O Observatório de IA foi criado pelo Ministério Federal de Ciência, Tecnologia e Inovação e é geralmente referido como “OBIA” (para Observatório Brasileiro de Inteligência Artificial).

AI Health

Aprendizado de Máquina para
Diagnóstico e Reabilitação
Líderes: José Krieger e Zhao Liang

Os avanços recentes do aprendizado de máquina na medicina têm sido notáveis. No entanto, ainda existem questões importantes a serem abordadas; por exemplo: 1) Como integrar e selecionar características médicas relevantes (biomarcadores) a partir de fontes heterogêneas e dinâmicas em larga escala? 2) Como interpretar as decisões tomadas por algoritmos de aprendizado de máquina e como integrar a inteligência humana e artificial? Este grupo de pesquisa aborda tais questões, concentrando-se em grande parte em acidentes cerebrovasculares (ACV), câncer e Covid-19. A equipe desenvolveu uma série de técnicas de IA.

AgriBio

Tomada de Decisão Causal Multicritério em Redes de Produção Alimentar
Líderes: Alexandre Delbem e Antonio Saraiva

Este grupo de pesquisa está interessado em modelos de IA multicritério causais para tomada de decisões em ambientes de produção de alimentos, especialmente relacionados à segurança alimentar, em meio à incerteza. A equipe investiga métodos para encontrar e representar automaticamente as estruturas fundamentais de subsistemas sociais, econômicos e físicos relacionados à produção de alimentos, criando modelos confiáveis (causais). Muitas das investigações em AgriBio são orientadas por dados, utilizando bancos de dados heterogêneos de várias fontes com milhares de variáveis da Parceria para Governo Aberto (OGP).