Comentários da internet podem revolucionar sistemas de recomendação, aponta estudo da UFMG e UFSJ
Cientistas propõem um padrão para medir a precisão de sistemas que analisam opiniões em texto e aprimoram recomendações personalizadas
Por: Marcus Vinicius dos Santos | INCT TILD-IAR
Quem nunca passou até horas rolando telas sem decidir qual filme assistir, que música ouvir ou que produto comprar? O excesso de opções na internet é um problema universal. Para tentar resolver isso, surgiram os sistemas de recomendação, que oferecem sugestões com base em escolhas anteriores. Mas, na realidade, boa parte dessas ferramentas ainda depende quase exclusivamente de notas numéricas, as famosas “estrelinhas”. O resultado é um ciclo vicioso: mais do mesmo, pouca diversidade e menos precisão. Esse “loop da bolha” deixa o usuário preso a recomendações repetitivas.
Um grupo de cientistas das universidades federais de Minas Gerais (UFMG) e de São João del-Rei (UFSJ) decidiu atacar o problema. O trabalho foi desenvolvido junto ao recém-inaugurado Instituto Nacional de Ciência e Tecnologia em Inteligência Artificial Responsável para Linguística Computacional, Tratamento e Disseminação de Informação (INCT TILD-IAR), que tem sede no Departamento de Ciência da Computação (DCC) da UFMG.
Em vez de confiar apenas em números, os especialistas mostraram que os comentários — aqueles textos nos quais os usuários explicam suas experiências, críticas e elogios —, têm muito mais valor para entender gostos reais.
Do estudo à criação do iRev
O artigo com os resultados foi publicado na ACM Computing Surveys, uma das revistas mais conceituadas do mundo nessa área. No artigo, os mineiros revisaram 124 estudos internacionais sobre sistemas de recomendação baseados em comentários, os chamados RARSs (Review-Aware Recommender Systems). Mas a contribuição dos pesquisadores não se limitou à revisão. A partir dessa análise, eles criaram o iRev, a primeira plataforma aberta projetada para padronizar testes e comparações desses sistemas.
O iRev funciona como um benchmark. Ou seja, trata-se de um padrão de referência que permite avaliar tecnologias de forma justa e replicável. Ele compara desempenho, processos e produtos com os destaques do setor, identificando as práticas mais eficientes e oportunidades de melhoria. Na prática, a plataforma atua como um “campo neutro”, definindo quais bases de dados usar — como Amazon ou Yelp — e quais métricas aplicar, incluindo precisão, diversidade e novidade. Isso garante que todos os algoritmos sejam testados nas mesmas condições, tornando os resultados comparáveis e confiáveis.
Os testes iniciais realizados pelos pesquisadores indicaram que não existe um algoritmo perfeito para todas as situações. Cada modelo se destaca em contextos específicos. Ainda assim, com a padronização oferecida pelo iRev, pesquisadores e empresas contam com um guia confiável para selecionar soluções adequadas e eficazes.
Qual é a importância disso?
Comentários carregam detalhes impossíveis de serem capturados por meio de números. Eles permitem que algoritmos expliquem o “porquê” de uma recomendação, o que aumenta a confiança dos usuários, avalia o professor Leonardo Rocha, um dos autores e coordenador de Comunicação do TILD IAR.
Para ele, a capacidade de analisar textos pode ajudar a entender o porquê de boas e de más avaliações. “E o que a gente observou é que usar textos para fazer as recomendações ao usuário permite que ele compreenda o motivo dessa sugestão e também haja maior chance de sucesso. De ser algo realmente do interesse ou do gosto daquela pessoa. E não uma coisa generalizada”, afirma.
A plataforma iRev, por sua vez, garante que essas novas abordagens sejam avaliadas de forma rigorosa, transparente e comparável. Ao colocar a opinião do usuário no centro, o estudo estabelece um marco. “Não dá mais para ignorar a voz das pessoas”, afirma o cientista. A inteligência artificial pode aprender muito com a riqueza das experiências compartilhadas on-line.
O papel do INCT TILD-IAR
TILD IAR é uma rede nacional de pesquisa, que conta com a participação de pesquisadores estrangeiros. A missão do instituto é desenvolver inteligência artificial responsável aplicada à linguagem, alinhada à diversidade cultural brasileira. Com isso, busca-se reduzir a dependência de modelos importados, criando soluções éticas, transparentes e inclusivas, que reflitam a pluralidade do país e promovam tecnologias que dialoguem com a sociedade de forma prática e acessível.
O projeto INCTs (http://inct.cnpq.br/) é uma iniciativa do Ministério da Ciência, Tecnologia e Inovação (MCTI). Dentre outras estratégias, ele também promove a transferência de conhecimento para a sociedade e para setores produtivos, conectando pesquisa acadêmica à inovação aplicada.
Mais do que tecnologia: responsabilidade
O INCT TILD-IAR reforça que o desenvolvimento de IA no Brasil precisa ser não só eficiente, mas também responsável. Isso significa criar ferramentas que respeitem a pluralidade de opiniões, ajudem a reduzir desigualdades e valorizem a identidade cultural.
No fim das contas, a pesquisa mostra que inovação não é apenas copiar modelos de fora, mas construir caminhos próprios, mais próximos da realidade brasileira.
Leia o artigo original
Guilherme Bittencourt, Naan Vasconcelos, Yan Andrade, Nicollas Silva, Washington Cunha, Diego Roberto Colombo Dias, Marcos André Gonçalves, Leonardo Rocha – UFSJ. ACM Computing Surveys, junho de 2025.
Fonte
Assessoria de Comunicação Social e Divulgação Científica do INCT em Inteligência Artificial Responsável para Linguística Computacional, Tratamento e Disseminação de Informação (TILD-IAR)
comunicacao@dcc.ufmg.br