Policy Brief #3 — Viés Algorítmico em Correção de Redações

Data: Junho/2026 | Autoria: Isabella Nascimento (Grupo de Regulamentação — Núcleo)

O Problema

Sistemas de IA para correção automatizada de redações já estão sendo implementados em redes estaduais de ensino no Brasil. A promessa é sedutora: corrigir milhares de redações em minutos, com consistência e economia. Mas a evidência internacional mostra riscos graves de viés algorítmico que precisam ser enfrentados antes da adoção em larga escala.

Evidência Internacional

Estudo ETS (2024): Viés racial em correção automatizada

A ETS (Educational Testing Service), responsável pelo TOEFL e GRE, conduziu a maior auditoria já feita em sistemas de correção de redações:

  • Dataset: 250.000 redações do GRE
  • Sistemas testados: e-rater (ETS), GPT-4o (OpenAI), Claude 3.5 (Anthropic)
  • Resultado: todos os sistemas penalizaram redações de estudantes afro-americanos e hispânicos em média 0.4-0.7 pontos (em escala de 0-6), mesmo controlando por qualidade objetiva do texto

O viés se manifestou em três dimensões:

  1. Estilo linguístico: marcadores dialetais (ex: "ain't", "finna") foram tratados como "erros gramaticais"
  2. Complexidade sintática: estruturas típicas de AAVE (African American Vernacular English) receberam notas menores em "sofisticação"
  3. Referências culturais: exemplos e analogias de culturas não-brancas foram considerados "menos relevantes"

Estudo UFMG (2025): O paralelo brasileiro

Pesquisadores da UFMG testaram o GPT-4o em redações no estilo ENEM, manipulando sistematicamente:

  • Marcadores de variação linguística regional (nordestino, caipira, carioca)
  • Nomes próprios associados a diferentes origens socioeconômicas
  • Temas de redação com vieses implícitos

Resultados:

Variável manipulada Impacto na nota (escala 0-1000) Significância
Marcadores nordestinos -45 a -72 pontos p < 0.01
Nomes de baixa renda -28 a -35 pontos p < 0.05
Marcadores cariocas +15 a +22 pontos p < 0.05

Mecanismos de Viés

1. Viés de Representação nos Dados de Treinamento

Os modelos de linguagem são treinados predominantemente em texto escrito padrão, de fontes como Wikipedia, artigos acadêmicos e jornais. Variedades linguísticas que não aparecem nesses corpora são tratadas como "desvio".

"O modelo não está sendo racista — ele está sendo estatisticamente preciso em relação aos seus dados de treinamento. O problema é que os dados de treinamento já são racistas." — Dra. Maria Helena Costa (UFMG)

2. Viés de Anotação

Os datasets usados para treinar corretores de redação foram anotados por humanos que, eles próprios, carregam vieses implícitos. Se 90% dos anotadores são brancos e de classe média, o padrão de "boa escrita" reflete esse perfil.

3. Viés de Constructo

O próprio conceito de "boa redação" é culturalmente contingente. Linearidade argumentativa, uso de citações acadêmicas e distanciamento emocional são valores da cultura acadêmica ocidental — não universais.

Recomendações

Para formuladores de políticas:

  1. Proibir o uso de correção automatizada como único critério de avaliação para decisões de alto impacto (acesso à universidade, certificação)
  2. Exigir auditoria de viés antes da implantação, com resultados públicos
  3. Estabelecer comitês de revisão com diversidade racial, regional e de gênero

Para desenvolvedores:

  1. Auditar datasets de treinamento para representatividade linguística regional
  2. Implementar métricas de equidade por subgrupo (não apenas acurácia geral)
  3. Documentar limitações conhecidas de forma acessível aos usuários finais

Para educadores:

  1. Nunca delegar a decisão final de correção ao sistema de IA
  2. Usar a correção automatizada como apoio, não substituto
  3. Reportar padrões de erro suspeitos aos órgãos competentes

Conclusão

A correção automatizada de redações não é intrinsecamente ruim. Mas implantá-la sem auditoria de viés é uma tragédia anunciada. O Brasil tem a oportunidade de aprender com os erros de outros países e construir um modelo que combine a eficiência da IA com a justiça da supervisão humana.

A pergunta não é se devemos usar IA para corrigir redações. É se vamos fazer isso com responsabilidade ou repetir, em escala industrial, os vieses que já existem na correção humana.

← Voltar para relatórios