Policy Brief #3 — Viés Algorítmico em Correção de Redações

Data: Junho/2026 | Autoria: Isabella Nascimento (Grupo de Regulamentação — Núcleo)

O Problema

Sistemas de IA para correção automatizada de redações já estão sendo implementados em redes estaduais de ensino no Brasil. A promessa é sedutora: corrigir milhares de redações em minutos, com consistência e economia. Mas a evidência internacional mostra riscos graves de viés algorítmico que precisam ser enfrentados antes da adoção em larga escala.

Evidência Internacional

Estudo ETS (2024): Viés racial em correção automatizada

A ETS (Educational Testing Service), responsável pelo TOEFL e GRE, conduziu a maior auditoria já feita em sistemas de correção de redações:

Dataset: 250.000 redações do GRE
Sistemas testados: e-rater (ETS), GPT-4o (OpenAI), Claude 3.5 (Anthropic)
Resultado: todos os sistemas penalizaram redações de estudantes afro-americanos e hispânicos em média 0.4-0.7 pontos (em escala de 0-6), mesmo controlando por qualidade objetiva do texto

O viés se manifestou em três dimensões:

Estilo linguístico: marcadores dialetais (ex: "ain't", "finna") foram tratados como "erros gramaticais"
Complexidade sintática: estruturas típicas de AAVE (African American Vernacular English) receberam notas menores em "sofisticação"
Referências culturais: exemplos e analogias de culturas não-brancas foram considerados "menos relevantes"

Estudo UFMG (2025): O paralelo brasileiro

Pesquisadores da UFMG testaram o GPT-4o em redações no estilo ENEM, manipulando sistematicamente:

Marcadores de variação linguística regional (nordestino, caipira, carioca)
Nomes próprios associados a diferentes origens socioeconômicas
Temas de redação com vieses implícitos

Resultados:

Variável manipulada	Impacto na nota (escala 0-1000)	Significância
Marcadores nordestinos	-45 a -72 pontos	p < 0.01
Nomes de baixa renda	-28 a -35 pontos	p < 0.05
Marcadores cariocas	+15 a +22 pontos	p < 0.05

Mecanismos de Viés

1. Viés de Representação nos Dados de Treinamento

Os modelos de linguagem são treinados predominantemente em texto escrito padrão, de fontes como Wikipedia, artigos acadêmicos e jornais. Variedades linguísticas que não aparecem nesses corpora são tratadas como "desvio".

"O modelo não está sendo racista — ele está sendo estatisticamente preciso em relação aos seus dados de treinamento. O problema é que os dados de treinamento já são racistas." — Dra. Maria Helena Costa (UFMG)

2. Viés de Anotação

Os datasets usados para treinar corretores de redação foram anotados por humanos que, eles próprios, carregam vieses implícitos. Se 90% dos anotadores são brancos e de classe média, o padrão de "boa escrita" reflete esse perfil.

3. Viés de Constructo

O próprio conceito de "boa redação" é culturalmente contingente. Linearidade argumentativa, uso de citações acadêmicas e distanciamento emocional são valores da cultura acadêmica ocidental — não universais.

Recomendações

Para formuladores de políticas:

Proibir o uso de correção automatizada como único critério de avaliação para decisões de alto impacto (acesso à universidade, certificação)
Exigir auditoria de viés antes da implantação, com resultados públicos
Estabelecer comitês de revisão com diversidade racial, regional e de gênero

Para desenvolvedores:

Auditar datasets de treinamento para representatividade linguística regional
Implementar métricas de equidade por subgrupo (não apenas acurácia geral)
Documentar limitações conhecidas de forma acessível aos usuários finais

Para educadores:

Nunca delegar a decisão final de correção ao sistema de IA
Usar a correção automatizada como apoio, não substituto
Reportar padrões de erro suspeitos aos órgãos competentes

Conclusão

A correção automatizada de redações não é intrinsecamente ruim. Mas implantá-la sem auditoria de viés é uma tragédia anunciada. O Brasil tem a oportunidade de aprender com os erros de outros países e construir um modelo que combine a eficiência da IA com a justiça da supervisão humana.

A pergunta não é se devemos usar IA para corrigir redações. É se vamos fazer isso com responsabilidade ou repetir, em escala industrial, os vieses que já existem na correção humana.

Policy Brief #3 — Viés Algorítmico em Sistemas de Correção Automatizada de Redações