Policy Brief #3 — Viés Algorítmico em Sistemas de Correção Automatizada de Redações
Policy Brief #3 — Viés Algorítmico em Correção de Redações
Data: Junho/2026 | Autoria: Isabella Nascimento (Grupo de Regulamentação — Núcleo)
O Problema
Sistemas de IA para correção automatizada de redações já estão sendo implementados em redes estaduais de ensino no Brasil. A promessa é sedutora: corrigir milhares de redações em minutos, com consistência e economia. Mas a evidência internacional mostra riscos graves de viés algorítmico que precisam ser enfrentados antes da adoção em larga escala.
Evidência Internacional
Estudo ETS (2024): Viés racial em correção automatizada
A ETS (Educational Testing Service), responsável pelo TOEFL e GRE, conduziu a maior auditoria já feita em sistemas de correção de redações:
- Dataset: 250.000 redações do GRE
- Sistemas testados: e-rater (ETS), GPT-4o (OpenAI), Claude 3.5 (Anthropic)
- Resultado: todos os sistemas penalizaram redações de estudantes afro-americanos e hispânicos em média 0.4-0.7 pontos (em escala de 0-6), mesmo controlando por qualidade objetiva do texto
O viés se manifestou em três dimensões:
- Estilo linguístico: marcadores dialetais (ex: "ain't", "finna") foram tratados como "erros gramaticais"
- Complexidade sintática: estruturas típicas de AAVE (African American Vernacular English) receberam notas menores em "sofisticação"
- Referências culturais: exemplos e analogias de culturas não-brancas foram considerados "menos relevantes"
Estudo UFMG (2025): O paralelo brasileiro
Pesquisadores da UFMG testaram o GPT-4o em redações no estilo ENEM, manipulando sistematicamente:
- Marcadores de variação linguística regional (nordestino, caipira, carioca)
- Nomes próprios associados a diferentes origens socioeconômicas
- Temas de redação com vieses implícitos
Resultados:
| Variável manipulada | Impacto na nota (escala 0-1000) | Significância |
|---|---|---|
| Marcadores nordestinos | -45 a -72 pontos | p < 0.01 |
| Nomes de baixa renda | -28 a -35 pontos | p < 0.05 |
| Marcadores cariocas | +15 a +22 pontos | p < 0.05 |
Mecanismos de Viés
1. Viés de Representação nos Dados de Treinamento
Os modelos de linguagem são treinados predominantemente em texto escrito padrão, de fontes como Wikipedia, artigos acadêmicos e jornais. Variedades linguísticas que não aparecem nesses corpora são tratadas como "desvio".
"O modelo não está sendo racista — ele está sendo estatisticamente preciso em relação aos seus dados de treinamento. O problema é que os dados de treinamento já são racistas." — Dra. Maria Helena Costa (UFMG)
2. Viés de Anotação
Os datasets usados para treinar corretores de redação foram anotados por humanos que, eles próprios, carregam vieses implícitos. Se 90% dos anotadores são brancos e de classe média, o padrão de "boa escrita" reflete esse perfil.
3. Viés de Constructo
O próprio conceito de "boa redação" é culturalmente contingente. Linearidade argumentativa, uso de citações acadêmicas e distanciamento emocional são valores da cultura acadêmica ocidental — não universais.
Recomendações
Para formuladores de políticas:
- Proibir o uso de correção automatizada como único critério de avaliação para decisões de alto impacto (acesso à universidade, certificação)
- Exigir auditoria de viés antes da implantação, com resultados públicos
- Estabelecer comitês de revisão com diversidade racial, regional e de gênero
Para desenvolvedores:
- Auditar datasets de treinamento para representatividade linguística regional
- Implementar métricas de equidade por subgrupo (não apenas acurácia geral)
- Documentar limitações conhecidas de forma acessível aos usuários finais
Para educadores:
- Nunca delegar a decisão final de correção ao sistema de IA
- Usar a correção automatizada como apoio, não substituto
- Reportar padrões de erro suspeitos aos órgãos competentes
Conclusão
A correção automatizada de redações não é intrinsecamente ruim. Mas implantá-la sem auditoria de viés é uma tragédia anunciada. O Brasil tem a oportunidade de aprender com os erros de outros países e construir um modelo que combine a eficiência da IA com a justiça da supervisão humana.
A pergunta não é se devemos usar IA para corrigir redações. É se vamos fazer isso com responsabilidade ou repetir, em escala industrial, os vieses que já existem na correção humana.