Friday, November 02, 2007

Análise às notas dos exames do Secundário (I)

Decidi fazer uma análise econométrica às notas dos exames do secundário (como agora anoitece mais cedo, é um passatempo melhor do que ir fotografar vermes aquáticos).

Pegando na base de dados com os resultados dos exames ao 12º ano, foi buscar as notas dos exames de Matemática A (analisar só uma disciplina ultrapassa o problema referido pelo Luís Aguiar-Conraria e pelo Tarique, de diferentes disciplinas terem normalmente notas diferentes).

Retirei os exames feitos em escolas no estrangeiro, não só por espelharem uma realidade muito diferente da portuguesa, mas por uma razão mais prosaica: com eles teria 65.767 resultados, e uma folha de Excel só tem 65.536 linhas (limitando-me ao território nacional, temos 65.492 resultados, que já cabem na folha).

Numa primeira abordagem, vamos analisar o impacto das seguintes variáveis:

- Público/Privado
- Se o aluno é interno ou externo
- De que fase é o exame (1ª ou 2ª)
- Se o exame é para aprovação na cadeira
- Se o exame é para melhoria de nota
- Se o exame é para ingresso na universidade
- Sexo do aluno
- Idade

Outras variáveis, nº de exames por estabelecimento, caracterização social do concelho, etc., ficarão para próximos posts (quanto à origem social dos alunos, não poderá ser contabilizada, já que, como bem notou Francisco Louçã, essa informação não é disponibilizada).

Houve um exame (externo) na Escola Secundária Fontes Pereira de Melo, para ingresso no ensino superior, que não foi contabilizado, já que a idade do examinado (que teve zero valores) não consta dos dados.

Resultados:

R2 0,18

F 1844,73





variável

desvio t
Idade -1,99 0,09 -22,90
Sexo -2,23 0,34 -6,62
ParaIngresso 18,73 1,05 17,82
ParaMelhoria 6,17 0,74 8,31
ParaAprov -18,28 0,63 -29,23
Fase -1,30 0,37 -3,49
Interno 35,99 0,42 86,60
PubPriv
7,25 0,53 13,70
C 102,24 2,25 45,49

Conclusões:

A fórmula, no seu conjunto, tem pouco valor explicativo (um R2 de apenas 0,18); num entanto, cada uma das variáveis parece ser significante, a avaliar pelas estatísticas t (muito elevadas para todas elas).

Assim, conclui-se que:

- Os examinados tendem a ter menos 2 décimas no exame por cada ano de idade adicional
- As raparigas tendem a ter também menos 2 décimas que os rapazes (Matemática parece ser um caso bizarro nesse aspecto)
- Nos exames para ingresso, as notas tendem a ser mais elevadas 1 valor e 9 décimas do que nos outros (resultado previsível - são os melhores alunos que concorrem ao ensino superior)
- Nos exames para melhoria de nota, os resultados tendem a ser 6 décimas de valor mais altos (penso que também é um resultado previsível)
- Nos exames para aprovação, os resultados tendem a ser 1 valor e 8 décimas mais baixos (mais um resultado que não surpreende)
- Na segunda fase, os resultados tendem a ser 1 décima de valor mais baixos
- Nos exames internos, os resultados são 3 valores e 6 décimas mais altos (como seria de esperar)
- As escolas privadas tendem a ter mais 7 décimas de valor que as públicas (curiosamente, um valor muito próximo da diferença verificada nos "rankings" globais)

1 comment:

Tárique said...

Olá Miguel. Obrigado pela análise. Tenho andado a brincar com a tua folha de excel e tenho descoberto umas coisas interessantes. Que excelente serviço público que nos prestas!

Para quando uma análise dos resultados da Teixeira vs Liceu? ;) (parece que a disparidade nos resultados já foi assunto para muita conversa/polémica)

Voltei a tocar no assunto da Matemática, e sobre como o ranking premeia uma sobre-filtragem dos alunos aqui. Analiso o caso da escola do primeiro lugar do ranking, que não deixa alunos de 12 irem a exame para não baixarem a sua posição.

Parece que nossa alma mater ficou em #277. Ainda assim, nada mal para uma escola do Algarve :)