Monday, November 05, 2007

Análise às notas dos exames do Secundário (IX)

Comparando as regressões estimadas nos últimos posts, parece-me que os resutados mais relevantes (em função do valor do R2) são mesmo os que usam a "Idade" como variável explicativa (em lugar de "Para Aprovação" e "Interno") - ou seja, a complicação que eu decidi introduzir não levou a nenhuma alteração dos resultados!

Como eu desconfio da validade da variável "fase", parece-me que o melhor cálculo é este:

R20,31

F64,69





variável:
desviot
Nº de exames0,020,013,56
poder compra0,160,0210,47
Idade-9,830,99-9,94
PubPriv
5,831,783,28
C248,9517,3714,33

No entanto, se não concordarem com as minhas reservas à "Fase", o melhor resultado será este.

[Nota: a correlação entre "Idade" e "poder de compra" é de 0,311; isso talvez possa indicar um problema de "multicolineriedade" - é um valor maior que, digamos, o R2. No entanto, o,31 já me parece uma correlação suficientemente baixa e, de qualquer forma, outros sintomas típicos da multicolineriedade, como um R2 elevado mas "estatisticas t" pouco significativas, não aparecem - pelo contrário, temos um R2 baixo mas estatisticas t significativas. Assim, vou aceitar esta regressão como válida]

Analisando melhor este cálculo, ele parece indicar que, das variáveis consideradas, a mais importante (em termos de estatística t) para os resultados finais é o poder de compra do concelho, depois a idade dos examinados (quanto mais novos, melhores resultados), o número de exames (quanto mais exames, melhores resultados) e, finalmente, a escola ser pública ou privada.

Seja como for, globalmente, esta fórmula explica pouco - estas variáveis apenas explicam 31% do resultado final; os outros 69% serão da responsabilidade de outras variáveis não contabilizadas, das características especificas de cada escola ou de cada aluno, etc.

De qualquer forma, há variáveis que não foram contabilizadas (já que eu não as tinha à mão) e poderiam ser úteis: habilitações dos pais dos alunos (ou, quanto muito, o nivel médio de habilitações dos pais dos alunos dessa escola, mesmo que não necessariamente dos alunos que foram a exame), percentagem de alunos que foram a exame, percentagem de alunos por escola beneficiários da Acção Social Escolar, etc; talvez fosse também boa ideia ter usado duas variáveis distintas para as escolas privadas: uma para as privadas em regime "liberal" e outra para as privadas com contrato de associação.

Finalmente, no que respeita à caracterização do concelho, usei também a "população" e uma espécie de "taxa de urbanização" mas apresentaram menor significância estatística do que o "poder de compra".

2 comments:

Gasel said...

è interessante toda esta "evolução" de resultados.
Mas para além das variaveis que disse faltarem serem analisadas, acrescento todas as relacionadas com o corpo docente, q penso ser mt importantes: idade media, media de anos de ensino, média de anos na escola, ... etc

Miguel Madeira said...

Aviso que vou refazer o cálculo porque fiz uma coisa que pode ter distorcido os resultados.