Wednesday, September 02, 2009

Prova de Matemática (II)

Como resolver a questão posta aqui: se o resultado esperado de cada aluno segue uma distribuição normal de média 12 e desvio-padrão 2 (ou seja variancia 4=2^2), a soma dos resultados de N alunos terá média 12*N e variancia 4*N (ou seja, desvio padrão 2*sqr(N)).
Assim, a média dos resultados de 50 alunos (o caso do CSTA) seguirá uma distribuição de média 12 e desvio padrão 2/sqr(50) = 0,28284271... ; já a média do resultado de 200 alunos (como na ESATA) será também de 12 mas o desvio padrão será 2/sqr(200) = 0,14142136...
Agora, para ver qual a probabilidade de a média de cada uma das instituições ser maior a 17, é só calcular qual a probabilidade de uma variável que segue uma distribuição normal de média 12 e desvio-padrão "d" ser maior que 17, que é igual a 1 - Φ([17-média]/desvio-padrão)
Para o CSTA: 1-Φ[(17-12)/[2/sqr(50)] = 3.11597e-070 [69 casas decimais e depois 311597...]
Para a ESATA: 1-Φ[(17-12)/[2/srq(200)] = 4.15009e-274 [273 casas decimais e depois 415...]
Uma conclusão geral é que a probabilidade de ter uma média elevada é maior para o CSTA do que para a ESATA (já que a média da ESATA, devido a ter mais alunos, tenderá a andar mais à volta do valor esperado - corolário da lei dos grandes números); já agora, a probabilidade do CSTA ter uma média muito baixa também é mais elevada...
O Tarique resolveu a questão (melhor do que eu); como prémio, não terá livros mas a glória: a glória de ter a sua fotografia no quadro de honra do Vento Sueste.



Mas isto era só uma introdução à pergunta seguinte. Vamos imaginar, além do CSTA e da ESATA, mais dois estabelecimentos de ensino: o Externato Internacional Águia Cobreira, com 70 alunos, e a Escola Secundária do Bairro Pontal, com 150 alunos.

Os alunos estão todos igualmente preparados nos quatro estabelecimentos (o resultado esperado, como na questão anterior, é 12 com um desvio-padrão de 2).

Vamos supor que, de acordo com os resultados desses alunos no tal exame nacional, iriamos ordenar estas 4 instituições num ranking (tendo como único critério a média da escola no exame).

Questão: qual é a probabilidade de cada uma destas instituições ser a primeira do ranking das quatro?

Diga-se que esta questão é um caso extremo de pedagogia não directiva, já que eu não sei como calcular essas probabilidades (isto é, sei a fórmula abstracta, mas não como a resolver efectivamente).

Caso esta questão seja insolúvel, uma questão mais simples: ordenar as escolas pelo grau de probabilidade de cada uma ser a melhor do ranking (ou seja, a segunda desta ordenação não é aquela necessariamente que tem a maior probabilidade de ficar em segundo no ranking, mas sim aquela que tem a segunda maior probabilidade de ficar em primeiro).

Divirtam-se.

11 comments:

Tárique said...

Eu diria que cada uma tem 0.25% de probabilidade de ser melhor que a outra.

Anonymous said...

digo: que todas as outras

Anonymous said...

ups, mais uma gralha: 25% de probabilidade.

Isto porque as escolas que têm mais prob de terem média de >17 também são as que têm mais prob de terem média <7.

Para saber a prob de uma escola ter melhor média que a outra:

std=2; mu=12;

std1 = sqrt(std^2/num_alunos1);
std2 = sqrt(std^2/num_alunos2);

quad(@(x)normPDF(x,mu,std1)*normCDF(x,mu,std2),0,20) == 0.5 , para qualquer num_alunos1 e num_alunos2

Miguel Madeira said...

"Eu diria que cada uma tem [25%] de probabilidade de ser melhor que [todas as outras]."

Vamos simplificar um bocadinho o exercicio mas continuar a assumir distribuições simétricas, média igual para todos e diferentes desvios-padrão (o que penso não altera o essencial).

Vamos supor que há 50% de probabilidades da escola A ter uma média de 11 valores e 50% de ter uma média de 13.

Para a escola B, 10 ou 14 valores; para a C, 9 ou 15; para a D, 8 ou 16 (em todos os casos, a probabilidade é de 50% para cada hipotese).

Qual a probabilidade de cada uma ser a melhor do ranking? Será 25% para cada uma?

Anonymous said...

sim

Anonymous said...

ou melhor, não. deste-me em que pensar.

Tárique said...

Resposta ao problema do post

Probabilidades de terem a melhor média:

CSTA: 31.287058% (50 alunos)
EIAC: 27.950953% (70 alunos)
ESBA: 21.365129% (150 alunos)
ESATA: 19.396857% (200 alunos)


Se quiseres envio-te o script de matlab. Abraço

Tárique said...

Resposta ao problema do comentário:

D: 50%
C: 25%
B: 12.5%
A: 12.5%

Anonymous said...

Ou seja, substitui notas por idade da morte, preparação por "cuidados de saúde" e voilá: o bill O'Reilly tinha razão e a Palmira estava enganada!

Anonymous said...

Ou talvez não porque se fizermos o mesmo exercício para a probabilidade de ficarem pior classificadas, o resultado é o mesmo ...

Miguel Madeira said...

Pois, isto só tem efeito (ou efeito aparente) se compararmos mais de duas entidades (e não apenas os EUA com o Canadá).

Isto é, mesmo com mais de duas entidades, as entidades com menos gente têm tanto maior probabilidade de ficar em primeiro como em último. Mas como normalmente presta-se mais atenção aos casos de sucesso do que aos fracassos...