Há muitas maneiras de relatar o desempenho no teste. Uma variedade de pontuação pode ser usado na interpretação do teste dos alunos performance.Download artigo
-primas Scores
A pontuação bruta é o número de itens de um aluno responde corretamente sem ajuste para adivinhar. Por exemplo, se existem 15 problemas em um teste de aritmética, e um estudante responde a 11 corretamente, então o escore bruto é 11. escores brutos, no entanto, não nos fornecer informações suficientes para descrever o desempenho dos alunos.
Pontuações percentuais
a pontuação percentual é a porcentagem de itens de teste respondidas corretamente. Estes resultados podem ser úteis para descrever o desempenho do aluno em um teste feito pelo professor ou por um teste referenciado por critérios. No entanto, as pontuações percentuais têm uma grande desvantagem: Nós não temos nenhuma maneira de comparar a porcentagem correta em um teste com a porcentagem correta em outro teste. Suponha que uma criança obteve uma pontuação de 85 por cento correto em um teste e 55 por cento correto em outro teste. A interpretação da pontuação está relacionada com o nível de dificuldade dos itens do teste em cada teste. Porque cada teste tem um nível diferente ou única de dificuldade, não temos nenhuma maneira comum para interpretar essas pontuações; não há nenhum quadro de referência.
Para interpretar escores brutos e pontuações percentuais correto, é necessário para mudar o placar cru ou percentual para um tipo diferente de pontuação, a fim de fazer comparações. Os avaliadores raramente usam escores brutos e pontuações percentuais correto ao interpretar o desempenho, porque é difícil comparar os resultados de um aluno em vários testes ou o desempenho de vários alunos em vários testes.
Scores Derivados
pontuações derivadas são uma família de pontuações que nos permitem fazer comparações entre os resultados dos testes. escores brutos são transformados para pontuações derivadas. pontuações de desenvolvimento e dezenas de posição relativa dois tipos de pontuações derivadas. Dezenas de posição relativa incluem percentis, escores padronizados, e stanines.
Desenvolvimento Scores
Às vezes chamados de idade e grau equivalentes, as pontuações de desenvolvimento são dezenas que foram transformadas a partir de escores brutos e refletem o desempenho médio em níveis etários e grau. Assim, escore bruto do aluno (número de itens corretos) é o mesmo que a pontuação média cru para estudantes de idade ou grau específico. equivalentes de idade são escritas com um hífen entre anos e meses (por exemplo, 12 – 4 significa que o equivalente a idade é 12 anos e 4 meses de idade). Um ponto decimal é utilizado entre o grau eo mês em equivalentes de qualidade (por exemplo, 1.2 é o primeiro grau, segundo mês)
pontuações desenvolvimento podem ser úteis (McLean, Bailey, &. Wolery, 1996; Sattler, 2001). Pais e profissionais facilmente interpretá-los e colocar o desempenho dos alunos dentro de um contexto. Devido à facilidade de má interpretação destas contagens, os pais e os profissionais devem abordá-los com extrema cautela. Há uma série de razões para criticar essas pontuações.
Para um estudante que é de 6 anos de idade e nos primeiros equivalentes grau, classe e idade presumir que para cada mês do primeiro grau uma quantidade igual de aprendizagem ocorre. Mas, do nosso conhecimento do crescimento e desenvolvimento infantil e as teorias sobre a aprendizagem, sabemos que nem o crescimento nem a aprendizagem ocorre em intervalos mensais iguais. Idade e grau equivalentes não levam em consideração a variação no crescimento e aprendizagem individual.
Os professores não devem esperar que os alunos ganharão um equivalente equivalente ou idade grau de um ano para cada ano que eles estão na escola. Por exemplo, suponha que uma criança ganhou um equivalente grau de 1,5, de primeiro grau, quinto mês, no final do primeiro grau. Supor que no final da segunda série a criança deve obter um equivalente grau de 2,5, segundo grau, quinto mês, não é uma boa prática. Esta suposição é incorreta, por duas razões: normas equivalentes (1) O grau e de idade não devem ser confundidos com os padrões de desempenho, e (2) um ganho de 1,0 grau equivalente representa apenas os estudantes que estão na faixa média para a sua classe. Os alunos que estão acima da média vai ganhar mais do que 1,0 grau equivalente de um ano, e os estudantes que estão abaixo da média vai progredir menos de 1,0 grau equivalente por ano. (Gronlund & Linn, 1990)
Uma segunda crítica de desenvolvimento pontuação é a ideia subjacente de que, porque dois estudantes obter a mesma pontuação em um teste que eles são comparáveis e irá exibir os mesmos padrões de pensamento, o comportamento ea habilidade. Por exemplo, um estudante que está na segunda série obteve uma pontuação equivalente grau de 4,6 em um teste de realização da leitura. Isso não significa que o segundo aluno compreende o processo de leitura como é ensinada na quarta série. Em vez disso, este estudante acabou de realizar em um nível superior para um estudante que está na segunda série. É incorreto comparar o segundo grader para uma criança que está na quarta série; a comparação deve ser feita com outros estudantes que estão na segunda série (Sattler, 2001).
Uma terceira crítica dos escores de desenvolvimento é que a idade e grau equivalentes incentivar o uso de falsos padrões. A professora da segunda série não deve esperar que todos os alunos da classe para executar no nível de segundo grau em um teste de leitura. As diferenças entre alunos dentro de uma classe significa que o intervalo de realização, na verdade, se estende por vários graus. Além disso, as pontuações de desenvolvimento são calculadas de modo que a metade das pontuações cair abaixo da queda mediana e meia acima da mediana. Idade e grau equivalentes não são padrões de desempenho.
A quarta crítica da idade e grau equivalentes é que eles promover o pensamento tipológico. O uso de idade e grau equivalentes nos leva a pensar em termos de um kindergartener típico ou um típico 10-year-old. Na realidade, os estudantes variam em suas habilidades e níveis de desempenho. pontuações de desenvolvimento não tomar estas variações em consideração.
Um quinto crítica é que a maioria das contagens de desenvolvimento são interpolados e extrapolados. Um teste normalizado inclui estudantes de idades e qualidades específicos — nem todas as idades e graus — na amostra de normatização. Interpolação é o processo de estimar a pontuação dos estudantes dentro das idades e graus de amostra normatização. A extrapolação é o processo de estimar o desempenho dos alunos fora das idades e graus da amostra normativa.
Developmental Quociente
Um quociente de desenvolvimento uma estimativa da taxa de desenvolvimento. Se sabemos idade de desenvolvimento do aluno e idade cronológica, é possível calcular um quociente de desenvolvimento. Por exemplo, suponha idade de desenvolvimento de um aluno é de 12 anos (12 anos 12 meses em um ano = 144 meses) e a idade cronológica é também de 12 anos, ou 144 meses. Usando a seguinte fórmula, chegamos a um quociente de desenvolvimento de 100.
Idade Developmental 144 meses /A idade cronológica 144 meses X 100 = 100
144/144 X 100 = 100
1/1 X 100 = 100
Mas, suponhamos que a idade cronológica de outro aluno também é de 144 meses e que a idade de desenvolvimento é de 108 meses. Usando a fórmula, este estudante teria um quociente de desenvolvimento de 75.
Idade Developmental 108 meses /A idade cronológica X 100 = 75
108/144 X 100 = 75
quocientes de desenvolvimento têm todos os inconvenientes associados com a idade e grau equivalentes. Além disso, eles podem ser enganosa, porque idade de desenvolvimento não pode manter o ritmo com a idade cronológica como o indivíduo fica mais velho. Por conseguinte, a diferença entre a idade de desenvolvimento e idade cronológica torna-se maior à medida que o aluno fica mais velho.
Dezenas de posição relativa
percentil classifica um percentil é o ponto em uma distribuição igual ou inferior a qual o pontuações de uma determinada percentagem de estudantes cair. Percentis fornecer informações sobre a posição relativa dos estudantes quando comparado com a amostra de padronização. Olhe para os seguintes resultados dos testes e suas fileiras percentuais correspondentes.
Score Student Percentile Posto Delia 96 84 Jana 93 81 90 79 Pete Marcus 86 75
pontuação de 93 de Jana tem uma classificação de percentil de 81. Isto significa que 81 por cento dos estudantes que fizeram o teste marcou 93 ou inferior. Dito de outra forma, Jana marcou tão bem ou melhor do que 81 por cento dos estudantes que fizeram o teste.
A classificação percentual de 50 representa desempenho médio. Em uma distribuição normal, tanto a média como a queda média no percentil 50. Metade dos alunos caem acima do percentil 50 e metade queda abaixo. Os percentis podem ser divididos em quartis. A quartil contém 25 percentis ou 25 por cento das pontuações em uma distribuição. O 25º e os 75º percentis são o primeiro eo terceiro quartis. Além disso, os percentis podem ser divididos em grupos de 10 conhecidos como decis. Um decil contém 10 percentis. Começando na parte inferior de um grupo de estudantes, o primeiro de 10 por cento são conhecidos como o primeiro decil, segundo a 10 por cento são conhecidos como o segundo decil, e assim por diante.
A posição de percentis em uma curva normal é mostrada na Figura 4.5. Apesar da sua facilidade de interpretação, percentis têm vários problemas. Em primeiro lugar, os intervalos que eles representam são desiguais, especialmente nas extremidades inferiores e superiores da distribuição. Uma diferença de alguns pontos percentuais nas extremidades extremas da distribuição é mais grave do que uma diferença de alguns pontos no meio da distribuição. Em segundo lugar, percentis não se aplicam aos cálculos matemáticos (Gronlund & Linn, 1990). Última, as pontuações percentuais são relatados em centésimos. Mas, por causa dos erros de medição associados com, eles só são precisos para a 0,06 (seis centésimos) mais próxima (Rudner, Conoley, & Plake, 1989). Estas limitações exigem o uso de cautela ao interpretar fileiras percentuais. intervalos de confiança, que são discutidas mais adiante neste capítulo, são úteis quando interpretar as pontuações percentuais.
escores padronizados Outro tipo de indicador derivado é uma pontuação padrão. escore padrão é o nome dado a um grupo ou categoria de pontuação. Cada tipo específico de pontuação padrão dentro deste grupo tem a mesma média e desvio padrão da mesma. Como cada tipo de pontuação padrão tem a mesma média e o mesmo desvio padrão, escores padronizados são uma excelente forma de representar o desempenho de uma criança. escores padronizados nos permitem comparar o desempenho de uma criança em vários testes e comparar o desempenho de uma criança para o desempenho de outros alunos. Ao contrário de dezenas de percentis, escores padronizados funcionar em operações matemáticas. Por exemplo, escores padronizados podem ser calculadas. No Snapshot, os professores Lincoln Bates e Sari Andrews discutir os resultados dos testes. Como é evidente, a pontuação padrão são pontuação igual intervalo. Os diferentes tipos de escores padronizados, alguns dos quais serão discutidos nas subseções a seguir, são:
z-score: tem uma média de 0 e um desvio padrão de 1.
T-scores: tem uma média de 50 e um desvio padrão de 10.
pontuações de QI desvio: tem uma média de 100 e um desvio padrão de 15 ou 16.
equivalentes curva normal: tem uma média de 50 e um desvio padrão de 21,06
Stanines:.. bandas escore padrão dividem a distribuição dos escores em nove partes
percentil fileiras: ponto de uma distribuição igual ou inferior a qual o pontuações de uma determinada percentagem de estudantes cair.
pontuações de QI de desvio de QI Scores Desvio Desvio são frequentemente usados para relatar o desempenho dos alunos em testes padronizados-referenciada norma. Os escores de desvio do
Escala de Inteligência Wechsler para Crianças – III
e
Wechsler Individual Achievement Teste – II
têm uma média de 100 e um desvio padrão de 15, enquanto o
Stanford -Binet Intelligence Scale –. IV
tem uma média de 100 e um desvio padrão de 16. Muitos manuais de teste fornecem tabelas que permitem a conversão dos escores brutos às pontuações desvio de QI
curva normal equivalentes equivalentes curva normal ( ENC) um tipo de pontuação padrão com uma média de 50 e um desvio padrão de 21,06. Quando a linha de base da curva normal é dividido em 99 unidades iguais, as fileiras de percentil de 1, 50, e 99 são as mesmas que as unidades NCE (Lyman, 1986). Um teste que faz relatório ENC é a Developmental Inventory-2.Todavia, ENC não são relatados para alguns testes.
Stanines Stanines são faixas de escores padronizados que têm uma média de 5 e um desvio padrão de 2. Stanines variam de 1 a 9. Apesar da sua relativa facilidade de interpretação, stanines têm várias desvantagens. Uma mudança em apenas alguns pontos de escore bruto pode mover um estudante de um stanine para outro. Também, porque stanines são uma maneira geral de interpretar o desempenho do teste, é necessário cautela na tomada de decisões de classificação e colocação. Como uma ajuda na interpretação stanines, os avaliadores podem atribuir descritores para cada um dos valores 9:
9 — muito superiores
8 — superiores
7 — muito bom
6 — boa
5 — média
4 — abaixo da média
3 — consideravelmente abaixo da média
2 — pobre
1 — muito pobre
basal e Níveis de teto
Muitos testes, porque os autores do teste construí-los para estudantes de diferentes capacidades, contêm mais itens do que o necessário. Para determinar os pontos de partida e de parada para administrar um teste, os autores do teste designar níveis basais e de teto. (Embora estes não são realmente tipos de pontuações, os níveis basais e teto são às vezes chamados de regras ou pontuações.) O nível basal é o ponto abaixo do qual o examinador assume que o aluno pode obter todas as respostas corretas e, portanto, é o ponto em qual o examinador começa a testar.
o manual teste vai designar o ponto em que o teste deve começar. Por exemplo, um teste estados manuais, " Os estudantes que são 13 anos de idade deve começar com o item 12. Continue testes quando três itens em uma fileira foram respondidas corretamente. Se três itens em uma fileira não são respondidas corretamente, o examinador deve cair de volta um nível. &Quot; Este é o nível basal.
Vejamos o exemplo do estudante que é de 9 anos de idade. Embora o examinador começa a testar no nível 9-year-old, o aluno não consegue responder corretamente três em uma fileira. Assim, o examinador é incapaz de estabelecer um nível basal no ponto de início sugerido. Muitos manuais instruir o examinador para continuar os testes para trás, caindo para trás um item de cada vez, até que o aluno responde corretamente três itens. Alguns manuais de teste instruir os examinadores a cair para trás um nível inteiro, por exemplo, para 8 anos, e começar a testar. Ao calcular pontuação bruta do aluno, o examinador inclui itens abaixo do ponto basal como itens respondidos corretamente. Assim, a pontuação bruta inclui todos os itens que o estudante acertar mais os itens de teste abaixo do ponto basal. O nível máximo é o ponto a partir do qual o examinador assume que o estudante obteria todas as respostas incorretas se o teste fosse para continuar; é, por conseguinte, o ponto em que o examinador pára o teste. &Quot; Para determinar um teto, " um manual pode ler, " interromper o teste quando três itens em uma fileira foram perdidas ".
Um tecto falso pode ser alcançado se o examinador não seguir cuidadosamente as direções para a determinação do nível do teto. Alguns testes exigem que os alunos para completar uma página de itens de teste para estabelecer o nível do teto.