Ci sono molti modi di segnalazione performance del test. Una varietà di punteggi possono essere utilizzati quando si interpretano i test di studenti performance.Download articolo
prime punteggi
Il punteggio grezzo è il numero di elementi uno studente risponde correttamente senza aggiustamento per indovinare. Ad esempio, se ci sono 15 problemi su un test di aritmetica, e uno studente risponde correttamente 11, quindi il punteggio grezzo è 11. punteggi grezzi, tuttavia, non ci forniscono informazioni sufficienti per descrivere le prestazioni degli studenti.
percentuale punteggi
Un punteggio percentuale è la percentuale di elementi di prova risposto correttamente. Questi punteggi possono essere utili per descrivere le prestazioni di uno studente in un test insegnante-made o su un test su criteri di riferimento. Tuttavia, i punteggi percentuali hanno un grande svantaggio: Non abbiamo modo di confrontare la percentuale corretta su un test con la percentuale corretta su un altro test. Supponiamo che un bambino ha guadagnato un punteggio di 85 per cento corretta su una prova e il 55 per cento corretto su un altro test. L'interpretazione della partitura è legata al livello di difficoltà degli elementi di prova su ciascun test. Poiché ogni prova ha un livello diverso o unico di difficoltà, non abbiamo modo comune di interpretare questi punteggi; non vi è alcun quadro di riferimento.
Per interpretare punteggi grezzi ei punteggi percentuali-corretta, è necessario cambiare il punteggio grezzo o la percentuale a un diverso tipo di punteggio, al fine di fare confronti. I valutatori raramente utilizzano punteggi grezzi ei punteggi percentuali-corretto quando si interpretano le prestazioni, perché è difficile confrontare i punteggi di uno studente su più prove o le prestazioni di diversi studenti su diversi test.
Spartiti derivati
punteggi derivati sono una famiglia di punteggi che ci permettono di fare confronti tra i punteggi dei test. punteggi grezzi vengono trasformati in punteggi derivati. decine e decine di posizione relativa dello sviluppo sono due tipi di punteggi derivati. Decine di posizione relativa
Sviluppo punteggi
A volte chiamati età e il grado equivalenti, i punteggi di sviluppo sono decine che sono state trasformate da punteggi grezzi e riflettono la performance media includono percentili, punteggi standard, e stanines. a livelli di età e grado. Così, punteggio grezzo dello studente (numero di elementi corretti) è lo stesso del punteggio grezzo medio per gli studenti della stessa età o grado specifico. equivalenti età sono scritti con un trattino tra anni e mesi (ad esempio, 12 – 4 significa che l'età equivalente è di 12 anni, 4 mesi di età). Un punto decimale viene utilizzato tra il grado e il mese in equivalenti di grado (per esempio, 1.2 è il primo grado, secondo mese)
punteggi dello sviluppo possono essere utili (McLean, Bailey, &. Wolery, 1996; Sattler, 2001). I genitori ed i professionisti con facilità interpretano loro e posizionare il rendimento degli studenti all'interno di un contesto. A causa della facilità di errata interpretazione di queste colonne sonore, i genitori e gli operatori dovrebbero avvicinarli con estrema cautela. Ci sono una serie di ragioni per criticare questi punteggi.
Per uno studente che è di 6 anni e nel primo grado, di grado e di età equivalenti presumere che per ogni mese di primo grado si verifica una quantità uguale di apprendimento. Ma, dalla nostra conoscenza della crescita del bambino e lo sviluppo e le teorie circa l'apprendimento, sappiamo che né la crescita né l'apprendimento avviene in intervalli mensili uguali. Età e il grado equivalenti non prendono in considerazione la variazione di crescita individuale e di apprendimento.
Gli insegnanti non devono aspettarsi che gli studenti acquisiscono un grado equivalente equivalente o all'età di un anno per ogni anno che sono a scuola. Ad esempio, supponiamo che un bambino ha guadagnato un grado equivalente di 1,5, prima elementare, quinto mese, al termine della prima elementare. Supporre che alla fine della seconda elementare il bambino dovrebbe ottenere un grado equivalente di 2,5, secondo grado, quinto mese, non è buona pratica. Questa ipotesi non è corretta per due ragioni: (1) il grado e di età norme equivalenti non devono essere confusi con gli standard di prestazioni, e (2) un guadagno di 1,0 grado equivalente è rappresentativo solo di studenti che sono nella gamma media per il loro grado. Gli studenti che sono sopra la media guadagnerà più di 1,0 grado equivalente di un anno, e gli studenti che sono sotto la media progrediranno meno di 1,0 grado equivalente di un anno. (Gronlund & Linn, 1990)
Una seconda critica di sviluppo punteggi è l'idea di fondo che causa due studenti ottengono lo stesso punteggio in un test sono comparabili e verranno visualizzati gli stessi schemi di pensiero, di comportamento, e di abilità. Ad esempio, uno studente che si trova in seconda elementare ha guadagnato un punteggio equivalente grado di 4,6 su una prova di lettura realizzazione. Ciò non significa che il secondo grader comprende il processo di lettura come è insegnato nella quarta elementare. Piuttosto, questo studente appena eseguita a un livello superiore per uno studente che è in seconda elementare. Non è corretto confrontare la seconda elementare di un bambino che è in quarta elementare; il confronto dovrebbe essere fatto per gli altri studenti che sono in seconda elementare (Sattler, 2001).
Una terza critica dei punteggi di sviluppo è che età e il grado equivalenti incoraggiare l'uso di standard falsi. Un insegnante di secondo grado non devono aspettarsi tutti gli studenti della classe per svolgere a livello di secondo grado su una prova di lettura. Le differenze tra gli studenti all'interno di un grado significano che la gamma di realizzazione si estende in realtà diversi gradi. Inoltre, i punteggi di sviluppo sono calcolati in modo tale che la metà dei punteggi scende sotto la caduta mediana e mezzo sopra la mediana. Età e il grado equivalenti non sono standard di performance.
Una quarta critica di età e il grado equivalenti è che essi promuovono il pensiero tipologico. L'uso di età e il grado equivalenti ci fa pensare in termini di un kindergartener tipico o un tipico 10-year-old. In realtà, gli studenti variano nelle loro capacità e livelli di prestazioni. punteggi dello sviluppo non prendono queste variazioni in considerazione.
Un quinto critica è che la maggior parte dei punteggi di sviluppo sono interpolati e estrapolati. Un test normato comprende studenti di età specifici e gradi — non tutte le età e gradi — nel campione norming. L'interpolazione è il processo di stima delle decine di studenti all'interno di età e gradi del campione norming. L'estrapolazione è il processo di stima del rendimento degli studenti al di fuori delle età e gradi del campione normativo.
quoziente di sviluppo
Un quoziente di sviluppo una stima del tasso di sviluppo. Se sappiamo età evolutiva di uno studente e l'età cronologica, è possibile calcolare un quoziente di sviluppo. Per esempio, supponiamo età evolutiva di uno studente è di 12 anni (12 anni 12 mesi in un anno = 144 mesi) e l'età cronologica è anche di 12 anni, o 144 mesi. Utilizzando la seguente formula, si arriva ad un quoziente di sviluppo di 100.
età evolutiva 144 mesi /età cronologica 144 mesi x 100 = 100 |
144/144 X 100 = 100 |
1/1 X 100 = 100 |
Ma, supponiamo che l'età cronologica di un altro studente è anche 144 mesi e che l'età evolutiva è di 108 mesi. Utilizzando la formula, questo studente avrebbe un quoziente di sviluppo di 75.
età evolutiva 108 mesi /età cronologica X 100 = 75
108/144 x 100 = 75
quozienti di sviluppo hanno tutti gli svantaggi associati con l'età e grado equivalenti. Inoltre, essi possono essere fuorviante, perché l'età evolutiva non può tenere il passo con l'età cronologica come l'individuo invecchia. Di conseguenza, il divario tra età evolutiva ed età cronologica diventa più grande come lo studente ottiene più vecchio.
Decine di posizione relativa
percentile fila un rango percentile è il punto in una distribuzione pari o inferiore quale il decine di una determinata percentuale di studenti cadono. Percentili forniscono informazioni sulla posizione relativa degli studenti se confrontato con il campione di standardizzazione. Guardate i seguenti punteggi dei test e dei loro ranghi percentili corrispondenti.
Student punteggio percentile Classifica Delia 96 84 93 81 Jana Pete 90 79 86 75 Marcus
Il punteggio di Jana di 93 ha un rango percentile di 81. Ciò significa che l'81 per cento degli studenti che hanno preso il test ha segnato 93 o più basso. Detto in altro modo, Jana ha segnato così come o meglio di 81 per cento degli studenti che hanno preso il test.
Un rango percentile di 50 rappresenta performance media. In una distribuzione normale, sia la media e la caduta mediano al 50 ° percentile. La metà degli studenti cadono al di sopra del 50 ° percentile e la metà caduta sotto. Percentili possono essere suddivisi in quartili. Un quartile contiene 25 percentili o il 25 per cento dei punteggi in una distribuzione. Il 25 e il 75 ° percentile sono il primo e il terzo quartile. Inoltre, percentili possono essere suddivisi in gruppi di 10 noti come decile. Un decile contiene 10 percentili. Cominciando dal fondo di un gruppo di studenti, il primo 10 per cento sono noti come il primo decile, il secondo 10 per cento sono noti come secondo decile, ecc.
La posizione di percentili in una curva normale è mostrato in Figura 4.5. Nonostante la loro facilità di interpretazione, percentili hanno diversi problemi. Innanzitutto, gli intervalli che rappresentano sono disuguali, specialmente alle estremità inferiore e superiore della distribuzione. A differenza di alcuni punti percentili agli estremi della distribuzione è più grave di una differenza di qualche punto nel mezzo della distribuzione. In secondo luogo, percentili non si applicano ai calcoli matematici (Gronlund & Linn, 1990). Ultimo, punteggi percentili sono riportati in una centesimi. Ma, a causa di errori associati alla misura, sono accurate solo al più vicino 0,06 (sei uno-centesimi) (Rudner, Conoley, & Plake, 1989). Queste limitazioni richiedono l'uso di cautela nell'interpretazione ranghi percentili. Gli intervalli di confidenza, che sono discussi più avanti in questo capitolo, sono utili quando si interpretano i punteggi percentili.
I punteggi standard Un altro tipo di punteggio derivato è un punteggio standard. punteggio standard è il nome dato ad un gruppo o categoria di punteggi. Ogni tipo specifico di punteggio standard all'interno di questo gruppo ha la stessa media e la stessa deviazione standard. Poiché ogni tipo di punteggio standard ha la stessa media e la stessa deviazione standard, punteggi standard sono un ottimo modo di rappresentare le prestazioni di un bambino. punteggi standard ci permettono di confrontare le prestazioni di un bambino su diversi test e per confrontare le prestazioni di un bambino per le prestazioni di altri studenti. A differenza di punteggi percentili, punteggi standard funzionano in operazioni matematiche. Per esempio, i punteggi standard possono essere mediati. Nel Snapshot, insegnanti Lincoln Bates e Sari Andrews discutere i punteggi dei test. Come è evidente, i punteggi standard sono uguali punteggi intervallo. I diversi tipi di punteggi standard, alcuni dei quali discuteremo nelle seguenti sottosezioni, sono:
z-score: avere una media di 0 e una deviazione standard di 1.
T-score: hanno una media di 50 e una deviazione standard di 10.
punteggi deviazione IQ: hanno una media di 100 e una deviazione standard di 15 o 16.
equivalenti curva normale: hanno una media di 50 e una deviazione standard di 21.06
Stanines:.. bande di punteggio standard dividono una distribuzione dei punteggi in nove parti
percentile ranghi: punto in una distribuzione pari o inferiore quale il decine di una determinata percentuale di studenti cadono.
QI Deviazione IQ punteggi Deviazione Deviazione sono frequentemente utilizzati per segnalare le prestazioni degli studenti nei test standardizzati norma-referenziati. I punteggi di deviazione del
Wechsler Intelligence Scale for Children – III
e
Wechsler Individual Achievement Test – II
hanno una media di 100 e una deviazione standard di 15, mentre il
Stanford -Binet intelligence Scale –. IV
ha una media di 100 e una deviazione standard di 16. Molti manuali di test fornire tabelle che consentono la conversione di punteggi grezzi ai punteggi QI deviazione
curva normale equivalenti equivalenti curva normale ( NCEs) un tipo di punteggio standard con una media di 50 e una deviazione standard di 21.06. Quando la linea di base della curva normale è divisa in 99 unità uguali, i ranghi percentili di 1, 50, e 99 sono le stesse unità NCE (Lyman, 1986). Un test che fa rapporto NCEs è il Developmental Inventory-2.However, NCEs non sono segnalati per alcuni test.
Stanines Stanines sono bande di punteggi standard che hanno una media di 5 e una deviazione standard di 2. Stanines variare da 1 a 9. Nonostante la loro relativa facilità di interpretazione, stanines hanno diversi svantaggi. Un cambiamento in pochi punti punteggio grezzo può muovere uno studente da un stanine ad un altro. Inoltre, poiché stanines sono un modo generale di interpretare le prestazioni di prova, la cautela è necessaria quando si prendono decisioni di classificazione e di collocamento. Come aiuto nell'interpretazione stanines, i valutatori possono assegnare descrittori a ciascuno dei 9 valori:
9 —
molto superiore
8 —
superiore
7 — molto buona qualità
6 — buona qualità
5 —
media
4 — seguente
media
3 — notevolmente inferiore
media
2 — povero
1 — molto povera
basale e dei massimali
Molti test, perché gli autori di prova li costruiscono per gli studenti di abilità diverse, contengono più elementi che sono necessari. Per determinare i punti di partenza e di arresto per la somministrazione di un test, gli autori dei test indicano livelli basali e soffitto. (Anche se questi sono in realtà non tipi di colonne, livelli basali e soffitto sono talvolta chiamati regole o colonne.) Il livello basale è il punto di sotto del quale l'esaminatore assume che lo studente potrebbe ottenere tutte le risposte corrette e, quindi, è il punto in che l'esaminatore inizia test.
il manuale di prova designerà il punto in cui il test deve iniziare. Ad esempio, un test manuale indica, " Gli studenti che sono 13 anni dovrebbero iniziare con voce 12. Continuare a testare quando tre elementi in una fila sono state risposto correttamente. Se tre elementi in una fila non si risponde correttamente, l'esaminatore dovrebbe cadere indietro di un livello. &Quot; Questo è il livello basale.
Vediamo l'esempio dello studente che è di 9 anni. Anche se l'esaminatore inizia collaudo in 9 anni di livello, lo studente non riesce a rispondere correttamente tre di fila. Così, l'esaminatore è in grado di stabilire un livello basale al punto di inizio suggerito. Molti manuali istruiscono l'esaminatore per continuare il test all'indietro, lasciando cadere indietro di un elemento alla volta, fino a quando lo studente risponde correttamente tre elementi. Alcuni manuali di test istruiscono gli esaminatori a cadere di nuovo un intero livello, ad esempio, di 8 anni, e iniziare il test. Nel calcolo punteggio grezzo dello studente, l'esaminatore include elementi di sotto del punto basale come elementi risposto correttamente. Così, il punteggio grezzo include tutti gli elementi che lo studente ha risposto correttamente, più gli elementi di prova sotto il punto basale. Il livello del soffitto è il punto oltre il quale l'esaminatore presume che lo studente ottenere tutte le risposte errate se il test dovesse continuare; è, quindi, il punto in cui l'esaminatore ferma test. &Quot; Per determinare un soffitto, " un manuale può leggere, " interrompere il test quando tre elementi in una fila sono state perse ".
Un controsoffitto può essere raggiunto se l'esaminatore non segue con attenzione le indicazioni per la determinazione del livello del soffitto. Alcuni test richiedono agli studenti di completare una pagina di elementi di prova per stabilire il livello del soffitto.