Types de scores dans l'évaluation

Il y a plusieurs façons de rendre compte des performances de test. Une variété de scores peut être utilisé lors de l'interprétation du test des élèves performance.Download Article
Scores
Raw
Le score brut est le nombre d'éléments d'un étudiant répond correctement sans ajustement pour deviner. Par exemple, s'il y a 15 problèmes sur un test d'arithmétique, et un étudiant répond 11 correctement, le score brut est 11. Les scores bruts, cependant, ne nous fournissent pas assez d'informations pour décrire la performance des élèves.

scores en pourcentage

Un score en pourcentage est le pour cent des items de test répondu correctement. Ces scores peuvent être utiles pour décrire la performance d'un étudiant sur un test des enseignants-fait ou sur un test critériée. Toutefois, les scores de pourcentage ont un inconvénient majeur: Nous avons aucun moyen de comparer le pourcentage correct d'un test avec le pourcentage correct sur un autre test. Supposons qu'un enfant a obtenu un score de 85 pour cent correct sur un test et 55 pour cent correct sur un autre test. L'interprétation de la note est liée au niveau des éléments de test sur chaque test de difficulté. Parce que chaque test a un niveau de difficulté différent ou unique, nous avons aucun moyen commun d'interpréter ces résultats; il n'y a pas de cadre de référence.

Pour interpréter les scores bruts et les scores de pourcentage correcte, il est nécessaire de changer le score brut ou pourcentage à un type de score différent afin de faire des comparaisons. Les évaluateurs utilisent rarement les scores bruts et les scores de pourcentage correcte lors de l'interprétation des performances, car il est difficile de comparer les scores d'un étudiant sur plusieurs tests ou la performance de plusieurs étudiants à plusieurs tests.
Scores dérivés

scores dérivés sont une famille de scores qui nous permettent de faire des comparaisons entre les résultats des tests. Les scores bruts sont transformés en scores dérivés. scores de développement et les scores de position relative sont deux types de scores dérivés. Scores de position relative comprennent percentiles, les scores standard, et stanines.

Parfois appelé l'âge et de qualité équivalents, les scores de développement sont les scores qui ont été transformées à partir des scores bruts et reflètent la performance moyenne
développement Scores à des niveaux d'âge et de qualité. Ainsi, le score brut de l'étudiant (nombre d'éléments corrects) est le même que le score brut moyen pour les étudiants d'un âge ou de grade spécifique. équivalents de l'âge sont écrits avec un trait d'union entre les années et les mois (par exemple, 12 – 4 signifie que l'équivalent d'âge est de 12 ans et 4 mois). Un point décimal est utilisé entre le grade et le mois en équivalents de qualité (par exemple, 1.2 est la première année, deuxième mois)

scores de développement peuvent être utiles (McLean, Bailey, &. Wolery, 1996; Sattler, 2001). Les parents et les professionnels interprètent facilement les et placez-les performances des élèves dans un contexte. En raison de la facilité d'interprétation erronée de ces scores, les parents et les professionnels doivent les aborder avec une extrême prudence. Il y a un certain nombre de raisons pour critiquer ces scores.

Pour un étudiant qui est âgé de 6 ans et en première année, le grade et l'âge équivalents présumer que pour chaque mois de la première année d'un montant égal de l'apprentissage se produit. Mais, de notre connaissance de la croissance de l'enfant et le développement et les théories sur l'apprentissage, nous savons que ni la croissance ni l'apprentissage se produit à des intervalles mensuels égaux. Âge et de grade équivalent ne tiennent pas compte de la variation de la croissance et de l'apprentissage individuel.
Les enseignants ne devraient pas attendre à ce que les élèves acquièrent un grade équivalent équivalent ou l'âge d'un an pour chaque année qu'ils sont à l'école. Par exemple, supposons un enfant a obtenu un grade équivalent de 1,5, la première année, cinquième mois, à la fin de la première année. Pour supposer que, à la fin de la deuxième année, l'enfant doit obtenir un grade équivalent de 2,5, la deuxième année, le cinquième mois, est pas une bonne pratique. Cette hypothèse est incorrecte pour deux raisons: (1) La qualité et l'âge des normes équivalentes ne doivent pas être confondus avec les normes de performance, et (2) un gain de 1,0 grade équivalent est représentatif seulement des étudiants qui sont dans la moyenne pour leur grade. Les étudiants qui sont supérieurs à la moyenne gagnera plus de 1,0 grade équivalent d'un an, et les étudiants qui sont inférieurs à la moyenne progresseront moins de 1,0 grade équivalent par an. (Gronlund & Linn, 1990)

Une deuxième critique du développement scores est l'idée sous-jacente que parce que deux étudiants obtiennent le même score sur un test, ils sont comparables et affichent les mêmes schémas pensée, le comportement et les compétences. Par exemple, un étudiant qui est en deuxième année a obtenu un score grade équivalent de 4,6 sur un test de rendement en lecture. Cela ne signifie pas que la deuxième niveleuse comprend le processus de lecture telle qu'elle est enseignée dans la quatrième année. Au contraire, cet étudiant juste effectué à un niveau supérieur pour un étudiant qui est en deuxième année. Il est incorrect de comparer la deuxième niveleuse à un enfant qui est en quatrième année; la comparaison doit être faite à d'autres étudiants qui sont en deuxième année (Sattler, 2001).
Une troisième critique des scores de développement est que l'âge et de qualité équivalents encouragent l'utilisation de fausses normes. Un enseignant du second degré ne devrait pas attendre de tous les élèves de la classe pour effectuer au niveau du second degré sur un test de lecture. Les différences entre les élèves dans une classe signifie que la gamme de réalisation couvre en fait plusieurs grades. De plus, les scores de développement sont calculés de telle sorte que la moitié des scores tombent en dessous de la chute médiane et la moitié au-dessus de la médiane. L'âge et de grade équivalents ne sont pas des normes de performance.

Une quatrième critique de l'âge et de qualité équivalents est qu'ils favorisent la pensée typologique. L'utilisation de l'âge et de qualité équivalents nous amène à penser en termes d'un kindergartener typique ou d'un type de 10 ans. En réalité, les étudiants varient dans leurs capacités et niveaux de performance. scores de développement ne prennent pas ces variations en compte
.
Un cinquième critique est que la plupart des scores de développement sont interpolées et extrapolées. Un test normé comprend les élèves d'âges et de grades spécifiques — tous les âges et de grades — dans l'échantillon de Norming. L'interpolation est le processus d'estimation des résultats des élèves dans les âges et les qualités de l'échantillon de Norming. Extrapolation est le processus d'estimation de la performance des élèves en dehors des âges et qualités de l'échantillon de référence.

Developmental Quotient

Un quotient de développement, une estimation du taux de développement. Si nous savons l'âge de développement de l'élève et l'âge chronologique, il est possible de calculer un quotient de développement. Par exemple, supposons que l'âge de développement d'un étudiant est de 12 ans (12 ans 12 mois dans une année = 144 mois) et l'âge chronologique est également de 12 ans, ou 144 mois. En utilisant la formule suivante, nous arrivons à un quotient de développement de 100.

L'âge de développement 144 mois /âge chronologique 144 mois x 100 = 100

144/144 X 100 = 100

1/1 X 100 = 100

Mais, supposons que l'âge chronologique d'un autre étudiant est également 144 mois et que l'âge de développement est de 108 mois. En utilisant la formule, cet étudiant aurait un quotient de développement de 75

L'âge de développement 108 mois /âge chronologique X 100 = 75

108/144 X 100 = 75

quotients de développement ont tous les inconvénients liés à l'âge et de qualité équivalents. En outre, ils peuvent être trompeurs, car l'âge de développement ne peut pas suivre le rythme avec l'âge chronologique que l'individu vieillit. Par conséquent, l'écart entre l'âge de développement et l'âge chronologique devient plus grand que l'étudiant vieillit.

Partitions de permanent relative

rangs centiles Un rang centile est le point d'une distribution au niveau ou au-dessous duquel le scores d'un pourcentage donné d'élèves tombent. Percentiles fournissent des informations sur la position relative des étudiants par rapport à l'échantillon de normalisation. Regardez les résultats des tests suivants et leurs rangs centiles correspondants.
Score étudiant percentile Rang Delia 96 84 Jana 93 81 Pete 90 79 Marcus 86 75
Le score de Jana de 93 a un rang centile de 81. Cela signifie que 81 pour cent des étudiants qui ont pris le test marqué 93 ou moins. Dit autrement, Jana a marqué aussi bien ou mieux que 81 pour cent des étudiants qui ont pris le test.

Un rang centile de 50 représente la performance moyenne. Dans une distribution normale, la moyenne et la chute médiane au 50e percentile. La moitié des étudiants tombent au-dessus du 50e percentile et la moitié sont inférieurs. Percentiles peuvent être divisés en quartiles. Un quartile contient 25 percentiles ou 25 pour cent des scores dans une distribution. Le 25e et les 75e percentiles sont le premier et le troisième quartiles. En outre, les percentiles peuvent être divisés en groupes de 10 appelés déciles. Un décile contient 10 percentiles. Commençant au bas d'un groupe d'étudiants, le premier 10 pour cent sont connus comme le premier décile, la seconde 10 pour cent sont connus comme le deuxième décile, et ainsi de suite.

La position de percentiles dans une courbe normale est représenté sur la figure 4.5. En dépit de leur facilité d'interprétation, percentiles ont plusieurs problèmes. Tout d'abord, les intervalles qu'ils représentent sont inégales, en particulier au niveau des extrémités inférieure et supérieure de la distribution. Une différence de quelques points de percentile aux extrémités de la distribution est plus grave qu'une différence de quelques points dans le milieu de la distribution. Deuxièmement, les percentiles ne sont pas applicables à des calculs mathématiques (Gronlund & Linn, 1990). Enfin, les scores centiles sont rapportés dans un centièmes. Mais, en raison d'erreurs liées à la mesure, ils ne sont exacts à 0,06 (six centièmes) le plus proche (Rudner, Conoley, & Plake, 1989). Ces limitations nécessitent l'utilisation de prudence dans l'interprétation rangs centiles. Les intervalles de confiance, qui sont discutés plus loin dans ce chapitre, sont utiles lors de l'interprétation des scores percentile.

Scores standard Un autre type de partition dérivé est un score standard. Le score standard est le nom donné à un groupe ou une catégorie de scores. Chaque type de score standard au sein de ce groupe a la même moyenne et le même écart-type. Parce que chaque type de score standard a la même moyenne et le même écart-type, les scores standard sont une excellente façon de représenter la performance d'un enfant. scores standard nous permettent de comparer les performances d'un enfant sur plusieurs tests et de comparer la performance d'un enfant à la performance des autres élèves. Contrairement scores centiles, les scores standards fonctionnent dans des opérations mathématiques. Par exemple, les scores standard peuvent être en moyenne. Dans l'instantané, les enseignants Lincoln Bates et Sari Andrews discuter les résultats des tests. Comme on le voit, les scores standard sont les scores d'intervalle égaux. Les différents types de notes standard, dont certains nous discutons dans les paragraphes suivants, sont:

z-scores: avoir une moyenne de 0 et un écart-type de 1.

T-scores: avoir une moyenne de 50 et un écart type de 10.

déviation scores de QI: une moyenne de 100 et un écart-type de 15 ou 16.

équivalents normaux de la courbe: avoir une moyenne de 50 et un écart type de 21.06

stanines:.. bandes de pointage standards divisent une distribution des scores en neuf parties

percentile classe: point d'une distribution au niveau ou au-dessous duquel le scores d'un pourcentage donné d'élèves tombent.

Déviation scores IQ Déviation Déviation scores de QI sont fréquemment utilisés pour signaler le rendement des élèves aux tests standardisés normatifs. Les scores de déviation du
Wechsler Intelligence Scale for Children – III
et
Wechsler Individual Achievement Test – II
ont une moyenne de 100 et un écart-type de 15, tandis que le
Stanford -Binet Intelligence Scale –. IV
a une moyenne de 100 et un écart type de 16. de nombreux manuels de test fournissent des tables qui permettent la conversion des scores bruts aux scores écart de QI

courbe normale équivalents équivalents normaux de la courbe ( RCE) un type de score standard avec une moyenne de 50 et un écart type de 21.06. Lorsque la ligne de base de la courbe normale est divisé en 99 unités égales, les rangs centiles de 1, 50 et 99 sont les mêmes que les unités des RCE (Lyman, 1986). Un test qui fait rapport RCE est le développement Inventaire 2.Toutefois, RCE ne sont pas signalés pour certains tests.

stanines stanines sont des bandes de notes standard qui ont une moyenne de 5 et un écart-type de 2. stanines compris entre 1 et 9. en dépit de leur relative facilité d'interprétation, stanines présentent plusieurs inconvénients. Un changement en quelques points de score brut peut déplacer un élève d'une stanine à l'autre. Aussi, parce que stanines sont d'une manière générale d'interpréter les performances du test, la prudence est nécessaire lors de la classification et de placement des décisions. Pour aider à interpréter stanines, les évaluateurs peuvent assigner des descripteurs à chacune des valeurs 9:

9 —
très supérieure
8 —
supérieure
7 — très bon

6 — bonne

5 —
moyen
4 — ci-dessous
moyenne
3 — considérablement en dessous
moyenne
2 — pauvres

1 — très pauvre

Basal et niveaux de plafond

de nombreux tests, parce que les auteurs de test construisent eux pour les étudiants de capacités différentes, contiennent plus d'éléments que nécessaire. Pour déterminer les points de départ et d'arrêt pour l'administration d'un test, les auteurs de test désignent les niveaux basales et plafond. (Même si ce sont vraiment pas les types de scores, les niveaux basales et plafond sont parfois appelées règles ou des scores). Le niveau de base est le point au-dessous de laquelle l'examinateur suppose que l'étudiant pouvait obtenir toutes les réponses correctes et, par conséquent, il est le point que l'examinateur commence le test.

le manuel d'essai désignera le point où l'essai doit commencer. Par exemple, un test manuel indique, " Les élèves qui sont âgés de 13 ans devraient commencer par l'article 12. Continuer l'essai lorsque trois éléments dans une rangée ont été répondu correctement. Si trois points dans une rangée ne sont pas répondu correctement, l'examinateur doit retomber un niveau ". Ceci est le niveau basal.

Regardons l'exemple de l'étudiant qui a 9 ans. Bien que l'examinateur commence à tester au 9 ans niveau, l'étudiant ne parvient pas à répondre correctement à trois dans une rangée. Ainsi, l'examinateur est incapable d'établir un niveau de base au point de début suggéré. De nombreux manuels enseignent l'examinateur de poursuivre les essais en arrière, laissant tomber en arrière d'un élément à la fois, jusqu'à ce que l'étudiant répond correctement à trois points. Certains manuels d'essai instruisent examinateurs de retomber un niveau entier, par exemple, à 8 ans, et commencer à tester. Lors du calcul de score brut de l'étudiant, l'examinateur comprend des éléments ci-dessous le point de base comme des éléments répondu correctement. Ainsi, le score brut comprend tous les éléments à l'élève a répondu correctement ainsi que les items de test en dessous du point de base. Le niveau du plafond est le point au-dessus duquel l'examinateur suppose que l'étudiant obtiendrait toutes les réponses incorrectes si le test devait se poursuivre; il est, par conséquent, le point où l'examinateur arrête les tests. &Quot; Pour déterminer un plafond, " un manuel peut lire, " interrompre l'essai lorsque trois éléments dans une rangée ont été manquées ".

Un faux plafond peut être atteint si l'examinateur ne suit pas attentivement les directions pour déterminer le niveau du plafond. Certains tests demandent aux élèves de compléter une page d'éléments de test pour établir le niveau du plafond.

Previous:Analyse des erreurs de mathématiques
Next:Norm-Référencé Tests

Articles Liés

Articles Liés Family Education Ecole Enfants Différent Child Education

Types de scores dans l'évaluation

More Articles

Popular Articles

Articles Liés