Goda tester gör att barnen misslyckas - här är varför

Anonim

Många föräldrar och lärare är kritiska till de standardiserade bedömningstest (SAT) som nyligen tagits av barn i grundskolan. Ett vanligt klagomål är att de är för svåra. Lärare på min sons skola skickade barnhem med exempelfrågor för att quizera sina föräldrar, i hopp om att visa att få full poäng är nästan omöjligt.

När föräldrar försöker utföra dessa tester fokuserar de alltid på de svåraste eller förvirrande sakerna. Vissa föräldrar och lärare kan höras klaga på sociala medier att om de får frågor fel, är testen för tioåriga för tuffa.

Men hur svårt borde tester för barn vara?

Som psykolog vet jag att vi har några välutvecklade principer som kan hjälpa oss att ta upp frågan. Om vi ​​tittar på SAT som åtgärder av någon form av underliggande förmåga, kan vi vända oss till en av de äldsta grenar av psykologi - "psykometri" - för lite vägledning.

Få det bara rätt

Ett bra test ska inte vara för hårt. Om de flesta får de flesta frågor fel har du det som kallas "golv effekt". Resultatet är att du inte kan berätta någon skillnad i förmågan mellan de personer som tar testet.

Om vi ​​började skoldagens höjdhopp med baren på två meter höga (nära världsrekordet), då skulle vi avsluta sportdagen med alla att få samma - noll lyckade hopp - och ingen information om hur bra någon är på höjdhopp.

Men samtidigt bör ett bra test inte vara för lätt. Om de flesta får allt rätt, så är effekten, som du kan förvänta dig, kallad en "takeffekt". Om alla får allt rätt då får vi inte någon information från testet.

Nyckeltanken är att testen måste diskriminera. I psykometriska termer är värdet av ett test om matchningen mellan den sak som den ska mäta och svårigheten hos föremålen på provet. Om jag ville bestämma matematikförmåga hos sexåringar och jag gav dem alla en A-nivåpapper, kan vi anta att nästan alla skulle göra noll. Även om A-Nivå papperet kan vara ett bra test, är det helt uninformativt om det är dåligt anpassat till de personer som tar testet.

Här är rub: för att ett test ska vara känsligt för skillnader i förmåga måste det innehålla saker som människor blir felaktiga. Egentligen finns det ett exakt svar på den andel som du borde få fel - i det känsliga testet borde det vara hälften av föremålen. Frågor som du är 50% sannolikt kommer att få rätt är de som är mest informativa.

Hur vi känner för att mäta och märka barn enligt deras skicklighet vid provtagningen är en stor fråga, men det är viktigt att vi inser att det här är vad testen gör. Ett väl utformat test gör att alla barn får vissa saker fel - det är inneboende i deras design. Det är upp till oss hur vi konceptualiserar det: om testen är en onödig avledning från sann utbildning eller en nödvändig utmaning som vi alla måste utsättas för.

Bättre test?

Om du antar det här psykometriska perspektivet blir det klart att de tester vi använder är ett ineffektivt sätt att mäta varje enskilt barns speciella förmåga att göra testet. De flesta barn kommer att ställas en massa frågor som är för lätta för dem, innan de kommer till de informativa som ligger i kanten av deras förmåga. Då ska de fortsätta att försöka en massa frågor som är alltför svåra. Och synd om folket för vem testet är dåligt anpassat till sin förmåga och består mestadels av frågor som de kommer att få fel - vilket är både uninformativt i psykometriska termer och motverkar känslomässigt.

För hundra år sedan, när vi började vår moderna fixering med testning och mätning, var det svårt att undvika avfallet där många uninformativa och potentiellt deprimerande frågor ställdes. Det var helt enkelt för att alla barn var tvungna att ta samma examensarbete.

Idag kan emellertid examinatorerna administrera tester via dator och algoritmiskt identifiera de mest informativa frågorna för varje barns förmåga - göra testen kortare, mer exakt och mindre fokuserad på upplevelsen av misslyckande. Du kan lägga in tillräckligt enkla frågor som inget barn någonsin skulle ha erfarenhet av att få de flesta av frågorna fel. Men det finns fortfarande ingen anledning att veta att ett informativt test måste innehålla frågor som de flesta människor som sitter kommer att få fel.

Till och med ett bra test kan mäta en pedagogiskt irrelevant förmåga (som bara förmågan att göra testet, eller memorera abstrakta grammatikregler) eller användas på sätt som skadar barn. Men att ha svåra saker är inte ett problem med SAT, det är ett problem med alla tester.