Didaktické testy v současné škole

10. února 2010 v 8:14 | Prof.PhDr.Rudolf Kohoutek,CSc.
Didaktické testy (zkoušky) jsou jednou z metod ke zvýšení efektivity a racionalizace kontrolního prověřování a hodnocení vědomostí žáků, ke zvýšení objektivity výchovně vzdělávací práce učitele a nepřímo i ke zvýšení efektivity učební činnosti žáků.

Didaktické testy jsou zdrojem důležitých informací pro učitele, žáky, rodiče žáků apod. Musí být ovšem dobře naplánovány, zkonstruovány, ověřeny (upraveny) a správně používány.
Sestavit správný a vyhovující didaktický test není snadné. Především je třeba dát každému testovanému žákovi příležitost, aby mohl podat v testu seriozní výkon, zajistit všem testovaným přiměřené a stejné podmínky pro vypracování testových úkolů a omezit na nejnižší míru působení náhodných vlivů. Také způsoby hodnocení testu musí být přesně vymezeny. Jenom tak se stane didaktický test zkouškou založenou na vědeckých poznatcích a postupech, zkouškou spolehlivou, přesnou a výstižnou, se srovnatelnými výsledky.
Didaktické testy měří výsledky výuky, jak si žák osvojil školní učivo, zejména vědomosti a dovednosti.
V anglosaských zemích se zkoušky ke zjišťování výsledků vyučování nazývají testy pedagogické, resp. též testy vědomostí či testy výkonové.
Současné didaktické testy sledují jednak vědomosti žáků, jednak stav rozvoje jejich poznávacích funkcí (dovednost myšlenkové analýzy, syntézy, kritického hodnocení atp.).
V pedagogické praxi lze pro běžnou potřebu přezkoušení žáků používat nestandardizovaných didaktických testů, které sice musí vyhovovat základním pravidlům pro konstrukci přesných poznávacích nástrojů, ale často nevyhovují výkonnostním populačním normám a není u nich empiricky zjišťovaná validita. V případech důkladněji provedených nestandardizovaných textů nebo jen částečně standardizovaných testů se hovoří o testech kvazi standardizovaných.
Naproti tomu standardizované didaktické testy jsou sestavovány zpravidla týmy odborníků, v nichž je vedle specialistů daného vyučovacího předmětu také statistik, psycholog, metodik apod. Standardizované didaktické testy jsou ověřovány a normovány na větších souborech či výběrech žáků. Umožňují vyjádřit výkon individuálně testované osoby ve vztahu k výkonům dané populace.
Nízkou úroveň běžných zkoušek způsobuje často fakt, že většina konstruktérů takových testů nemá dostatečné vědomosti a dovednosti z oblasti tvorby didaktických testů a neuvědomuje si, jaké parametry musí dobrý didaktický test splňovat.
Klasifikace testů
V současné české pedagogice a psychologii se užívají např. klasifikace testů podle S. Vrány, M. Michaličky a P. Byčkovského.
Vrána, S.
Český prvorepublikový reformní pedagog Stanislav Vrána (1888-1966) rozděluje testy takto:
1. Podle toho, co zjišťují:
a) Inteligenční, zaměřené na zjišťování schopností zkoumaných osob.
b) Didaktické, sloužící ke zjišťování vědomostí a dovedností, které žák získal učením.
2. Podle způsobu zpracování:
a) Informační, které sestavuje učitel, aby zjistil, co se žáci naučili, jak učivu porozuměli a jak je ovládli.
b) Standardizované, sestavené podle přesně dodržovaných principů konstrukce, ověřené na reprezentativním vzorku, s předem stanoveným klíčem pro jejich hodnocení a normami sloužícími ke správné interpretaci výsledků.
3. Podle účelu:
a) Zkušební, které slouží k hodnocení vědomostí žáků.
b) Diagnostické, zaměřené na zjišťování kladů a nedostatků ve vědomostech žáků a na zjišťování příčin nedostatků.
c) Kontrolní, které si dává žák sám.
4. Podle způsobu užití:
a) Hromadné, kterými je prověřován větší počet žáků najednou.
b) Individuální, k ověřování vědomostí a dovedností jednoho žáka.
Podle M. Michaličky lze pedagogické (didaktické) testy rozdělit podle principů konstrukce na tři skupiny:
1. volných odpovědí (nestandardizované). Je to v podstatě zdokonalená forma tradičního písemného zkoušení, kdy žáci podle vlastního uvážení odpovídají na několik stanovených otázek či řeší několik úkolů.
2. objektivně informační. Sestavuje je učitel, ředitel nebo jiný školský pracovník, a to již podle zásad pro přípravu testů standardizovaných. Mají zejména funkci kontrolní a klasifikační.
3. standardizované, sestavené podle závazně stanovených a přísně dodržovaných konstrukčních principů. Zpravidla jde o týmovou práci odborníků. Jsou produktem vysokého stupně profesionální dovednosti a jsou opatřeny propracovanými tabulkami norem.
P. Byčkovský třídí didaktické testy podle osmi hledisek:
1. Podle měření charakteristiky výkonu:
a) rychlosti - jestliže didaktickým testem měříme rychlost, kterou je žák schopen provést určitý výkon.
b) úrovně - pokud testem zjišťujeme kvalitu (úroveň) výkonu.
2. Podle stupně dokonalosti přípravy testu a jeho příslušenství:
a) standardizované - jsou připravovány týmově a profesionálně. Vydávají je většinou specializované instituce.
b) nestandardizované (učitelské, neformální) - připravují si je učitelé sami pro svoji potřebu.
c) kvazistandardizované - tj. částečně standardizované.
3. Podle povahy činnosti testovaného:
a) kognitivní - pokud didaktický test měří úroveň (kvalitu) poznávání žáků.
b) psychomotorický - pokud testem zjišťujeme výsledky psychomotorického učení (např. psaní na stroji či počítači).
4. Podle míry specifičnosti učení zjišťovaného testem:
a) výsledků výuky - měří to, co se žáci v dané oblasti naučili.
b) studijních předpokladů - měří úroveň obecnějších charakteristik jedince, které jsou potřebné k dalšímu studiu (např. intelektovou výkonnost).
5. Podle toho, jakým způsobem interpretujeme výkon testovaného:
a) rozlišující - výkon jedince se určuje vzhledem k populaci testovaných.
b) ověřující - výkon se určuje vzhledem k populaci úloh, které učivo reprezentují.
6. Podle časového zařazení do výuky:
a) Vstupní - jsou zadávány na začátku výuky určitého celku.
b) Průběžné - zadávají se v průběhu výuky a jejich posláním je poskytovat učiteli informace potřebné k optimálnímu řízení výuky.
c) Výstupní- zadávají se buď na konci výukového období, nebo na konci určitého celku a většinou poskytují informace potřebné pro hodnocení.
7. Podle rozsahu obsahového zaměření:
a) Monotématické - prověřují jediné téma učební látky.
b) Polytématické - prověřují učivo několika tématických celků.
8. Podle stupně objektivity skórování:
a) objektivně skórovatelné - obsahují úlohy, u nichž lze objektivně rozhodnout, zda byly řešeny správně či nikoliv.
b) subjektivně skórovatelné - u nichž není možno stanovit předpis pro skórování.
Je vhodné (existuje-li nebezpečí opisování a napovídání mezi žáky), když jsou utvořeny alespoň dvě varianty didaktického testu (varianta A a B). Je možno např. zaměnit pořadí nabízených odpovědí v obou variantách.
Požadavky na didaktické testy
Didaktické testy musí být podobně jako psychologické testy:
objektivní,
standardní,
přiměřeně obtížné,
spolehlivé,
platné (validní),
kvantitativně i kvalitativně interpretovatelné,
senzibilní,
úsporné (ekonomické)
a administrované všem zkoumaným osobám stejně.
Objektivnost
Objektivnost didaktického testu je dána stupněm, mírou jeho nezávislosti na osobnosti učitele. Přispívá k jednoznačnosti výsledků, protože omezuje nebezpečí, že by pedagog bezděčně zkreslil fakta, aby získal žádoucí výsledky.
Objektivity didaktického textu dosáhneme, jestliže:
a) všechny položky jsou jednotné a formulované tak, aby na ně mohla být dána jednoznačná odpověď. Jednoznačně formulované otázky usnadňují jednoznačné odpovědi.
b) Jednotlivé odpovědi je možno hodnotit tak, aby při opakovaném hodnocení téže odpovědi dvěma či více vzájemně nezávislými posuzovateli bylo toto hodnocení shodné (tedy nezávislé na subjektivním názoru učitele).
c) Celkový výkon žáka bude posuzován podle předem stanovených kritérií a norem tak, aby jiný posuzovatel zhodnotil výkon téhož žáka stejně. Vhodná jsou např. pravidla binárního skórování a hodnocení podle systému konstruovaných klasifikačních norem na základě vypočtených percentilových hodnot pro zkoumanou skupinu.
Standardnost
Standardností rozumíme požadavek, aby byla identická metoda používána u různých osob za stejných vnějších podmínek. Předpokládá to unifikaci (sjednocení) všech důležitých podmínek vyšetření: stejné úkoly, stejnou případnou instrumentalizaci, dodržování instrukce a postupu, jakož i stejné vyhodnocování výsledků u všech zkoumaných osob. Všechny tyto požadavky směřují k tomu, aby bylo možno srovnávat získané výsledky u různých žáků. Dodržení těchto podmínek určuje také míru validity a spolehlivosti metody.
Testové zadání je vhodné vložit do polyetylénové fólie a žáci by měli psát pouze do záznamových archů. Tím se uspoří mnoho papíru. Pro vyhodnocování didaktických testů je vhodné využívat vyhodnocovacích šablon.
Přiměřená obtížnost
Přiměřenou obtížnost (snadnost) didaktického testu zjišťujeme statistickým rozborem testu. Používáme výpočtu indexu obtížnosti testu (Pi), který je vyjádřen relativním skóre, a to nejčastěji v procentech.
Index obtížnosti didaktického testu mívá hodnoty v intervalu 0 až 100 %. Optimální hodnota indexu obtížnosti (snadnosti) se pohybuje kolem 50 %. Nejvyšší hodnota indexu obtížnosti (snadnosti) udává, že všichni žáci řešili všechny úkoly správně.
Index obtížnosti lze vyjádřit např. v této formě:
počet žáků, kteří položku řešili správně
Pi =
počet žáků, kteří položku řešili
Násobíme-li hodnotu Pi číslem 100, dostaneme procento žáků, kteří položku vyřešili správně. Čím je Pi větší, tím je daná položka snazší. V další úpravě didaktického testu se obvykle velmi snadné nebo velmi obtížné položky vylučují. Je však nutno vyvarovat se toho, aby byly vyloučeny i položky prověřující základní učivo. Základní učivo by měli zvládnout velmi dobře všichni žáci.
Spolehlivost
Spolehlivostí (reliabilitou) didaktického testu rozumíme, nakolik registruje konsistentně, stabilně. Spolehlivost tedy znamená např. stálost výsledku v čase. Jestliže test opakujeme po nějaké době a získáme úplně jiné výsledky, pak je málo spolehlivý. Délku odstupu ověřování znalostí touže metodou musíme vždy uvádět.
Spolehlivost lze zkoumat v podstatě třemi způsoby:
1. Srovnáním výsledků opakovaného užití metody u těchže osob, pokud lze předpokládat, že se mezitím nezměnila sledovaná vlastnost.
2. Srovnáním výsledků dvou ekvivalentních forem metody, např. dvou forem dotazníku nebo výsledků dvou pozorovatelů chování.
3. Rozdělením záznamu na dvě poloviny a srovnáním separátních výsledků obou polovin, např. porovnáním odpovědí na liché a sudé otázky dotazníku.
Spolehlivost zpravidla zjišťujeme korelačním koeficientem mezi dvěma řadami měření u skupiny zkoumaných osob. Koeficient spolehlivosti lze interpretovat jako procento. Tak při koeficientu spolehlivosti 0,7 lze přičíst na vrub náhodných chyb 30 procent variace výsledků a při koeficientu 0,5 dokonce 50 procent.
Testy, které mají vysokou reliabilitu, jsou málo ovlivněny náhodnými vlivy (např. momentální psychosomatickou kondicí, vnějšími podmínkami).
Reliabilita je rovněž tím vyšší, čím je test citlivější a čím je snadnější.
U nestandardizovaných testů je za postačující hodnotu koeficientu reliability považována hodnota 0,6.
Validita
Validitou (platností, adekvátností) metody rozumíme, nakolik měří to, co měřit má. Je dána stupněm nezávislosti měření na systematických i náhodných chybách. Závisí kromě jiného na objektivnosti a spolehlivosti metody. Přitom však platí, že poměrně validní, byť i méně objektivní metoda je lepší než zcela objektivní, ale málo validní metoda.
U didaktických testů jde především o tzv. teoretickou obsahovou validitu testu. Zkoumá se, jak dalece se shoduje obsah testu s cílem, osnovami a obsahem vyučování. Obsah testu by proto měl být reprezentativním vzorkem učiva.
Většinou musíme ověřovat validitu souběžně empiricky. Lze tak učinit porovnáním výsledků měření s nějakým kriteriem správnosti, o kterém nepochybujeme. Na validitu testu můžeme usuzovat např. na základě korelace výsledků didaktického testu se školními známkami. Pomocí stanovení korelace výsledků didaktického testu s pololetní či závěrečnou známkou z daného předmětu se zjišťuje tzv. souběžná validita.
Empirické validitě se také někdy říká validita praktická. Při použití testového souboru hovoříme o souhrnné validitě, která je definována jako pravděpodobnost shody výsledku didaktického testu s tím, co má být zjištěno.
Kvalitativní a kvantitativní interpretovatelnost a normalizace
Kvalitativně lze analyzovat takřka každý test. Zjistíme např., které položky testu byly nejobtížnější, kterých chyb se žáci nejčastěji dopouštěli apod. Někdy je vhodné sestavit posloupnost chybných řešení.
Možností kvantifikace rozumíme, že registrační technika dovoluje rozlišování různých stupňů sledované vlastnosti, nejen pouhou klasifikaci na přítomnost nebo nepřítomnost jevu. Teprve tehdy je metoda poměrně exaktním měřením. Měření dovoluje jemnější diferenciaci, než je běžná klasifikace, a usnadňuje srovnávání výsledků.
Statistickými početními operacemi s čísly lze získat také další informace o pozorovaných jevech.
Jestliže nediferencujeme úkoly v didaktickém testu podle závažnosti a považujeme je za rovnocenné, pak můžeme absolutní normy tvořit tak, že stanovíme pásma procent vyřešených úloh a přiřadíme jim známky.
Tvoření relativních norem je složitější. Postupujeme podle těchto kroků:
1. seřadíme hrubé skóre od nejmenšího dosaženého po nejvyšší a sepíšeme je do sloupce.
2. Připíšeme četnosti každé třídě, tzv. počet žáků, kteří dané hodnoty dosáhli.
3. Stanovíme kumulativní četnosti, které určíme tak, že k četnosti na každém kroku připočteme vždy součet všech předchozích četností. Poslední kumulativní četnost se pak rovná počtu všech žáků.
4. Každou kumulativní četnost dělíme počtem žáků N a násobíme stem - dostaneme tzv. percentily.
Z percentil můžeme zjednodušeně stanovit pásma školní klasifikační stupnice za předpokladu normálního rozložení výsledků (průměrných výsledků dosahuje nejvíce žáků a žáků symetricky ubývá jak směrem k nejlepším, tak směrem k nejhorším výsledkům).
Senzibilita
Senzibilita (citlivost či selektivnost) didaktického testu umožňuje zjistit i menší rozdíly v rozsahu a kvalitě naměřených vědomostí či dovedností. Diferencuje žáky s lepšími i horšími poznatky. Na citlivost didaktického testu můžeme usuzovat podle variability výsledků testu. Jestliže test slouží na rozlišení žáků (posluchačů) do skupin (lepší, horší), předpokládá se, že 75 % žáků dá správnou odpověď při výběrových odpovědích a 50 % žáků odpoví správně u testů s volnými odpověďmi. Počáteční otázky přitom mají být lehčí než otázky další, aby žák získal sebedůvěru.
Citlivost testu zjišťujeme při statistické analýze výsledků didaktického testu, a to podle rozložení (distribuce) skóre a podle variačního koeficientu. Čím je test citlivější, tím je vyšší hodnota variačního koeficientu. Ten vypočítáváme jako poměr směrodatné odchylky a průměrného hrubého skóre.
Úspornost
Úspornost (resp. ekonomičnost) didaktického testu znamená, že test má být pokud možno časově nenáročný a nenáročný na vyhodnocování (např. pomocí šablon) a také nenáročný pokud jde o finanční náklady (záznamové archy).
Pokud jde o testovací čas, vycházíme z času nutného na vypracování jednotlivých úloh (položek) didaktického testu. Čas potřebný pro vyřešení jedné úlohy se odhaduje takto:
- pro úlohy bez výpočtu 0,5 - 1 minuta
- pro úlohu s výpočty 1 - 3 minuty.
Za postačující se obvykle považuje čas, za který všechny testové úlohy zodpovědělo 80 % žáků.
Na úspornost testu má také vliv, zda používáme na odpovědi záznamové listy, nebo je značíme přímo do didaktického testu (což ovšem úsporné není).
Administrace didaktického testu
Všichni šetření žáci dostanou stejnou ústní i písemnou instrukci, stejné znění didaktického testu a stejný záznamový list. Časová náročnost testu by měla být v souladu s jednou vyučovací jednotkou. Každý žák by měl sedět samostatně v lavici. Kdo je hotový s testem, může ho odevzdat a opustit zkušební místnost.
Testové položky
Didaktický test je sestaven z jednotlivých testových úloh (položek). Testová položka (jednotlivá testová úloha) je tedy základní stavební jednotkou didaktického testu. Je to vlastně učební úloha speciálně formulovaná pro účely didaktického testování. Testová položka je zpravidla nositelkou určitého prvku učiva. Celý didaktický test je pak odrazem struktury daného prověřovaného celku učiva. Na kvalitě jednotlivých položek (úloh) didaktického testu závisí kvalita celého testu.
Stanislav Vrána (1888-1966) rozlišil šest základních forem testových úkolů (položek):
1. jednoslovné odpovědi.
2. doplňovací, vyžadující doplnění neúplné věty.
3. správnosti a nesprávnosti, vyžadující např. označení správnosti (S) a nesprávnosti (N) tvrzení.
4. několikeré volby, kdy žák má vybrat správný údaj z několika nabízených možností.
5. vzájemných vztahů čili "co k čemu náleží".
6. roztřiďovací, vyžadující roztřídění daných údajů podle určitého kriteria.
Naproti tomu M. Michalička uvádí pět základních typů testových položek:
1. Produkční, vyžadující vytvoření odpovědi žákem (krátké či delší odpovědi). Jde o tzv. otevřené úkoly.
2. Doplňovací, spočívající v neúplné větě (výroku), kterou mají žáci doplnit tak, aby dávala smysl.
3. Alternativní , jejichž řešení je založeno na výběru správné odpovědi ze dvou nabízených alternativ.
4. Položky s výběrem odpovědi z více možností, kdy žák vybírá správné řešení z více odpovědí, počet alternativ bývá 3 - 5.
5. Položky tzv. oboustranného výběru, kdy žák k určitému souboru výrazů, názvů apod. přiřazuje správné odpovědi z nabízených variant.
Typy uvedené pod čísly 2 - 5 jsou vlastně tvořeny tzv. uzavřenými úkoly.
Miroslav Chráska uvádí, že otevřené úlohy se mohou dále členit podle rozsahu požadované odpovědi na:
- široké, u nichž se požaduje rozsáhlejší odpověď;
- úzké, u nichž se vyžaduje vytvoření vlastní stručné a krátké odpovědi.
Otevřené úlohy se mohou dělit také na produkční (vyžadující odpověď ve formě slova, symbolů, čísla apod.) a doplňovací (vyžadující doplnění neúplné věty či výroku).
Uzavřené úlohy se mohou dělit na dichotomické, polytomické, přiřazovací a uspořádací.
U dichotomických úloh jsou žákovi předkládány dvě alternativní odpovědi s tím, že jedna je správná (např. ano - ne, správně - chybně apod.). Jejich nevýhodou je velká pravděpodobnost uhodnutí správné odpovědi. Aby se věrohodnost výsledků získaných testováním dichotomickými úlohami zvýšila, musí test těchto úloh obsahovat větší počet.
U polytomických úloh vybírá žák odpověď z několika nabízených alternativ. Nebezpečí náhodného uhodnutí správné odpovědi se zmenšuje s rostoucím počtem nabízených odpovědí. Jako jejich optimální počet se uvádí 4 - 5. Praxe se ustálila u čtyř nabízených odpovědí.
Nabízené odpovědi mohou mít několik forem, kdy žák vybírá:
- jednu správnou odpověď (nebo nejlepší či nejpřesnější odpověď);
- nesprávnou odpověď;
- několik správných odpovědí. V takovém případě hovoříme o vícenásobné odpovědi. Tato forma, která používá více variant správných odpovědí, komplikuje binární skórování výsledků a někdy odrazuje, ba i poškozuje testované osoby. Žáci např. důsledně označují za správné dvě alternativy, dvě odpovědi i u testových položek, které obsahují pouze jednu správnou odpověď, nebo u odpovědí, které mají dvě správné možnosti, uvádějí pouze jedinou).
U přiřazovacích úloh žák přiřazuje pojmy jedné množiny k pojmům množiny druhé. U uspořádaných úloh se od žáka požaduje, aby uspořádal prvky množiny pojmů jedné třídy do řady podle určitého kritéria.
Chráska a Byčkovský považují za úlohy objektivního typu úlohy, které lze objektivně skórovat, tzn. úlohy otevřené úzké a úlohy uzavřené.
Při konstrukci všech typů úkolů je třeba dbát podle V. Mužiče těchto obecných pokynů:
text úkolů musí být správný po gramatické stránce. V textu se nemají vyskytovat obtížná a nejasná slova. Je třeba vyhýbat se doslovným formulacím z učebnic, protože by to podporovalo formalismus v získávání vědomostí. V žádném případě nelze v úkolech připouštět jakoukoli dvojsmyslnost. Úkoly nesmějí být sestaveny tak, aby sugerovaly odpověď, nebo tak, aby bylo možno dospět ke správné odpovědi na základě logického úsudku o tom, jak byl úkol formulován nebo uspořádán. V úkolech se nesmějí objevovat "chytáky".
Je třeba používat spíš kvantitativních než kvalitativních výrazů. Mezi úkoly nesmí existovat taková spojitost, aby řešení jednoho úkolu umožňovalo řešení některého z dalších úkolů. Je třeba vyhýbat se úkolům, jejichž řešení je dosud předmětem vědecké diskuze.
Aby mohli být žáci navzájem srovnáváni, je nezbytně nutné, aby všichni řešili tytéž úlohy.
Byčkovský vypracoval také obecné doporučení pro konstrukci všech typů úloh:
úlohou testujte důležité učivo, které bylo předmětem výuky. Úlohu formulujte jasně a stručně, ale také úplně. Navrhujte úlohy navzájem nezávislé. Vyhněte se nezamýšleným nápovědím. Vyhněte se neadekvátním zdrojům obtížnosti. Používejte jednoduchého skórování úloh. Navrhujte úlohy v dostatečném počtu. Věnujte dostatečnou pozornost grafické stránce úlohy. Úlohy nechte vždy posoudit kompetentními osobami.
Často používaným druhem úloh v didaktických testech jsou úlohy polytomické.
Chráska, Byčkovský aj. uvádějí některá doporučení pro navrhování polytomických úloh:
Pravděpodobnost uhodnutí správné odpovědi lze v některých případech snížit užitím tzv. neurčité odpovědi (správná není uvedena).
Při navrhování distraktorů (nesprávných odpovědí) většinou vycházíme z logické úvahy anebo ze zkušeností s často se vyskytujícími chybami.
Otázky i odpovědi mají být stručné.
Ve formulaci úloh se vyhýbáme slovům, která by mohla sloužit jako nápověda.
Pokud se ve formulaci úlohy vyslovuje zápor, zvýrazníme ho např. podtrhnutím.
Soubor nabízených odpovědí k jedné úloze by měl být homogenní, tj. podobný obsahovým zaměřením i formou.
Distraktory se mohou navzájem překrývat nebo jinou formou vyjadřovat totéž.
Umístění správné odpovědi mezi distraktory se má volit zcela náhodně.
Navrhujeme jen takové distraktory, v nichž je předpoklad, že alespoň občas budou využívány.
Při používání úloh s vícenásobnou volbou odpovědí je nutno řešitele upozornit, že může být správných více odpovědí.
Při formulaci úloh s výběrem odpovědi dáváme přednost otázkám před neúplnými tvrzeními.
Jednotlivé testové položky je vhodné členit ve shodě s Bloomovou texonomií učebních úloh (tedy podle hlediska náročnosti).
Položky potom hodnotíme podle myšlenkových operací a taxonomie edukačních cílů Benjamina Samuela Blooma (1913-1999), které bude jejich řešení vyžadovat, např.:
pouze znalosti, pamětní reprodukci poznatků;
navíc porozumění poznatkům;
dovednost aplikovat osvojené poznatky;
dovednost analyzovat poznatky;
dovednost syntézy poznatků;
dovednost hodnotícího posouzení poznatků.
Snadněji se ovšem sestavují učební úlohy nižších kategorií, např. zjišťování kvantity osvojených vědomostí, pamětního osvojování poznatků, zjišťování, zda žáci dokáží aplikovat jednoduché i složitější vědomosti a myšlenkové operace se získanými poznatky.
Důležitý je také počet položek v testu. Čím má test více položek, tím může být spolehlivější (reliabilnější). Za dolní použitelnou hranici lze považovat deset úloh didaktického testu ( Řešátko).
Seriozní standardizovaný didaktický test by neměl mít méně než 40 položek. U nestandardizovaných didaktických testů, které si učitelé sestavují sami, postačí i 15 až 20 položek.
Dalším důležitým a často limitujícím faktorem, který ovlivňuje počet úloh v testu, je čas, který je možno (nebo který si přejeme) testování dát. Časově náročnější testy mívají čistý testovací čas 35 - 40 minut. Časově méně náročné tématické didaktické testy, které prověřují jednotlivá témata učiva, obyčejně vystačí s 15 - 20 minutami expozičního času. Orientační testy, které ověřují, zda žáci pochopili dílčí výklad (zadávají se obvykle na začátku nebo na konci vyučovací hodiny) zpravidla nepřesahují časový limit 10 minut.
Také věk zkoušených a jejich intelektuální a didaktická úroveň jsou činiteli ovlivňujícími počet úloh pro didaktický test.
Ve stejném časovém limitu pravděpodobně vyřeší více úloh úspěšný posluchač vysoké školy než student střední školy.
V. Mužič žádá, aby u testů, které měří úroveň vědomostí žáků, byl též limitován čas, tak aby 90 % žáků stačilo testem projít. Education Testing Service, vydávající didaktické testy, uvádí adekvátní čas, ve kterém projde 80 % testovaných celým testem.
Řešátko doporučuje určovat optimální čas na vypracování testu jako průměrný čas, který žáci při vypracovávání testu potřebovali, zvětšený o 25 - 50 %.
Příliš benevolentní časový limit by mohl být příčinou pokusů testovaných o opisování, a tak by se mohl stát zdrojem nespolehlivosti testových výsledků.
Hodnocení odpovědí na testové položky neboli skórování odpovědí se provádí většinou pomocí bodů. Jeden bod za správnou odpověď, žádná nebo chybná odpověď má nulu. Jde o tzv. nevážené skórování či skórování binární. Součtem bodů za správné řešení jednotlivých položek v testu získáme tzv. hrubé skóre, které se někdy nazývá také prosté skóre.
Výsledky testování je možno využít ke klasifikaci žáků. Klasifikace může být provedena na základě konstrukce klasifikačních norem pomocí percentilových hodnot vypočtených pro školní třídu. Celkové hrubé skóre se na standardní skóre či klasifikační stupně převádějí podle obvykle předem stanoveného transformačního klíče.
Nejjednodušší je, když je v testu každá položka tak elementární, že ji bodujeme pouze jedním bodem, je-li správně vyřešena. Někdy však závažnost testového úkolu vyžaduje, aby správné řešení bylo ohodnoceno více než jedním bodem. V tomto případě se může stanovit závažnost položek matematicko - statistickým postupem, který se nazývá vážení. Využívá se přitom statistických hodnot obtížnosti a citlivosti položky.
Při váženém skórování nebývá shoda v tom, zda přikládat vyšší váhu obtížnějším či naopak snadnějším úlohám, které však testují důležité učivo.
Při konstrukci klasifikačních norem je možno postupovat takto:
seřazení hrubých skóre,
připsání četnosti každé hodnotě, tzn. počtu žáků, kteří této hodnoty při testování dosáhli,
stanovení kumulativních četností (součtu četností v určitém řádku tabulky a všech předchozích četností dohromady), poslední kumulativní četnost se rovná počtu všech žáků,
vyjádření kumulativních četností v procentech z celkového počtu žáků, což představuje percentilovou hodnotu.
Z percentil lze stanovit pásmo školní klasifikační stupnice.
Používají se např. Vladimírem Smékalem (nar. 1935) doporučené procentové ekvivalenty přidělené jednotlivým klasifikačním stupňům:
1. 10 % výborných tj. 91 - 100 percentil.
2. 20 % chvalitebných tj. 71 - 90 percentil.
3. 40 % dobrých tj. 31 - 70 percentil.
4. 20 % dostatečných tj. 11 - 30 percentil.
5. 10 % nedostatečných tj. 1 - 10 percentil.
Možnosti využití didaktických testů
Didaktický test je možno využít především k prověření, hodnocení a klasifikaci vědomostí a dovedností žáků. Cílem je navíc i odstraňování zjištěných nedostatků, např. po probrání jednotlivých učebních témat či celého tématického celku. Zjišťujeme např., zda si žáci neosvojují nové poznatky pouze pamětně, ale zda zvládají také složitější myšlenkové operace s poznatky ve shodě s Bloomovou taxonomií vyučovacích cílů.
Zadáním didaktického testu, jeho opravením a stanovením klasifikačního stupně by práce učitele s didaktickým testem neměla pro vyučujícího končit. Výsledky mu totiž dávají dostatek podkladů k tomu, aby na jejich základě mohl posuzovat a odhadovat i příčiny úspěchu či neúspěchu žáků a přijímat opatření ke zlepšení vlastní práce, jakož i práce jednotlivých žáků (skupin, tříd apod.).
Na základě souhrnných záznamů o didaktickém testování lze získat přehled o stavu vědomostí žáků ve třídě. U nestandardizovaných testů můžeme zjistit bodové rozmezí dosažené žáky, a to i v procentuálním vyjádření, průměrný počet bodů dosažený třídou (průměrné hrubé skóre). U výsledků standardizovaných testů můžeme zjistit i vztah našich výsledků k celé populaci.
Na základě záznamů o testování lze přehledně zjistit, jak byly jednotlivé učební úlohy zvládnuty celou třídou, tedy ve vertikální rovině. Zejména je třeba vzít v úvahu testové úlohy s méně než 50 % správných odpovědí. Učivo, které představuje obsah těchto položek, je třeba žákům co nejdříve nově vysvětlit a zopakovat. Podle konkrétních výsledků didaktického testu určíme, zda budeme opakovat části učiva s celou třídou, nebo jen s určitou skupinou žáků. Je rovněž možno jednotlivým žákům uložit konkrétní úkoly na samostatné individuální studium pod naší supervizí.
Opíráme se přitom o testování v tzv. horizontální rovině, které nám zjišťuje postavení každého jednotlivého žáka ve třídě, pokud jde o celkové bodové hodnocení, procento splnění úkolu, známku, příp. srovnání s celou populací. Tyto údaje mohou být didakticky využity pro individuální práci se žáky. Mohou být i podkladem pro výběr žáků k individuálnímu ústnímu zkoušení. To může např. objasnit i příp. náhodné výsledky didaktického testu. Ústní zkoušení i další didaktický test po určité době nám může pomoci zjistit, zda již byly původně zjištěné nedostatky odstraněny, zda byl odstraněn didaktický deficit.
Nevýhody a nedostatky didaktických testů (zejména nestandardizovaných) spatřujeme:
v často pouze povrchních písemných odpovědích žáků na testové položky,
ve ztrátě bezprostředního verbálního a individuálního kontaktu učitele se žáky,
ve zjišťování vědomostí podmíněných především pamětním zvládnutím učiva,
ve zvýhodňování žáků s rychlejším osobním tempem,
v náročnosti přípravy seriózních didaktických testů pro učitele,
v nedostatečném rozvíjení jazykových dovedností žáků.
Didaktické testy mají oproti klasickým ústním a písemným zkouškám tyto výhody:
zjišťují poměrně rychle u všech žáků stav vědomostí,
dávají žákům stejné možnosti (stejné podmínky) úspěchu (neplatí to ovšem pro dyslektiky a dysgrafiky),
zmenšují subjektivitu posuzování,
mají možnost zkoumat celou látku,
procvičují současně učivo,
umožňují provádět vnitřní diferenciaci žáků podle výkonu,
umožňují plánovat opakování a doučování na základě individuálního přístupu k žákům,
jsou i zpětnou vazbou efektivity práce učitele.

Didaktické testy jsou v pedagogické práci významnou diagnostickou metodou, ale nemají být jedinou metodou používanou pro stanovení klasifikace.
Doporučená literatura:
KOHOUTEK, R. Poznávání a utváření osobnosti. Brno: Akademické nakladatelství Cerm.
 

5 lidí ohodnotilo tento článek.

Nový komentář

Přihlásit se
  Ještě nemáte vlastní web? Můžete si jej zdarma založit na Blog.cz.
 

Aktuální články

Reklama