Egzaminatorzy oblali maturę z matematyki? Były szef CKE: Rozwiązałem ją, była za trudna

Resort edukacji myli się, obciążając winą za słabe wyniki matur z matematyki samych uczniów – twierdzi w rozmowie z Dziennikiem Gazetą Prawną prof. Krzysztof Konarzewski. Były dyrektor Centralnej Komisji Egzaminacyjnej własnoręcznie rozwiązał dotychczasowe testy i mówi wprost, że tegoroczny był zbyt trudny.

Klara Klinger, Anna Wittenberg: Czy system egzaminacyjny jest sprawiedliwy dla uczniów?

Krzysztof Konarzewski: Sprawiedliwszy niż kiedyś, ale nie idealny. Jako dyrektor CKE chciałem go trochę poprawić, ale nie udało mi się przekonać urzędników resortu edukacji. Jeden z nich powiedział wprost: „Te pańskie fanaberie…”.

Co to były za „fanaberie”?

Proponowałem cztery zmiany, konieczne, jeśli nasz system egzaminów zewnętrznych miałby osiągnąć poziom światowy. Po pierwsze, obliczanie wyniku w sposób uwzględniający trudność zadań egzaminacyjnych. Po drugie, sprowadzanie różnych testów do wspólnej skali, co zapewniłoby porównywalność wyników między rocznikami. Po trzecie, większa obiektywność punktowania. Chodzi o to, że nader często dwóch egzaminatorów inaczej oceniało tę samą odpowiedź na pytanie otwarte.

Da się tego uniknąć?

Pomysł był taki, by skanować arkusze egzaminacyjne, dzielić je na pojedyncze zadania i przesyłać egzaminatorom do oceny online. Wiadomo, że egzaminator rzetelniej ocenia jedno zadanie niż cały test. System informatyczny od czasu do czasu przesyłałby już ocenione zadania innym egzaminatorom, żeby kontrolować zgodność oceniania. No i byłoby wygodniej: egzaminatorzy nie musieliby być skoszarowani, tylko pracowaliby w domu na własnym komputerze.

Teraz nie ma żadnej kontroli…

Nie było jej, gdy przychodziłem do CKE, czy jest teraz, nie wiem. Wiem jednak, że sporadyczne kontrole nie zawsze wypadały dobrze. Pamiętam, że zgodność oceniania zadań maturalnych z matematyki była bardzo wysoka, ale z językiem polskim było gorzej. W pilotażu nowej matury względnie zgodnie oceniono tylko 20% wypracowań. To za mało, żeby zdecydować o czyimś losie, zwłaszcza jeśli nie ma możliwości odwołania się od wyniku.

CKE i MEN podkreśla, że uczniowie i tak powinni się cieszyć, bowiem kiedyś wszystko było subiektywne.

Zgadzam się. Jestem zdeklarowanym zwolennikiem egzaminów zewnętrznych. Mówienie, że testy zabijają kreatywność uczniów i nauczycieli, to zawracanie głowy. Tak mówią ludzie oświaty, którym marzy się praca w szarej strefie niewiedzy. W PRL nikt nie wiedział, ile naprawdę potrafią uczniowie. Oceny wystawiali nauczyciele – ci sami, którzy przekazywali im wiedzę. Teraz mamy międzynarodowe badania osiągnięć szkolnych, wtedy nie było. Były sporadyczne badania, pamiętam, że w latach 70. Zbigniew Kwieciński zrobił sprawdzian z czytania i wykrył kolosalną różnicę między wsią i miastem. Potem dowiedzieliśmy się, że miasto też nie błyszczało. Polska potrzebuje dobrze wykształconych ludzi, a dobre wykształcenie wymaga zewnętrznych egzaminów. Wprowadza się je nawet w tak zdecentralizowanych systemach jak amerykański. Nie ma od niego odwrotu.

Teraz wszystko jest wystandaryzowane. Ale mówi się, że nadal system nie jest uczciwy. Bo pojawiają się błędnie przygotowane pytania, klucze, egzaminatorzy nie szkoleni…

Przyznałem już, że system nie jest doskonały, ale to tylko znaczy, że trzeba go nieustannie kontrolować i poprawiać. Na pewno jest błędem, że nie ma porównywalności między rocznikami. Przykładem może być tegoroczna matura, której wyniki były gorsze niż w poprzednich latach. Efekt jest taki, że gdy o przyjęcie na studia ubiega się dwóch absolwentów: z 2014 i 2013 roku, to drugi ma większą szansę niż pierwszy.

Jaki był powód takich wyników: czy tegoroczne pytania były trudniejsze, czy uczniowie gorsi?

Oczywiście, że to pytania były trudniejsze. Można między bajki włożyć opinię, że to gorszy rocznik. Może się zdarzyć gorsza klasa, ale nie 300-tysięczny rocznik młodzieży.

Ale MEN mówi o roczniku, któremu poszło gorzej na testach na każdym etapie edukacji

To pogłoska… Ja tych danych nie widziałem. Może i w gimnazjum test był trudniejszy. Nikt nie kontroluje poziomu trudności kolejnych testów. Są co prawda analizy dra Henryka Szaleńca, które pokazują wyniki testów gimnazjalnych na wspólnej skali, ale na szczęście dla CKE kończą się na roku 2010, czyli nie obejmują feralnego rocznika.

Więc to był wypadek przy pracy?

Tak myślę. To, co CKE nazywa standaryzacją, sprowadza się do utrzymania trudności testu na stałym poziomie, tak by średnia wyników egzaminu w tym roku była z grubsza taka sama jak w zeszłym. Jeżeli w zeszłym roku było 13 proc. porażek na maturze z matematyki, to w tym roku – zgodnie z przyjętą metodą – powinno być tak samo.

Jak to się robi?

Nie wchodząc w szczegóły, można powiedzieć, że prowadzi się pilotaż testu. Jeśli wyniki wykazują, że nie zdałoby go powiedzmy 20 proc. uczniów, to eksperci wyszukują najtrudniejsze zadania i zastępują je łatwiejszymi.

Obecny szef CKE, Marcin Smolik, mówi, że o miejska legenda, jak ta z czarną wołgą.

Nie wiem, co dokładnie miał na myśli. Jest jednak jasne, że standaryzacja, czyli utrzymywanie wyników na stałym poziomie, istnieje. I że ktoś musiał na początku określić próg zdawalności. Zdecydować, czy nie zdaje 13 proc. czy 30 proc. Pierwsza próbna matura była w 2001 roku. Wtedy zapoczątkowano całą tradycję, potem należało się jej trzymać. Gdy dochodziło do odchyleń, mieliśmy aferę polityczną. Dobrym przykładem była reakcja Romana Giertycha jako ministra edukacji na wzrost odsetka porażek o 7 punktów procentowych. Zarządził on amnestię maturalną, którą później zakwestionował Trybunał Konstytucyjny.

Wtedy radykalnie spadła zdawalność matury z matematyki. Też popełniono błąd?

Tak. Ale nie dlatego, że ktoś się nie przyłożył, tylko dlatego, że przyjęto zawodną metodę. Przede wszystkim nie da się przeprowadzić porządnego pilotażu na losowej próbce uczniów, bo to by spaliło test. Stosuje się różne obejścia, z których każde wnosi błąd do ostatecznego oszacowania trudności. W rezultacie zastosowanie testu w prawdziwym egzaminie daje wyniki, które często zaskakują konstruktorów. Tak jak stało się w tym roku. Nie wierzę, że 300 tys. młodych ludzi zdających maturę cierpiało na zbiorowy deficyt wiedzy. Tak mogłoby być tylko wtedy, gdyby kraj albo dużą jego część dotknęło jakieś nieszczęście, np. wielka powódź czy epidemia.

Pani minister mówi, że być może to był ostatni rocznik starej podstawy programowej, więc nikt nie kazał im repetować klasy, zaś była minister Katarzyna Hall, uważa, że przyjmowano dzieci z łapanki, bo licea już dotknął niż demograficzny.

Zobaczymy, czy spadł odsetek repetentów, gdy GUS opublikuje doroczny raport oświatowy. Na razie nic o tym nie wiemy. Nie bardzo też umiem sobie wyobrazić łapankę do liceum. Wiem natomiast, że tegoroczny egzamin z matematyki był trudniejszy niż poprzednie, bo zadałem sobie trud rozwiązania wszystkich matur od 2012 r. ze stoperem w ręku. I ostatnią rozwiązywałem najdłużej.

Ale to pan pierwszy wprowadzał maturę z matematyki. Wprowadziliście próg zdawalności?

Rzeczywiście w 2010 r. miałem szczęście wprowadzać na powrót matematykę, po ćwierćwieczu jej nieobecności, na listę przedmiotów obowiązkowych. To była kontrowersyjna zmiana, wielu ludzi było jej przeciwnych. Byłem świadomy, że jeśli test okaże się za trudny i zbyt wielu uczniów go nie zda, to wzbudzi to protesty społeczne i pomysł obowiązkowej matury z matematyki może upaść. Eksperci zgodzili się na 15 proc. niezdanych matur i tak budowaliśmy test. Na wyniki czekaliśmy w wielkim napięciu. Gdy się dowiedziałem, że nie zdało 13 proc., odetchnąłem z ulgą.

Kto przygotowywał zadania?

Zespół ekspertów pod wodzą prof. Wojciecha Guzickiego i patronatem prof. Zbigniewa Marciniaka. Przygotowania trwały przez kilka lat – pilotaże, analizy, zupełnie nowy system oceniania zadań otwartych, który wydaje mi się bliski doskonałości. Jest jednak oczywiste, że w bieżącej pracy CKE nie da się utrzymać takiego reżimu. Dlatego test z 2013 roku dał 15 proc. porażek, a test z 2014 – 25 proc.

Przecież – jak pan mówił – powinny być podobne?

Dzięki rozwiązaniu wszystkich testów poznałem je od podszewki. Rzeczywiście, są podobne, każdy kolejny to niemal klon poprzedniego. Dość spojrzeć na najtrudniejsze zadanie za 5 punktów. Wszędzie ma identyczną strukturę: dwa obiekty poruszają się z różną prędkością, tyle że raz są to piechurzy, raz samochody, raz pociągi. Na marginesie, uważam to za złą praktykę. Powtarzalny test to zachęta dla nauczycieli, by przygotowywać uczniów do matury przez rozwiązywanie starych testów.

To co się teraz stało, jeżeli wszystkie były klonami?

Bo w tym roku do zadań wprowadzono drugorzędne utrudnienia. Na przykład w poprzednim roku w zadaniu za 5 punktów podróż trwała 40 minut, czyli 2/3 godziny, a w tym – godzinę i 4 minuty, czyli 16/15 godziny. Jeśli uczniowie budując równanie, od razu podstawiają wartości zmiennych, przekształcenia ogromnie się komplikują. Pojawiają się duże liczby, na przykład żeby obliczyć deltę, trzeba wyciągnąć pierwiastek z 16900. Wcześniej było to 576. To bardzo utrudnia pracę.

I wydłuża czas rozwiązywania zadania.

Tak, i łatwiej pomylić się w obliczeniach. Były też drobniejsze haczyki. W zadaniu zamkniętym trzeba było wybrać nie tylko właściwe liczby, ale i właściwe nawiasy. Przyznaję, że to zadanie zawaliłem.

Test miał wybić ucznia ze schematu.

Być może. Ale to matura, uczeń się spieszy, skupia na istocie zagadnienia. Z rozwiązywaniem testu z trudem zmieściłem się w czasie. Patrzyłem na zegarek i mówiłem sobie: o rany, zaraz nauczyciel zabierze mi test. Nie przyszło mi do głowy, że ktoś przy okazji sprawdzania mojej wiedzy o funkcji liniowej będzie też sprawdzał znajomość konwencji dotyczącej nawiasów. Gdyby mi przyszło, to bym się im przyjrzał.

Czy można powiedzieć, że ktoś popełnił tu błąd?

Obawiam się, że tak. Testy z roku na rok są tworzone przez klonowanie. W tym roku ktoś musiał pomyśleć: trzeba większych zmian. I dodał drugorzędne haczyki.

Minister edukacji o słabszy wynik obwinia rocznik. Czy gdyby MEN uczciwie przyznało, że matura była trudniejsza, byłby to powód do krytyki?

Nie, pod warunkiem, że byłaby to polityka przemyślana i zapowiedziana. Wiele środowisk krytykuje polską maturę, że jest za łatwa. Pamiętam protest nauczycieli z Krakowa, że matura z języka polskiego powinna być bardziej selekcyjna. Po pierwszej maturze z matematyki ciągle słyszałem zarzuty, że jej niski poziom jest kompromitacją dla Polski.

Był?

Przez 25 lat nie mieliśmy matematyki na maturze, a co za tym idzie, także w szkole. Po tak długim okresie ignorancja matematyczna była wielka. Trzeba było zacząć z niskiego poziomu i dochodzić do standardu światowego stopniowo, nieco podnosząc trudność egzaminu z roku na rok. Tegorocznym maturzystom nikt nie powiedział, że nastąpi taki skok. Poza tym postęp w kształceniu matematycznym powinien polegać raczej na poszerzaniu listy zagadnień niż na komplikowaniu prostych zagadnień z okrojonej podstawy programowej.

Tymczasem z badań dr. Szaleńca wynika, że umiejętności uczniów spadły.

Szaleniec wykazał, że w okresie 2002–2010 obniżył się poziom wykształcenia matematyczno-przyrodnicznego gimnazjalistów. Trzeba jednak powiedzieć, że metoda zastosowana przez jego zespół jest bardzo skomplikowana i kosztowna. Znaczy to, że oszacowania mogą być obciążone i że całe przedsięwzięcie trudno by powtarzać dla następnych okresów. Moim zdaniem mechanizm zrównywania skal powinien być na stałe wbudowany w system egzaminów zewnętrznych. Proszę zwrócić uwagę, jak to się robi w międzynarodowych badaniach osiągnięć…

Nie możemy tego zobaczyć, bo np. w badaniu PISA zadania są tajne.

Sposób ich konstruowania jest dokładnie opisany. Niestety przygotowanie takich testów jest koszmarnie drogie, więc nie sposób je robić co roku. Ale jest rozwiązanie: banki zadań. Czwarta z moich zmian. Idea jest prosta: gromadzimy dobre zadania egzaminacyjne. Nie testy, lecz pojedyncze zadania. Zadanie może ułożyć każdy, potem jednak musi ono przejść przez eksperckie sito.

Wszyscy piszą, a potem ktoś wybiera najlepsze.

To złożona procedura. Najpierw bada się ich poprawność merytoryczną. Potem łączy się w zbiory, które rozwiązują duże losowe grupy uczniów. Dzięki specjalnej metodzie skalowania można niezależnie opisać każde zadanie – jego trudność, moc różnicującą i podatność na zgadywanie. Tak opisane zadanie wędruje do banku. Jeśli byłoby w nim powiedzmy tysiąc zadań, to przygotowanie testu egzaminacyjnego stawałoby się łatwe. Wystarczyłoby określić jego parametry, a komputer wybrałby odpowiednie zadania z banku.

Nie trzeba nawet pilotażu.

Nie, bo zadania w banku były już przetestowane.

Co jest teraz niesprawiedliwe dla uczniów?

Niesprawiedliwe jest to, że 30 tys. młodych ludzi nie zdało matury, choć ich wiedza nie różniła się istotnie od poprzednich roczników.

Zakłada pan, że ich umiejętności są takie, że zdałyby maturę w 2013 roku.

Owszem. Niestety bez kosztownego badania zrównującego oba testy nie sposób tego dowieść. To wydaje mi się największą wadą naszego systemu: nie informuje, jak zmienia się wykształcenie kolejnych roczników.

Czyli matura powinna mieć stały poziom trudności. Jeśli w 2013 roku zdałoby ją 80 proc. uczniów, a w 2014 – 85 proc., oznaczałoby to, że nasz system edukacji poprawił się w ciągu roku o tych 5 proc.

Właśnie. To, o czym pani mówi, jest niezwykle ważne. Egzaminy służą selekcji uczniów i motywowaniu nauczycieli, ale są tak kosztowne, że w ich cenie powinniśmy dostawać więcej – informację o efektywności systemu edukacji w Polsce. Dziś jej nie mamy, bo nieustannie manipulujemy trudnością testów. Proszę sobie wyobrazić, że szkoły zwolna przestają nauczać i wiedza uczniów spada z roku na rok. Jeśli standaryzujemy testy na tym samym poziomie zdawalności, to nawet tego nie zauważymy.

Jak sprawdzić, czy reforma wieku szkolnego to sukces? Testem dla niej powinno być to, jak sześciolatki napiszą sprawdzian szóstoklasisty i egzamin gimnazjalny.

Dopasuje się testy.

I tak wygrają siedmiolatki.

Niekoniecznie. Gdyby wyniki w gimnazjum miały zależeć od wieku rozpoczynania szkoły, to Polska w badaniu PISA wyprzedzałaby Holandię czy Irlandię, nie mówiąc o krajach Dalekiego Wschodu. Nie wiek jest ważny, lecz to, co czeka dziecko w szkole. Zacznijmy od tego, że Polska miała najbardziej nieracjonalny system startu szkolnego, jaki można sobie wyobrazić. Zapędzaliśmy sześciolatki do zerówek i uczyliśmy je czegoś tam, pokrótce i byle jak. W pierwszej klasie poziom dzieci był bardzo zróżnicowany. Jedne już czytały książki, inne nie znały jeszcze wszystkich liter. A wszystkie zaliczyły rok obowiązkowej edukacji, za który zapłacił podatnik. Miałem nadzieję, że gdy wszystkie sześciolatki pójdą do pierwszej klasy, to w ciągu roku, a nie dwóch, jak było dotychczas, nauczą się czytać, pisać i liczyć. A na miejsca zwolnione w przedszkolu przyjdą pięciolatki, ale nie po to, żeby się uczyć liter, tylko żeby się mogły rozwinąć percepcyjnie, motorycznie, intelektualnie i społecznie.

Ale teraz w szkołach mamy mieszankę dzieci.

I to jest najgorsze.

Sześciolatki będą konkurować z siedmiolatkami.

To możliwe. W dotychczasowych klasach były dzieci młodsze, np. z grudnia, i starsze, ze stycznia. Od dawna wiadomo, że nawet ta dwunastomiesięczna różnica ma wpływ na ich wyniki.

Dziecko z grudnia radzi sobie gorzej niż to ze stycznia.

Tak. Ale na szczęście ta różnica zanika w kolejnych latach nauki. Najpóźniej po 17. roku życia nie ma jej wcale.

Czyli maturzyści z grudnia i stycznia mają takie same szanse.

Owszem. Nie chcemy jednak czekać aż do matury. Chcemy, żeby ta różnica zanikała jak najszybciej. A to zależy m.in. od początkowego zróżnicowania predyspozycji szkolnych w klasie. Im bardziej zróżnicowana jest klasa, tym więcej czasu zajmuje młodszym dogonienie starszych.

To, o czym pan mówi, jest naturalne – jeśli w klasie są podobne dzieci, to już na starcie różnice są mniejsze.

Zgoda, choć dynamika różnic, o których pani mówi, zależy od strategii nauczyciela. Głównym elementem tej strategii jest określenie poziomu wymagań. Obniżenie wymagań jest korzystne dla rozwoju uczniów słabszych, w tym młodszych. Na podwyższeniu korzystają uczniowie mocniejsi, starsi. Ale jeśli nauczyciel ma zróżnicowaną klasę, to musi iść na zgniły kompromis: trochę jednym, trochę drugim. Wskutek tego słabsi i młodsi rozwijają się wolniej, niż mogliby. I różnice wieku zanikają dopiero w liceum, a mogłyby pod koniec szkoły podstawowej.

Co się stanie w związku z przemieszaniem dzieci sześciu- i siedmioletnich?

Jesteśmy na najlepszej drodze do odtworzenia scenariusza rosyjskiego. Tam też chciano obniżyć wiek startu szkolnego z siedmiu do sześciu lat, a potem się wycofano. Teraz wszystko zależy od rodziców. Zróżnicowanie początkowych predyspozycji, szczególnie w małych szkołach, jest ogromne.

Nawet jeśli robimy klasę sześciu- i siedmiolatków, dzięki czemu one są homogeniczne, jak przychodzi do testu szóstoklasisty to i tak siedmiolatki radzą sobie lepiej. Homogeniczna, wyrównana klasa o niższych umiejętnościach i homogeniczna wyrównana klasa o wyższych umiejętnościach startują do tego samego egzaminu.

Nie może pani wiedzieć, że siedmiolatki radzą sobie lepiej, bo nikt jeszcze nie mógł zbadać reprezentatywnych próbek uczniów rozpoczynających naukę w wieku sześciu i siedmiu lat. Jeśli zaś chodzi o nieliczne dzieci posłane do szkoły o rok wcześniej, to miło mi poinformować, że wyprzedzają one starszych uczniów w klasie. Co oczywiście nie znaczy, że będzie tak samo, gdy do szkoły pójdzie cały rocznik sześciolatków.

Pani obawy związane z nierównością szans młodszych i starszych rozumiem, ale ich nie podzielam. Po pierwsze, mam nadzieję, że uda się jednak uniknąć scenariusza rosyjskiego i że po paru latach w pierwszej klasie będziemy mieć same sześciolatki. Jeśli nie, to mam nadzieję, że szkoły będą tworzyć osobne oddziały klasowe dla sześcio- i siedmiolatków. Pani mówi, że to nic nie da, ja natomiast wierzę w potęgę edukacji. Mądry i zaangażowany nauczyciel potrafi dokonać cudów ze swoimi uczniami niezależnie od ich wieku. Najtrudniej będzie w małych szkołach wiejskich z tylko jednym oddziałem pierwszej klasy. Te szkoły, jak sądzę, opowiedzą się raczej po stronie młodszego niż starszego. To wyrówna ich szanse, choć na relatywnie niskim poziomie.

Czyli od reformy nie ma odwrotu?

Zdecydują politycy. Moim zdaniem pomysł Donalda Tuska na uratowanie reformy jest dobry. Katarzyna Hall zaczęła od powiedzenia rodzicom: róbcie, jak chcecie. To nie było najszczęśliwsze, bo jeśli minister mówi coś takiego, to znaczy, że rząd nie jest pewien swoich racji. Wyobraźmy sobie, że Balcerowicz powiedziałby: a popiwek niech płaci, kto chce. Potem rozpętano wojnę propagandową. Ministerstwo zapewniało, że wystarczy wysłać dziecko o rok wcześniej do szkoły, by wyrosło na geniusza. Kontrpropaganda była jeszcze gorsza. Ponad milion Polaków udało się przekonać, by podpisali się pod wnioskiem o referendum z absurdalnymi pytaniami. Mimo to zlekceważenie tych głosów wydało mi się niewłaściwe. Rząd demokratycznego kraju musi rozmawiać z ludźmi.

Myśli pan, że na poziomie testu szóstoklasisty będą różnice?

Śladowe.

A bardziej stracą sześciolatki czy siedmiolatki?

To dobre pytanie. W stosunku do tego, co mogliby opanować – chyba siedmiolatki.

ZOBACZ TAKŻE: 1995 - najgłupszy rocznik od lat? A może rocznik stracony? >>>