Твърде трудни ли са тези стандартизирани тестови въпроси за децата?

Твърде трудни ли са тези стандартизирани тестови въпроси за децата?

Texas Monthly публикува история - „Провалят ли се децата от Тексас? Или тестовете са нагласени? ” — което повдига въпроси за това дали въпросите за висококачествените стандартизирани тестове по английски език на държавата са написани над ниво за много деца. Един депутат от Тексас, щатският представител Мери Гонзалес (D), бързо призова за разследване на изпитите.

Статията цитира a Доклад за 2012 г от двама доценти от Texas A&M University at Commerce, които анализираха изпитите по английски език при четене на пасажи и откриха, че много от тях са написани с поне два класа над нивото на класа.

Това не е история, уникална за Тексас, нито последствията от лошо формулирани, културно пристрастни или по друг начин неподходящи въпроси при тестове с високи залози. Чували сме например за проблемни въпроси от години от различни щати, включително прословутите въпроси за „говорещ ананас“ на тест за щата Ню Йорк през 2012 г. Проблемите в Ню Йорк не спряха, както ще научите по-долу.

Въпросът „говорещ ананас“ на стандартизиран тест озадачава учениците

Историята на Texas Monthly започва по следния начин:

Рекламната история продължава под рекламата
През последните няколко години нещо странно се случва в тексаските класни стаи. Завършени учители, които знаеха, че децата им четат на ниво клас по почти всички други мерки, виждаха, че същите тези деца се провалят в STAAR, скандалния тест за оценка на академичната готовност в щата Тексас. Ефектът върху учениците беше предвидим: на децата, които усърдно си вършеха домашните и правеха добри оценки в час, изведнъж им беше казано, че се провалят в очите на държавата, което не беше толкова голямо за тяхната мотивация. Родителите отчаяно се опитваха да разберат защо техните някогашни високоефективни деца внезапно бяха видяни като спъващи се. Учителите също се чувстваха като неуспехи, но нямаха представа какво правят нередно, след години на стремеж да възприемат практики, доказани в успешни училища в цялата страна. Нещо повече, резултатите от теста бяха бързо въоръжени от критиците на държавните училища в Тексас, много от които се застъпват за финансирани от държавата ваучери, които биха позволили на родителите да изпращат децата си в религиозни и други частни училища. Залогът на такива изпити е опасно висок. Тестът STAAR, разработен от образователната служба за тестване в Принстън, Ню Джърси, беше заменил този, предоставен от британската фирма Pearson, който служителите на Тексас смятаха за твърде лесен. Тестът STAAR се използва за оценка на ученици, учители, отделни училища и директори, училищни райони и в допълнение, цялото предприятие за обществено образование в Тексас. Пети и осмокласници, които не успеят на теста, могат да бъдат принудени да повторят клас; учениците от гимназията може да не се дипломират, ако не издържат три от петте изпита STAAR в края на годината.

Да се ​​преместим в Ню Йорк.

От 2012 до 2016 г. щатът имаше договор за 38 милиона долара с базираната в Лондон образователна компания Pearson за тестове, съобразени с Общите основни държавни стандарти, които да се дават на някои всяка година. Ню Йорк не поднови договора след многократни проблеми. Questar Assessment спечели собствен петгодишен договор за 44 милиона долара и завърши два цикъла на тестване. Ще изпълни своята трета през пролетта.

Тестващите компании обикновено не са задължени от държавите да предоставят обширни данни на обществеността за своите изпитни програми и не са длъжни да търсят или дори да разрешават независим преглед на своите въпроси. Имайки това предвид, експертът по тестване Фред Смит и Робин Якобовиц от Държавния университет на Ню Йорк в Ню Палц анализираха пасажи за четене заедно с придружаващите конструирани въпроси за отговор. Те разгледаха въпроси от тестове, разработени от Pearson, които бяха оповестени публично от държавни служители на уебсайта им EngageNY.

Рекламната история продължава под рекламата

Смит подаде заявки от Закона за свободата на информацията до държавата за резултати от тестове и след това успя в някои случаи да съпостави пуснатите пасажи с резултатите, получени от студентите в отговор на въпросите. Тези данни са в основата на анализа по-долу, който се фокусира върху тежкото въздействие, което два конкретни пасажа оказаха върху всички деца в щата и особено върху изучаващите английски език в Ню Йорк, студентите в специално образование и чернокожите и испанските деца (които съставляват 68 процент от тестовата популация на града).

Смит е експерт по стандартизирано тестване и пенсиониран административен анализатор в системата на държавните училища в Ню Йорк. Якобовиц е директор на образователните проекти в Benjamin Center в SUNY в New Paltz, където преподава години в Училището по образование.

Вярно е, че и в двете проучвания, споменати по-горе, в Тексас и Ню Йорк, изследваните тестови въпроси са от преди няколко години. Няма причина обаче да мислим, че оттогава много се е променило.

Рекламната история продължава под рекламата

От Фред Смит и Робин Якобовиц

През 2018 г. публикувахме доклад, озаглавен „ Превръщаме децата си в нули: Фокус върху провала ”, което категорично подсказва, че много ученици не са били в състояние да разберат показанията и да напишат разбираеми отговори на въпроси, базирани на Common Core, за тях на тестовете по английски език (ELA) в цялата страна.

Родители и учители се оплакват безрезултатно, че четенето на пасажи от тестовете е неподходящо за развитието, особено за трети и четвъртокласници. Сега предполагаме, че критиците изглежда са били прави.

Наскоро разгледахме цялостното въздействие на изпитите в цялата страна върху 1,2 милиона студенти, които се явяват на тестовете всяка година. Това включва отделни анализи за 440 000 деца в Ню Йорк, или 37 процента от тестовата популация на щата. Тези тестове са изготвени от Pearson Inc., компанията, която преди е имала договор с държавата, но вече не го прави.

Рекламната история продължава под рекламата

Показахме, че тези изпити имат най-страшен ефект върху 8- до 9-годишните деца веднага след като държавата въведе тестове, съобразени с Общите основни държавни стандарти през 2013 г. За третокласниците преминаването към изпити, съобразени с общи основни изпити доведе до скока от 11 процента от учениците, които са получили нули - което означава, че отговорите им са били счетени за напълно неразбираеми - до 21 процента. А за четвъртокласниците скокът беше от 5 процента на 15 процента. (Вижте таблицата с резултати по-долу.)

Изучаващите английски език, учениците с увреждания и чернокожите и испаноговорящите ученици бяха особено силно засегнати. Това стана ясно от данните, които получихме от Министерството на образованието в Ню Йорк, което ни позволи да анализираме въздействието на тестовете върху всяка от тези групи.

Написахме последващи публикации в блога за широко въздействие, което тестовете оказаха и специфичното влияние, което са имали върху малцинствата и английския като втори език учащи се.

Рекламната история продължава под рекламата

Сега нека разгледаме показанията и тестовите въпроси, които озадачиха нашите деца. Първо прочетете следните два пасажа. Въпросите са след всеки пасаж. Не забравяйте, че тези пасажи и въпроси бяха дадени на 8- и 9-годишни ученици.

__________________________

3 клас, 2014 г., Научно триене, въпрос 45

Въпрос: Защо обстановката на историята е важна? Използвайте две подробности от историята, за да подкрепите отговора си.

-0-0-0-0-

4 клас, 2015 г., Hattie Big Sky, въпрос 45

Въпрос: Как са представени пилетата като герои в „Откъс от Hattie Big Sky“? Използвайте две подробности от историята, за да подкрепите отговора си.

Това са въпроси от Common Core-aligned, проектирани от Pearson тестове, които имат най-отдалечените нулеви резултати от учениците.

Историята продължава под рекламата

„Science Friction“ се появи на теста за 3 клас през 2014 г.; този пасаж и въпрос № 45 формираха най-неразбираемата комбинация, пред която се сблъскаха студентите през тази година, като 48 процента от студентите от щата Ню Йорк отбелязаха нули. Година по-късно, в 4-ти клас, „Hattie Big Sky“ беше почти толкова зашеметяващо, с 41 процента нули.

Но това не са изолирани примери. Таблицата по-долу разглежда резултатите от пет въпроса с конструирани отговори, които са дали най-много нули, като се започне през 2012 г. (преди тестването на Common Core) и продължава от 2013 г. до 2016 г. (с тестове, съответстващи на Common Core).

Не е нужно да сте специалист по тестове, за да знаете, че целта на звуковото тестване не е да създава въпроси, генериращи нулеви резултати. Целта е учениците да могат да четат пасажите и да отговарят на тях с известна степен на съгласуваност и разбиране.

Рекламната история продължава под рекламата

Моделът тук е точно обратен: въпросите стават осезаемо по-малко разбираеми. И когато половината ученици не могат да осмислят пасаж за четене, трябва да оспорим мярката.

Общата идея е, че твърде много въпроси онемяват твърде много деца. Както показва таблицата, над една четвърт от ВСИЧКИ трети и четвъртокласници често са оставали напълно загубени от множество въпроси. Когато часовникът удари нула, е време да изхвърлите часовника.

Откакто тестовете за 3-8 клас в щата Ню Йорк бяха приведени в съответствие с Common Core, родителите и учителите се оплакваха, че тестовете не са подходящи за развитието, особено за трети и четвъртокласници. Никой от нас не е експерт в ранното детство или двуезичното образование и не сме квалифицирани да преценяваме уместността на пасажите и въпросите за четене по-горе. Но тяхното изключително въздействие върху децата трябва да ни спре.

„Научно триене“ включва думи, толкова трудни, че в историята се вмъкват дефиниции на текстови полета. А „Hattie Big Sky“ описва подробно живота във ферма, използвайки непознат език като „има останали някои настройки“, което вероятно е извън опита на повечето участници в теста в щата Ню Йорк.

Не забравяйте, че учениците от трети и четвърти клас са на 8-9 години.