¿Alguna vez has notado cómo los restaurantes caros se esfuerzan por llenar el aire de sus baños con los refrescantes aromas de un bosque de pinos después de una suave lluvia? Con la esperanza de disimular los olores que de otro modo predominarían en un ambiente así, los encargados de los baños de lujo bombardean a sus clientes con aromas divertidos, presumiblemente para hacer más placentera la experiencia gastronómica general.
Francamente, siempre he percibido que tales esfuerzos son más que inadecuados para la tarea que tenemos entre manos. Después de todo, la mierda, incluso en una piña, sigue siendo mierda. Del mismo modo, hay una buena razón por la que los fabricantes de incienso no comercializan pachulí y varillas de mierda. Como decimos en el sur, puedes "embellecer" a un cerdo poniéndole un vestido, pero al final sigue siendo un cerdo.
Ésta es una lección que haríamos bien en recordar tras el reciente anuncio de que el Servicio de Evaluación Educativa va a “renovar” el SAT, aparentemente para hacerlo más justo y relevante para un sistema educativo del siglo XXI.
A pesar de su insistencia en que el nuevo SAT predecirá mejor la capacidad de los estudiantes y al mismo tiempo reducirá la injusticia al eliminar elementos ligados a la cultura como las analogías, los cambios anunciados en realidad pasan por alto los problemas más grandes con las pruebas estandarizadas.
Aunque eliminar las analogías es un primer paso admirable, ya que los estudios han encontrado que están sesgadas contra aquellos de origen no blanco ni de clase media (con preguntas que involucran palabras como "regata"), los problemas con el SAT fueron siempre más profundo que eso.
De hecho, cualquier sesgo cultural que la ETS haya eliminado con la prohibición de las analogías probablemente se reactivará con la adición de una sección de "escritura", cuyos calificadores sin duda enfatizarán estilística y gramaticalmente el inglés estándar, marcando a los estudiantes cuyo estilo de escritura emplea modismos, frases o simplemente patrones de palabras más comunes en las comunidades de color. Se sospecha que la licencia poética no tendrá cabida en el examen de escritura del SAT.
Aunque el sesgo cultural interno es un fenómeno real, y se ha observado en las pruebas durante muchos años, el problema más grande es que los partidarios del SAT presuponen que administrar una prueba estandarizada a estudiantes profundamente no estandarizados, de escuelas no estandarizadas, y luego usar los resultados en esa prueba para determinar la colocación universitaria puede ser justa.
El hecho es que, incluso si estos ítems sesgados se eliminan del SAT, la experiencia educativa desigual de los estudiantes que toman el examen (especialmente en términos de clase y raza) prácticamente garantiza una brecha persistente en las puntuaciones entre los blancos, por un lado, y negros, indios americanos o latinos, por el otro.
Además, el anuncio de que se añadirá Álgebra II al examen sólo puede causar alarma entre quienes están preocupados por las diferencias raciales en las puntuaciones; después de todo, el seguimiento en las escuelas es tan pernicioso que los negros, incluso cuando obtienen las puntuaciones más altas en las distribuciones de las pruebas de rendimiento de octavo grado, tienen aproximadamente un 8% menos de probabilidades que los blancos, cuyas puntuaciones son simplemente promedio, de ser colocados en cursos de matemáticas de nivel superior en las escuelas secundarias. escuela. Como tal, ni siquiera habrán llegado a Álgebra II cuando tomen el SAT.
Pero, de hecho, ni siquiera el seguimiento es el mayor problema aquí. Oh claro, importa. Por un lado, significa que ciertos estudiantes de color estarán subexpuestos al tipo de material que se encuentra en un examen como el SAT; y, por otro lado, significa que ciertos estudiantes (especialmente los blancos y muchos asiáticos a quienes se supone que son "buenos en matemáticas" desde el principio y, por lo tanto, se les sigue en consecuencia) tendrán una ventaja al momento de la prueba. Pero aún así, el seguimiento no es el factor decisivo que hace que el SAT sea inherentemente problemático.
Los dos problemas más importantes son de naturaleza completamente diferente y no pueden solucionarse con reformas graduales.
La primera es lo que Claude Steele, catedrático del Departamento de Psicología de la Universidad de Stanford, ha llamado "amenaza de estereotipo". Como Steele y sus colegas han observado en varios experimentos ingeniosos, los estudiantes negros toman pruebas estandarizadas bajo una nube de sospecha grupal de que obstaculiza el desempeño: sospecha por parte de la sociedad en general de que son menos inteligentes y capaces que otros.
Los estudiantes negros son muy conscientes de los estereotipos negativos que los miembros de la sociedad en general tienen sobre ellos. Como tal, cuando los negros que están muy motivados y valoran los logros educativos toman una prueba estandarizada y esperan que los resultados se utilicen para indicar la capacidad cognitiva, el miedo a vivir según el estereotipo afecta negativamente su desempeño. Estos estudiantes pueden apresurarse a realizar el examen (para parecer más seguros de lo que realmente son) o, alternativamente, tomarse demasiado tiempo, tratando desesperadamente de no cometer errores. La duda engendrada por las creencias racistas de la cultura en general se suma a la ansiedad general que sienten todos los examinados, lo que produce, para los estudiantes negros, una desventaja única.
Como prueba de que es la amenaza de los estereotipos y no las diferencias de capacidad inherentes lo que explica las brechas raciales en las pruebas de admisión estandarizadas, Steele señala que cuando se dan las mismas preguntas a blancos y negros en entornos experimentales, y aun así se les dice a los estudiantes que los resultados no son indicativo de habilidad, y no serán calificados, la amenaza del estereotipo se disipa y se desempeñan tan bien como sus contrapartes blancas.
En otras palabras, mientras las creencias racistas sobre la capacidad de los negros sean comunes, aquellos estigmatizados por estas creencias a menudo tendrán un desempeño inferior en función de la ansiedad generada por el estereotipo mismo. Ciertamente no hay nada que ETS pueda hacer a la estructura de la prueba que pueda aliviar este problema.
Y, por último, las brechas raciales son, en última instancia, una función de la forma en que se desarrollan pruebas como el SAT. De hecho, las brechas están casi integradas.
Como recuerda cualquiera que haya tomado el SAT o un examen similar, hay una sección experimental en el examen, ya sea una sección extra verbal o extra de matemáticas, que contiene preguntas que no cuentan para la puntuación del estudiante. La sección existe para realizar preguntas de "prueba previa" que se utilizarán en versiones futuras de la prueba.
Pero como admite ETS, las preguntas elegidas para uso futuro deben producir (en la fase previa a la prueba) brechas similares entre los examinados a las que existían en la prueba general realizada en ese momento. En otras palabras, las preguntas rara vez, o nunca, se seleccionan para uso futuro si los estudiantes que recibieron puntuaciones generales más bajas responden correctamente a esa pregunta en particular con tanta frecuencia o más que aquellos que obtuvieron puntuaciones más altas en general.
Las implicaciones raciales de tal política deberían quedar claras. Debido a que los estudiantes negros, latinos e indios americanos tienden a obtener puntuaciones más bajas en estos exámenes que los blancos y asiáticos, cualquier pregunta en la fase previa a la prueba que los estudiantes negros respondan correctamente con tanta frecuencia (o más frecuentemente que) los blancos tendría prácticamente la garantía de no responder nunca. aparecer en un examen estandarizado real!
En la práctica, las preguntas respondidas correctamente por negros más que por blancos han sido rutinariamente excluidas del uso futuro en el SAT. Aunque las preguntas que los blancos responden correctamente un 30% más a menudo que los negros pueden permanecer en la prueba, las preguntas respondidas correctamente incluso un 7% más a menudo por los negros que por los blancos han sido descartadas.
Aunque el fundamento de esta práctica no es abiertamente racista (la empresa de pruebas, por ejemplo, no busca intencionalmente mantener puntuaciones más bajas para los negros), el pensamiento tiene un impacto racista.
Esencialmente, la posición de la empresa es que para que cualquier pregunta tenga “validez predictiva”, debe responderse correcta o incorrectamente en proporción aproximada al número total de respuestas correctas o incorrectas dadas por los examinados. Pero como las puntuaciones generales han tendido a mostrar una brecha racial, tal lógica resulta en la virtual garantía de mantener esa brecha, como una función del desarrollo mismo de la prueba.
Si las preguntas de la prueba se hicieran menos sesgadas culturalmente, de modo que la brecha racial se redujera o desapareciera en la fase previa a la prueba, esas preguntas probablemente serían descartadas, simplemente porque, al estar menos sesgadas culturalmente, no lograron replicar las brechas raciales producidas. por el resto del examen.
Curiosamente, como ha demostrado el experto en pruebas Jay Rosner, los creadores del SAT podrían reducir la brecha racial entre blancos y negros y al mismo tiempo mantener el mismo nivel de dificultad general del examen al elegir preguntas que, aunque igualmente difíciles, produzcan menos diferenciación entre blancos y negros. examinados. El hecho de que, en cambio, maximicen estas diferencias a través de las preguntas que eligen, y que ETS no ofrezca reformas de esta naturaleza indica cuán despreocupados están realmente por la imparcialidad de las pruebas.
En lugar de tratar de embellecer este cerdo, las personas preocupadas por la equidad educativa, las verdaderas oportunidades y la justicia deberían pedir a los colegios y universidades que eliminen el uso del SAT en las decisiones de admisión, o al menos minimicen masivamente su importancia, dada su irrelevancia. para predecir la capacidad académica real.
Las diferencias en el SAT de hasta 300 puntos entre dos estudiantes (o grupos de estudiantes) pueden ser completamente insignificantes en términos de indicar diferencias reales de capacidad, y los propios responsables de los exámenes consideran que las diferencias de 125 puntos entre estudiantes son aleatorias y no dicen nada sobre las diferentes capacidades de los estudiantes en cuestión.
Que las puntuaciones del SAT tienen poco que ver con la capacidad de cada uno lo confirman una serie de estudios e incluso datos proporcionados por los propios responsables de los exámenes, que indican que sólo el diez por ciento (como máximo) de la diferencia entre los estudiantes en términos de Las calificaciones de los estudiantes de primer año se pueden explicar por los resultados del SAT. Además, la correlación entre los puntajes del SAT y las calificaciones generales de la universidad de cuatro años o las tasas de graduación ha sido tan baja que es esencialmente inexistente, lo que explica no más del 3% de la diferencia entre dos estudiantes cualesquiera.
Si ETS quiere promover la equidad (y de hecho insisten en que están comprometidos a cambiar el sistema educativo desigual que ayuda a producir brechas en las calificaciones), primero deben dejar de promover una batería de pruebas que reproduzca y refuerce esa inequidad. Si desean proporcionar pruebas con el único fin de evaluar cuánto se enseña y aprende en las escuelas K-12, que así sea.
Pero mientras publiquen los resultados de los exámenes antes de la admisión a la universidad, sabiendo que dichos resultados se utilizarán para repartir oportunidades que a su vez resultarán en aún más oportunidades después de la graduación, la ETS sólo podrá ser vista como cómplice del mantenimiento de la estratificación racial y económica. No son reformadores, sino meros guardianes del status quo. Y eso huele igual, por mucho que uno intente disimularlo.
Tim Wise es un ensayista, conferencista y activista antirracista. Se le puede contactar en [email protected]