Cultura de la Evaluación

Cultura de la evaluación y calidad educativa

Introducción

Desde los avances de R.W. Tyler en los años treinta se empezó un cambio en la evaluación, ya que fue la primera vez en que se hace referencia a que la evaluación es un proceso, luego tenemos los aportes de Cronbach que nos hace entrar en la época del realismo dejando por detrás la época Tyleriana y que consecutivamente vino la época del profesionalismo,entrando de esta manera a los años setenta, años en los que la evaluación empieza a tomar auge como una profesión, de allí la denominación que relaciona la evaluación con la investigación y el control (Rama, 1989, Gonzalez y Ayarza, 1997), entonces podemos decir que vivimos en la era de la evaluación. Desprendiéndose la siguiente pregunta ¿Debe evaluarse todo en todo momento?

En el mundo de la evaluación ha habido un cambio interesante en cómo se responde a esta pregunta. De acuerdo con la antigua idea de la “estimación de la evaluabilidad”, una evaluación sólo debe ser llevada a cabo cuando cabe esperar racionalmente que produzca mejoras. Hoy en día, sin embargo, las ideas dominantes de “capacidad de evaluación” y “cultura de la evaluación” sugieren que deben ser promovidos normas y valores que favorezcan la evaluación. Al mismo tiempo, se están generando nuevas categorías de evaluación.

Desarrollo

La evaluación consiste en una investigación, de tendencia interdisciplinaria, cuyo objetivo es conocer, explicar y valorar, mediante la aplicación de un método sistemático, el nivel de logros alcanzado (resultados e impactos) por las políticas y programas públicos, así como aportar elementos al proceso de toma de decisiones para mejorar los efectos de la actividad evaluada (Cardozo, 2006).

Contar con una evaluación integral permite a los gobiernos dirigir y ajustar estratégicamente sus políticas y programas hacia el logro de sus objetivos y metas, a partir de la comprensión de sus resultados o out puts (productos o servicios) e impactos o out comes (efectos provocados por los productos o servicios en el problema que se trata de resolver). Para ello, resulta necesario conocer las características de los recursos empleados (cantidad, calidad, oportunidad, etcétera) y de los procesos que han permitido su transformación en resultados (productividad, eficiencia, etcétera), así como sus principales condicionantes contextuales (económicas, sociales y políticas) (Cardozo 2009).

A partir de los ochenta, la mayoría de los países ha intentado aplicar la evaluación, en particular en América Latina, la región más desigual del mundo en donde persisten problemas de pobreza, desempleo, bajos salarios, salud, educación, vivienda, etcétera.

Algunas discusiones que tienen lugar sobre la evaluación implican confusiones, quizá porque no se clarifican las perspectivas diferentes que están debajo de cada enfoque. Por ejemplo, se puede aplicar una perspectiva prescriptiva o descriptiva (Dahler 2007).

Aquellos interesados en las formulas prescriptivas buscan asesoramiento instrumental sobre qué hacer ante una situación dada. Las perspectivas descriptivas no siempre aportan este asesoramiento porque están más orientadas hacia cómo se hace la evaluación realmente, no en cómo debería hacerse. Si entendemos cómo se realiza la evaluación en la práctica, nuestro asesoramiento puede resultar más sensato, aunque no siempre. Es posible que una investigación desapacionada objetiva e incluso cínica del funcionamiento real de la evaluación no es lo más apropiado para promover la idea de evaluación y para recomendar ciertos de sus instrumentos con entusiasmo. Como investigador interesado en la evaluación, claramente experimento la tensión entre estas dos perspectivas.

Otra diferencia de perspectiva tiene que ver con el hecho de que algunos entienden que interesarse por la evaluación es una elección individual. Otros ven la evaluación como una práctica social, política y organizacional que, aunque hecha por seres humanos, no está definida formalizada y perfilada por los individuos. Por el contrario, la evaluación es un síntoma de patrones culturales y políticos. Los defensores de esta última perspectiva no pueden hablar de la decisión de evaluar sin pensar en los marcos colectivos e institucionales en los que la evaluación se hace obligatoria.

Los investigadores, evaluadores profesionales y estudiantes de la evaluación mantienen distintos supuestos sobre el grado de racionalidad de los seres humanos. Bajo estrictos supuestos de racionalidad, la evaluación es un instrumento que los seres humanos diseñan deliberadamente para producir conocimientos con los que ayudar a resolver problemas específicos en situaciones específicas. Sin estos supuestos, la evaluación puede ser una moda pasajera o un ritual institucional y los resultados de la evaluación inciertos.

Por último, pero no menos importante, la gente tiene supuestos variados sobre el grado de linealidad del proceso de evaluación. Algunos asumen que, una vez que el propósito de una evaluación ha sido decidido, el proceso evaluatorio se desenvolverá de tal manera que el uso real de la evaluación corresponderá con el proceso estipulado. Sin el supuesto de la linealidad del proceso evaluatorio, el propósito estipulado no nos ayuda a predecir su uso real. Por el contrario, el uso de la evaluación puede ser menor, mayor y/o cualitativamente diferente del propósito oficial de la evaluación. Los procesos evaluatorios son abiertos y bastante impredecibles.

Muchos manuales sobre la evaluación al uso adoptan una visión prescriptiva, asumen que los individuos toman decisiones racionales sobre procesos de evaluación predecibles. Es posible, sin embargo, analizar la evaluación como un fenómeno social bajo el supuesto de que la evaluación no es lineal y en gran medida es el resultado de factores irracionales.

Aunque estas perspectivas pueden entenderse entre ellas, no son fácilmente puestas bajo unos mismos estándares Cuando se clarifican las perspectivas, sin embargo se hace más fácil entender por qué gente distinta que desarrolla papeles diferentes concibe las evaluaciones de manera tan desigual. Como docente investigador me descubro a veces tratando de hacer afirmaciones prescriptivas sobre cómo podría ser el buen uso de la evaluación si los individuos fueran racionales y los procesos relativamente predecibles. Como investigador, constantemente veo la necesidad de describir procesos de evaluación complicados en marcos institucionales complejos sin imponer supuestos de racionalidad ni en el nivel micro ni en el nivel macro. La mayor parte de lo que se dice en este ensayo, especialmente sobre cómo han cambiado las normas relativas a la evaluación, está basado en esta última perspectiva.

Evaluabilidad

La estimación de la evaluabilidad es un proceso que lleva a decidir si es sensato evaluar en las circunstancias presentes. La idea es práctica y útil si uno quiere prescripciones sobre cuándo evaluar y cuándo no. Pero la idea no es tan popular hoy en día como lo fue en los setenta (Smith 2005: 137). De hechos el nacimiento y declive de la idea de la estimación de la evaluabilidad es un desarrollo importante en la historia de la evaluación.

La principal cuestión en la estimación de la evaluabilidad no es si se puede hacer evaluación, sino si es racional hacerlo bajo las circunstancias del momento a la luz de las mejoras esperadas de la evaluación (SAHLIN 2004). Según la idea de la estimación de la evaluabilidad, un cierto número de circunstancias del evaluando y su contexto debe ser clarificado antes de que se decida hacer la evaluación. Más específicamente, las siguientes cuestiones deben ser respondidas (SAHLIN 2004):

a) ¿Existe una descripción clara del programa? Si no es así, se hará un mejor uso de los recursos clarificando el programa que evaluando un programa confuso.

b) ¿Está bien implementado el programa? Si se sabe que no es el caso, puede ser más inteligente mejorar su implementación antes de evaluarlo. Las capacidades de obtener conclusiones claras sobre el programa mejoran notablemente si los problemas de implementación han desaparecido y no son responsables del fracaso del programa.

c) ¿Existe una buena teoría del programa? Si hay, es mejor clarificar la lógica del programa e incluso mejorarla antes de evaluar.

d) ¿Existen metas plausibles y bien descritas? Si no existen, el resultado de la evaluación es predecible antes de que se realice. Hay mejores formas de gastar los recursos.

e) ¿Hay datos relevantes accesibles? Si no hay, los recursos de la evaluación podrían gastarse mejor en alternativas de evaluación.

f) ¿Se han identificado oportunidades para mejorar el programa? Si los usuarios para los que se realiza la evaluación no son capaces o no quieren usar los resultados de la evaluación, la evaluación no va a marcar ninguna diferencia en la práctica.

En esencia, la idea de examinar la evaluabilidad de un programa es altamente racional. Parte del convencimiento de que la evaluación debe ser utilizada solamente en aquellas situaciones en las que pueda ser de utilidad marcando una diferencia. La evaluación debe realizarse solamente cuando sea conveniente, y existen definiciones estrictas de lo que se entiende por conveniente.

Sin embargo, quizá precisamente debido a este supuesto subyacente de estricta racionalidad, esta idea ha ido decayendo desde los años setenta hasta nuestros días (Smith, 2005: 139). Una visión un tanto más cínica es la de que el concepto de estimación de la evaluabilidad se ha desvanecido entre los evaluadores, porque es comercialmente perjudicial renunciar a los honorarios cosa que sería obligada si el resultado de la estimación resultara negativa (SAHLIN 2004). En vez de enfrentarse con un conjunto de criterios estrictos para juzgar si una evaluación puede ser vendida, los consultores adoptan ahora el enfoque de vender no solamente una evaluación sino una cultura de evaluación, sin discutir mucho sobre su legitimidad.

Cualquiera que sea la razón, en mi opinión resulta claro que la estimación de evaluabilidad ha sido en la actualidad reemplazada por ideas, normas y prescripciones que están basadas en el valor de la evaluación en general, más que en las características específicas de la situación a evaluar de la era anterior.

Fortalecimiento de las capacidades evaluatorias

El fortalecimiento de las capacidades evaluatorias se dirige a generar un estado de cosas en el que la evaluación cualitativa de los programas y el uso apropiado de sus resultados son prácticas habituales (Baizerman, Compton y Stockdill, 2005: 38), siendo así que bajo esta concepción el énfasis se pone en la existencia de los factores que soportan y fortalecen esta situación potencial no en la realización de evaluaciones.

La idea de cultura de la evaluación y de capacidades evaluatorias es consistente con tendencias de profundo calado en la moderna cultura occidental. En la era reciente, que algunos sociólogos describen como modernización reflexiva, el progreso automático es una creencia en declive. En vez de eso, la atención que se le ha prestado a los efectos secundarios, la complejidad, y el criticismo ha preparado el terreno para que se demanden mecanismos organizacionales que prometan mejorar el aprendizaje, la retroalimentación y la dirección bajo condiciones complejas.

La evaluación encaja bien en este clima social que apoya los mitos del control, la auditoría y la evaluación (Dahler-Larsen, 2001; Power, 1997). La idea dominante hoy en día es que la evaluación debe ser institucionalizada y aceptada. Debe ser una parte integrante de las organizaciones modernas.

Dentro de los factores que fortalecen la capacidad de evaluación se encuentran aspectos culturales y estructurales de las organizaciones. Desde el lado estructural, la evaluación se basa en la capacidad de una organización para colocar la evaluación en un lugar adecuado en la estructura vertical y horizontal de la organización y en asegurar el apoyo gerencial, etcétera. También incluye la capacidad de contar con personal competente para realizar evaluaciones de calidad dentro de los límites presupuestarios asignados y basadas en las reglas de la organización y en otros mecanismos formales e informales de coordinación. Más del lado cultural, la evaluación se apoya en las normas, valores y hábitos favorables a la evaluación. No existe un consenso absoluto sobre estas normas, pero pueden incluir, por ejemplo, costumbres que obligan a disponer de documentos escritos de los métodos y los objetivos, indicadores existentes de procesos y resultados, la preferencia por experimentar, la tolerancia de los errores, el compartir los conocimientos, los foros de aprendizaje organizacional.

Un ideal importante es el crear organizaciones autosuficientes en materia de evaluación. Esta idea ha ganado terreno recientemente. En algunos contextos se ha convertido en un ideal que se entiende ha de acompañar necesariamente a toda labor de reforma. La actividad de fortalecer las capacidades evaluatorias, curiosamente, es una actividad de duración infinita en la que no se termina nunca de producir reglas, procedimientos, prácticas y políticas (Baizerman, Compton y Stockdill, 2005: 38); esto la hace diferente de la actividad de ejecutar una evaluación, que es por definición una actividad finita. Como consecuencia de haber pasado de la estimación de la evaluabilidad al fortalecimiento de las capacidades de evaluación, el mundo de la evaluación ha dejado de centrar su interés en proyectos que deben ser terminados para enfocarse en proyectos que en principio no tienen un punto final lógico.

Antes de entablar una discusión crítica sobre las características de la cultura de la evaluación y del fortalecimiento de las capacidades evaluatorias, hay que reconocer primero los méritos de la idea central.

Con frecuencia se ha detectado que la barrera más importante para que se saquen enseñanzas de las evaluaciones realizadas no es la calidad técnica de las evaluaciones sino las normas y valores no favorables a la evaluación que puedan existir entre los que toman las decisiones así como entre los grupos interesados. Como consecuencia, fortalecer las capacidades evaluatorias en el seno de las organizaciones parece ser una estrategia acertada (al dar este paso, los defensores de la cultura y el fortalecimiento de las capacidades sostienen una visión sobre el contexto político y organizacional que rodea al evaluando más avanzada que la que mantienen los defensores de la estimación de la evaluabilidad. Mientras que los últimos consideran el contexto como un factor contingente que les viene dado, los primeros lo ven como un objeto de intervención).

La idea de capacidad evaluatoria y de cultura de evaluación es, al menos parcialmente, también el resultado de observar que los estudios de evaluación realizados por expertos externos no suelen tener impactos de largo alcance en las organizaciones. Los conceptos de cultura de la organización y fortalecimiento de capacidades se enfocan por tanto en la capacidad o voluntad de una organización para evaluarse más que en la finalización de una evaluación aislada. Puede resultar inteligente invertir en esta capacitación para el futuro por las razones aquí expuestas.

Sin embargo, la idea de cultura de evaluación y capacitación no deja de presentar problemas. Primero que nada, no existe que yo sepa evidencia arrolladora que pruebe que las organizaciones con cultura de evaluación y capacidad de evaluación tengan un desempeño mejor que el resto de las organizaciones en base a unos indicadores objetivos. A continuación, la atención especial que ha recibido el crear un clima favorable a la evaluación en la práctica puede implicar que las recomendaciones generadas por lo que se conoce como estimación de la evaluabilidad puedan ser desechadas. Bajo un clima de cultura de evaluación, amistoso para la evaluación las evaluaciones pueden ser realizadas en situaciones que no resultarían recomendables bajo un estricto análisis racional de la situación. Si la evaluación se convierte en la norma general, la contribución promedio de cada evaluación puede verse disminuida en la medida en que se harán evaluaciones a un abanico mayor de situaciones con independencia de la evaluabilidad de un evaluando en una situación dada.

Conclusión

De lo expuesto líneas arriba, es muy importante concluir en que la evaluación tiene distintas funciones que responden a finalidades diferentes. Hasta aquí no existe objeción alguna, la dificultad surge cuando a algunas de estas funciones se les asignan propósitos distintos a los que originalmente tienen. Para ser más claros en este punto veamos un ejemplo: en 2013 el Ministerio de Educación en el Perú, aplicó un examen a los alumnos de primeros años de educación primaria púbicas y privadas del país, con el propósito de conocer el nivel de conocimientos y habilidades que poseían, es decir, el dominio que tenían de los contenidos establecidos en el currículum del grado correspondiente.

En este caso las funciones que cumple la evaluación pueden ser varias: la rendición de cuentas del subsistema encargado de la formación de estudiantes en el país, aunque también puede ser la clasificación y ubicación de los niveles en los que se encuentran, ya sea de las escuelas, de los alumnos o de ambos, para colocarlos en un ranking según la puntuación obtenida en el examen. En fin, como hemos mencionado, la evaluación puede cumplir distintas funciones, pero lo que debe quedar claro es que todas éstas son funciones administrativas, no pedagógicas.

Precisamente, el problema estriba cuando a este tipo de evaluaciones se le quieren atribuir funciones pedagógicas, y por tanto, se espera que sus resultados sirvan para la mejora de la enseñanza y el aprendizaje en el aula. Ya que estas evaluaciones desconocen la historia, el contexto y la cultura de cada escuela; ignoran la formación y la experiencia (o falta de ésta) de los profesores; las características y condiciones de los estudiantes y el ambiente en el que aprenden (o dejan de hacerlo), etc., por tanto, no pueden servir para un propósito distinto para el que han sido concebidas y suministradas.

No se pretende niega el valor de las pruebas estandarizadas. Sabemos que de alguna manera obligan a los estudiantes, docentes y administradores para conseguir los estándares previstos, y en este sentido, ciertamente, pueden hacer que los esfuerzos sean más productivos para muchos. Tales pruebas proporcionan a los educadores oportunidades para reflexionar sobre qué se logró y qué no se pudo lograr, para lo cual será necesario que los docentes tengan acceso a los resultados y que éstos se les presenten en un lenguaje comprensible, considerando que ellos no están familiarizados con le jerga técnica de los evaluadores y expertos en medición.

Ya que estos resultados de este tipo de evaluación pueden servir para informar políticas y para tomar decisiones sobre programas educativos importantes. Pero tales pruebas por sí mismas no pueden producir la deseada mejora de la escuela porque los test no tratan directamente con asuntos de la efectividad del docente o de la motivación del estudiante (Stiggins, 1999: 191).

También se puede concluir que cuando se aborda el tema de la evaluación, el énfasis se suele poner en dos elementos de cualquier modelo evaluativo: qué se evalúa (contenidos) y cómo se evalúa (métodos, técnicas e instrumentos) y se dejan fuera otros componentes que son tanto o más importantes que los referidos. Uno de esos elementos es qué se hace con los resultados de la evaluación. En nuestro medio, muchas veces, esta cuestión suele obviarse. Una respuesta habitual de los docentes apunta a un uso administrativo de los resultados: "otorgar calificaciones a los estudiantes". Esto en relación con las evaluaciones de aula que ellos construyen y aplican a sus estudiantes.

En cuanto a la difusión de los resultados de las pruebas a gran escala, se reconoce que aún cuando "la fase actual de evaluación es más abierta, esto no necesariamente significa que se cumpla con la función pedagógica de promover una tarea formativa, ni con la función retroalimentadora inherente a la acción de evaluar" (Díaz Barriga, 2006: 589).

Tambien concluyo en que el éxito de los estudiantes es el resultado de combinar el uso de información procedente tanto de la evaluación formativa como de la sumativa, pues hay evidencias de que ellos tienen la capacidad para hacer un uso efectivo de los datos de la evaluación. Podemos ganar mucho si admitimos a los estudiantes en el "jardín guardado" de la evaluación, de modo que ellos tengan poder para dirigir y conducir su propio aprendizaje (Stiggins, 2004).

Por último, concluyo que en la actualidad mucho del desarrollo de la evaluación está en otra dirección completamente; los datos que genera son usados para servir a los docentes, administradores y políticos de la educación, antes que para apoyar a los estudiantes en la toma de decisiones acerca de cómo mejorar su aprendizaje. En este sentido, se menciona que "el examen del funcionamiento de los sistemas indica que, por lo general, el uso principal de los resultados de la evaluación se relaciona con la toma de decisiones administrativas, asignación de cursos, estímulos económicos, promoción" (Luna, 2008: 76).

Bibliografía revisada.

Baizerman, M .; Compton, d. W. y Stockdill, S. H. (2005): «El artículo sobre creación de capacidad», en Mathison, S. Enciclopedia de la Evaluación, Sage, Thousand Oaks.

Cardozo, Myriam (2006), La evaluación de políticas y programas públicos. El caso de los programas de desarrollo so cial en México, México: Cámara de Diputados, Porrúa, Colección Conocer para Decidir.

Cardozo Brum, M. (2009). La institucionalización de una cultura de la evaluación en la administración pública mexicana: avances y desafíos pendientes. Convergencia, 16(49), 175-198.

Dahler-Larsen, P. (2007). ¿Debemos evaluarlo todo? O de la estimación de la evaluabilidad a la cultura de la evaluación. Evaluación de políticas públicas, 836, 93-104.

Díaz Barriga, Ángel (2006), "Las pruebas masivas. Análisis de sus diferencias técnicas", Revista Mexicana de Investigación Educativa, abril–junio, vol. 11, núm. 29, pp. 583–615.

Luna Serrano, Edna (2008), "Evaluación en contexto de la docencia en posgrado", en Reencuentro. Análisis de Problemas Universitarios, núm. 53, diciembre, pp. 75–84.

Moreno Olivos, T. (2011). La cultura de la evaluación y la mejora de la escuela.Perfiles educativos, 33(131), 116-130.

Sahlin-Andersson, K. (2004): Presentación en el Conferencia de la Sociedad de Evaluación de Suecia (SVUF) en Estocolmo en mayo.

Smith, M. F. (2005): «Artículo sobre la evaluación de la evaluabilidad», en Mathison, S. (ed.): Enciclopedia de Evaluación, Sage Publications, Thousand Oaks.

Stiggins, Rick (1999), "Evaluación, la confianza del estudiante, y el éxito escolar", Phi Delta Kappa, noviembre, pp. 191-198

Stiggins, Rick (2004), "Creencias nueva evaluación para una Misión Nueva Escuela", Phi Delta Kappa, septiembre, pp. 22-27.

Buscar este blog

Docentes Andragógicos

Cultura de la Evaluación

Cultura de la evaluación y calidad educativa

Comentarios

Publicar un comentario

Entradas populares de este blog

Modelos y tendencias en Evaluación educativa

La metodología dialógica

Crítica de Chéjov a las sociedades fallidas