Modelos y tendencias en Evaluación educativa

El nacimiento de la verdadera evaluación educativa:

Antes de que llegara la revolución promovida por Ralph W. Tyler, en Francia se inicia en los años veinte una corriente independiente conocida como docimología (Pieron, 1968 y 1969; Bonboir, 1972), que supone un primer acercamiento a la verdadera evaluación educativa. Se criticaba, sobre todo, el divorcio entre lo enseñado y las metas de la instrucción. La evaluación se dejaba, en último término, en manos de una interpretación totalmente personal del profesor. Como solución se proponía: a) elaboración de taxonomías para formular objetivos, b) diversificación de fuentes de información, exámenes, expedientes académicos, técnicas de repesca y tests, c) unificación de criterios de corrección a partir del acuerdo entre los correctores de las pruebas y d) revisión de los juicios de valoración mediante procedimientos tales como la doble corrección, o la media de distintos correctores. Como puede verse, se trata de criterios en buena medida vigentes actualmente y, en algún caso, incluso avanzados.

Pero quien es tradicionalmente considerado como el padre de la evaluación educativa es Tyler, por ser el primero en dar una visión metódica de la misma, superando desde el conductismo, muy en boga en el momento, la mera evaluación psicológica. Plantea la necesidad de una evaluación científica que sirva para perfeccionar la calidad de la educación. La obra de síntesis la publica unos años después (Tyler, 1950), exponiendo de manera clara su idea de "curriculum", e integrando en él su método sistemático de evaluación educativa, como el proceso surgido para determinar en qué medida han sido alcanzados los objetivos previamente establecidos.

El "currículo" viene delimitado por las cuatro cuestiones siguientes:

a) ¿Qué objetivos se desean conseguir?

b) ¿Con qué actividades se pueden alcanzar?

c) ¿Cómo pueden organizarse eficazmente estas experiencias?

d) ¿Cómo se puede comprobar si se alcanzan los objetivos?

Y la buena evaluación precisa de las siguientes condiciones:

a) Propuesta clara de objetivos.

b) Determinación de las situaciones en las que se deben manifestar las conductas esperadas.

c) Elección de instrumentos apropiados de evaluación.

d) Interpretación de los resultados de las pruebas.

e) Determinación de la fiabilidad y objetividad de las medidas.

Esta evaluación ya no es una simple medición, porque supone un juicio de valor sobre la información recogida. Se alude, aunque sin desarrollar, a la toma de decisiones sobre los aciertos o fracasos de la programación, en función de los resultados de los alumnos, algo que retomarán otros importantes evaluadores como Cronbach y Sufflebeam unos años después.

Para Tyler, la referencia central en la evaluación son los objetivos preestablecidos, que deben ser cuidadosamente definidos en términos de conducta (Mager, 1962), teniendo en cuenta que deben marcar el desarrollo individual del alumno, pero dentro de un proceso socializador.

El objeto del proceso evaluativo es determinar el cambio ocurrido en los alumnos, pero su función es más amplia que el hacer explícito este cambio a los propios alumnos, padres y profesores; es también un medio para informar sobre la eficacia del programa educacional y también de educación continua del profesor. Se trata, según Guba y Lincoln (1989), de lasegunda generación de la evaluación. Desgraciadamente, esta visión evaluativa global no fue suficientemente apreciada, ni explotada, por aquellos que utilizaron sus trabajos (Bloom, 1975; Guba y Lincoln, 1982).

A pesar de lo anterior y de que las reformas tylerianas no siempre se aplicaron de inmediato, las ideas de Tyler fueron muy bien acogidas por los especialistas en desarrollo curricular y por los profesores. Su esquema era racional y se apoyaba en una tecnología clara, fácil de entender y aplicar (Guba y Lincoln, 1982) y encajaba perfectamente en la racionalidad del análisis de la tarea que comenzaba a usarse con éxito en ámbitos educativos militares (Gagné, 1971).

Tras la Segunda Guerra Mundial, se extienden mucho las instituciones y servicios educativos de todo tipo, se producen cantidad de tests estandarizados, se avanza en la tecnología de la medición y en los principios estadísticos del diseño experimental y aparecen las famosas taxonomías de los objetivos educativos (Bloom y otros, 1956; Krathwohl y otros, 1964). Sin embargo, en esta época, la aportación de la evaluación a la mejora de la enseñanza es escasa debido a la carencia de planes coherentes de acción. Se escribe mucho de evaluación, pero con escasa influencia en el perfeccionamiento de la labor instruccional.

Ralph W. Tyler murió el 18 de febrero de 1994, superados los noventa años de vida, tras siete décadas de fructíferas aportaciones y servicios a la evaluación, a la investigación y a la educación en general. Destacando, entre otros, los siguientes aspectos en el pensamiento de Tyler al final de sus días:

a) Necesidad de analizar cuidadosamente los propósitos de la evaluación, antes de ponerse a evaluar. Los actuales planteamientos de evaluaciones múltiples y alternativas deben ajustarse a este principio

b) El propósito más importante en la evaluación de los alumnos es guiar su aprendizaje, esto es, ayudarles a que aprendan. Para ello es necesaria una evaluación comprensiva de todos los aspectos significativos de su rendimiento; no basta con asegurarse que hacen regularmente el trabajo diario.

c) El "portfolio" es un instrumento valioso de evaluación, pero depende de su contenido.

d) La verdadera evaluación debe ser idiosincrásica, adecuada a las peculiaridades del alumno y el centro. En rigor, la comparación de centros no es posible.

e) Los profesores deben rendir cuentas de su acción educativa ante los padres de los alumnos. Para ello, es necesario interaccionar con ellos de manera más frecuente y más informal.

Medio siglo después de que Tyler revolucionara el mundo de la evaluación educativa, se observa la fortaleza, coherencia y vigencia de su pensamiento. Como acabamos de ver, sus ideas básicas, convenientemente actualizadas, se entroncan fácilmente en las corrientes más actuales de la evaluación educativa.

El desarrollo de los sesenta

Los años sesenta traerán nuevos aires a la evaluación educativa, entre otras cosas porque se empezó a prestar interés por algunas de las llamadas de atención de Tyler, relacionadas con la eficacia de los programas y el valor intrínseco de la evaluación para la mejora de la educación.

En esa época surge un cierto conflicto entre la sociedad americana y su sistema educativo, sobre todo porque los rusos iban por delante en la carrera especial. Aparece un cierto desencanto con la escuela pública y crece la presión por la rendición de cuentas (MacDonald, 1976). Creándose una nueva evaluación no sólo de alumnos, sino orientada a incidir en los programas y en la práctica educativa global.
Este movimiento se vio también potenciado por el desarrollo de nuevos medios tecnológicos (audiovisuales, ordenadores...) y el de la enseñanza programada, cuyas posibilidades educativas despertaron el interés entre los profesionales de la educación.

De la misma forma que la proliferación de programas sociales en la década anterior había impulsado la evaluación de programas en el área social, los años sesenta serán fructíferos en demanda de evaluación en el ámbito de la educación. Esta nueva dinámica en la que entra la evaluación, hace que, aunque ésta se centraba en los alumnos como sujeto que aprende, y el objeto de valoración era el rendimiento de los mismos, sus funciones, su enfoque y su última interpretación variará según el tipo de decisión buscada.

Junto al desencanto de la escuela pública, cabe señalar la recesión económica que caracteriza los finales años sesenta, y, sobre todo, la década de los setenta. Ello hizo que la población civil, como contribuyentes, y los propios legisladores se preocupasen por la eficacia y el rendimiento del dinero que se empleaba en la mejora del sistema escolar. A finales de los años sesenta, y como consecuencia de lo anterior, entra en escena un nuevo movimiento, la era de la rendición de cuentas, que se asocia fundamentalmente a la responsabilidad del personal docente en el logro de objetivos educativos establecidos.

Otra dimensión de la responsabilidad escolar nos la ofrece Popham (1980), cuando se refiere al movimiento de descentralización escolar durante los últimos años sesenta y principios de los setenta. Los grandes distritos escolares se dividieron en áreas geográficas más pequeñas, y, por consiguiente, con un control ciudadano más directo sobre lo que ocurría en las escuelas.

Como consecuencia de estos focos de influencia, se amplió considerablemente el fenómeno de la evaluación educativa. El sujeto directo de la evaluación siguió siendo el alumno, pero también todos aquellos factores que confluyen en el proceso educativo (el programa educativo en un sentido amplio, profesor, medios, contenidos, experiencias de aprendizaje, organización, etc.), así como el propio producto educativo.

Como resultado de estas nuevas necesidades de la evaluación, se inicia durante esta época un periodo de reflexión y de ensayos teóricos con ánimo de clarificar la multidimensionalidad del proceso evaluativo. Estas reflexiones teóricas enriquecerán decisivamente el ámbito conceptual y metodológico de la evaluación, lo que unido a la tremenda expansión de la evaluación de programas ocurrida durante estos años, dará lugar al nacimiento de esa nueva modalidad de investigación aplicada que hoy denominamos como investigación evaluativa.

Como hitos de la época hay que destacar dos ensayos por su decisiva influencia: el artículo de Cronbach (1963), Course improvement through evaluation, y el de Scriven (1967), The methodology of evaluation. La riqueza de ideas evaluativas expuestas en estos trabajos nos obligan a que, aunque brevemente, nos refiramos a ellas.

Cronbach (1963), el concepto, funciones y metodología de la evaluación, se resalta las sugerencias siguientes:

a) Asociar el concepto de evaluación a la toma de decisiones. Distingue el autor tres tipos de decisiones educativas a las cuales la evaluación sirve: a) sobre el perfeccionamiento del programa y de la instrucción, b) sobre los alumnos (necesidades y méritos finales) y c) acerca de la regulación administrativa sobre la calidad del sistema, profesores, organización, etc. De esta forma, Cronbach abre el campo conceptual y funcional de la evaluación educativa mucho más allá del marco conceptual dado por Tyler, aunque en su línea de sugerencias.

b) La evaluación que se usa para mejorar un programa mientras éste se está aplicando, contribuye más al desarrollo de la educación que la evaluación usada para estimar el valor del producto de un programa ya concluido.

c) Poner en cuestión la necesidad de que los estudios evaluativos sean de tipo comparativo. Entre las objeciones a este tipo de estudios, el autor destaca el hecho de que, con frecuencia, las diferencias entre las puntuaciones promedio entre-grupos son menores que las intra-grupos, así como otras referentes a las dificultades técnicas que en el marco educativo presentan los diseños comparativos. Cronbach aboga por unos criterios de comparación de tipo absoluto, reclamando la necesidad de una evaluación con referencia al criterio, al defender la valoración con relación a unos objetivos bien definidos y no la comparación con otros grupos.

d) Se ponen en cuestión los estudios a gran escala, puesto que las diferencias entre los tratamientos pueden ser muy grandes e impedir discernir con claridad las causas de los resultados. Se defienden los estudios más analíticos, bien controlados, que pueden usarse para comparar versiones alternativas de un programa.

e) Metodológicamente Cronbach propone que la evaluación debe incluir: 1) estudios de proceso –hechos que tienen lugar en el aula–; 2) medidas de rendimiento y actitudes –cambios observados en los alumnos– y 3) estudios de seguimientos, esto es, el camino posterior seguido por los estudiantes que han participado en el programa.

f) Desde esta óptica, las técnicas de evaluación no pueden limitarse a los tests de rendimiento. Los cuestionarios, las entrevistas, la observación sistemática y no sistemática, las pruebas de ensayo, según el autor, ocupan un lugar importante en la evaluación, en contraste al casi exclusivo uso que se hacía de los tests como técnicas de recogida de información.

Scriven (1967), las fecundas distinciones terminológicas ampliaron enormemente el campo semántico de la evaluación, a la vez que clarificaron el quehacer evaluativo. Destacamos a continuación las aportaciones más significativas:

a) Se establece de forma tajante la diferencia entre la evaluación como actividad metodológica, lo que el autor llama meta de la evaluación, y las funciones de la evaluación en un contexto particular. Así, la evaluación como actividad metodológica es esencialmente igual, sea lo que fuera lo que estemos evaluando. El objetivo de la evaluación es invariante, supone en definitiva el proceso por el cual estimamos el valor de algo que se evalúa, mientras que las funciones de la evaluación pueden ser enormemente variadas. Estas funciones se relacionan con el uso que se hace de la información recogida.

b) Scriven señala dos funciones distintas que puede adoptar la evaluación: la formativa y la sumativa. Propone el término de evaluación formativa para calificar aquel proceso de evaluación al servicio de un programa en desarrollo, con objeto de mejorarlo, y el término de evaluación sumativa para aquel proceso orientado a comprobar la eficacia del programa y tomar decisiones sobre su continuidad.

c) Otra importante contribución de Scriven es la crítica al énfasis que la evaluación da a la consecución de objetivos previamente establecidos, porque si los objetivos carecen de valor, no tiene ningún interés saber hasta qué punto se han conseguido. Resalta la necesidad de que la evaluación debe incluir tanto la evaluación de los propios objetivos como el determinar el grado en que éstos han sido alcanzados.

d) Clarificadora es también la distinción que hace Scriven entre evaluación intrínseca y evaluación extrínseca, como dos formas diferentes de valorar un elemento de la enseñanza. En una evaluación intrínseca se valora el elemento por sí mismo, mientras que en la evaluación extrínseca se valora el elemento por los efectos que produce en los alumnos. Esta distinción resulta muy importante a la hora de considerar el criterio a utilizar, pues en la evaluación intrínseca el criterio no se formula en términos de objetivos operativos, mientras que sí se hace en la evaluación extrínseca .

e) Scriven adopta una posición contraria a Cronbach, defendiendo el carácter comparativo que deben presentar los estudios de evaluación. Admite con Cronbach los problemas técnicos que los estudios comparativos entrañan y la dificultad de explicar las diferencias entre programas, pero Scriven considera que la evaluación como opuesta a la mera descripción implica emitir un juicio sobre la superioridad o inferioridad de lo que se evalúa con respecto a sus competidores o alternativas.

Estas dos aportaciones comentadas influyeron decisivamente en la comunidad de evaluadores, incidiendo no sólo en estudios en la línea de la investigación evaluativa, a la que se referían preferentemente, sino también en la evaluación orientada al sujeto. Estamos ante la tercera generación de la evaluación que, según Guba y Lincoln (1989), se caracteriza por introducir la valoración, el juicio, como un contenido intrínseco en la evaluación. Ahora el evaluador no sólo analiza y describe la realidad, además, la valora, la juzga con relación a distintos criterios.

Durante estos años sesenta aparecen muchas otras aportaciones que va perfilando una nueva concepción evaluativa, que terminará de desarrollarse y, sobre todo, de extenderse en las décadas posteriores. Se percibe que el núcleo conceptual de la evaluación lo constituye la valoración del cambio ocurrido en el alumno como efecto de una situación educativa sistemática, siendo unos objetivos bien formulados el mejor criterio para valorar este cambio. Así mismo, se comienza a prestar atención no sólo a los resultados pretendidos, sino también a los efectos laterales o no pretendidos, e incluso a resultados o efectos a largo plazo (Cronbach, 1963, Scriven, 1967).

A pesar de las voces críticas con la operativización de objetivos, no sólo por la estructura de valor que en ello subyace, sino también por centrar la valoración del aprendizaje en los productos más fácilmente mensurables, a veces los más bajos en las taxonomías del dominio cognoscitivo, y de que se prestaba escasa atención a los objetivos del dominio afectivo, que presentan mayor dificultad de tratamiento operativo, el modelo evaluativo de Tyler se enriquecería mucho en estos años, con trabajos sobre los objetivos educativos que continuarían y perfeccionarían el camino emprendido por Bloom, Gagné 1971 y otros. Entre otras cosas aparecieron nuevas ideas sobre la evaluación de la interacción en el aula y sobre sus efectos en los logros de los alumnos.

Stake (1967) propuso su modelo de evaluación, que sigue la línea de Tyler, pero es más completo al considerar las discrepancias entre lo observado y lo esperado en los "antecedentes" y "transacciones", y posibilitar algunas bases para elaborar hipótesis acerca de las causas y los fallos en los resultados finales.

Metfessell y Michael (1967) presentaron también un modelo de evaluación de la efectividad de un programa educativo en el cual, aún siguiendo el modelo básico de Tyler, proponían la utilización de una lista comprensiva de criterios diversos que los evaluadores podrían tener en cuenta en el momento de la valoración y, por consiguiente, no centrarse meramente en los conocimientos intelectuales alcanzados por los estudiantes.

Suchman (1967) profundiza en la convicción de que la evaluación debe basarse en datos objetivos que sean analizados con metodología científica, matizando que la investigación científica es preferentemente teórica y, en cambio, la investigación evaluativa es siempre aplicada. Su principal propósito es descubrir la efectividad, éxito o fracaso de un programa al compararlo con los objetivos propuestos y, así, trazar las líneas de su posible redefinición. Esta investigación evaluativa para Suchman debe tener en cuenta:
a) La naturaleza del destinatario del objetivo y la del propio objetivo,
b) El tiempo necesario para que se realice el cambio propuesto,
c) El conocimiento de si los resultados esperados son dispersos o concentrados y
d) Los métodos que han de emplearse para alcanzar los objetivos.
Suchman, además, defiende la utilización de evaluadores externos para evitar todo tipo de tergiversación de los profesores muy implicados en los procesos instruccionales.

Desde finales de los sesenta los especialistas se pronunciarán decisivamente a favor de la evaluación criterial, en cuanto que es el tipo de evaluación que suministra una información real y descriptiva del estatus del sujeto o sujetos respecto a los objetivos de enseñanza previstos, así como la valoración de ese estatus por comparación con un estándar o criterio de realizaciones deseables, siendo irrelevantes, al efecto de contraste, los resultados obtenidos por otros sujetos o grupo de sujetos.

En las prácticas evaluativas de esta década de los sesenta se observan dos niveles de actuación. Un nivel podemos calificarlo como la evaluación orientada hacia los individuos,fundamentalmente alumnos y profesores. El otro nivel, es el de la evaluación orientada a la toma de decisiones sobre el "instrumento" o "tratamiento" o "programa" educativo. Este último nivel, impulsado también por la evaluación de programas en el ámbito social, será la base para la consolidación en el terreno educativo de la evaluación de programas y de la investigación evaluativa.

La consolidación de la investigación evaluativa

Si con algo se podría caracterizar las aportaciones teóricas que nos ofrecen los especialistas durante los años setenta es con la proliferación de toda clase de modelos evaluativos que inundan el mercado bibliográfico, modelos de evaluación que expresan la propia óptica del autor que los propone sobre qué es y cómo debe conducirse un proceso evaluativo. Se trata, por tanto, de una época caracterizada por la pluralidad conceptual y metodológica. Estos enriquecerán considerablemente el vocabulario evaluativo.

Es cierto que esas dos tendencias se observan hoy en las propuestas evaluativas, y que algunos modelos pueden ser representativos de ellas, pero los diferentes modelos, considerados particularmente, se diferencian más por destacar o enfatizar alguno o algunos de los componentes del proceso evaluativo y por la particular interpretación que a este proceso le dan.

También son varios los autores los que consideran los modelos no como excluyentes, sino más bien como complementarios y que el estudio de los mismos (al menos aquellos que han resultado ser más prácticos) llevará al evaluador a adoptar una visión más amplia y comprensiva de su trabajo.

En este movimiento de propuestas de modelos de evaluación cabe distinguir dos épocas con marcadas diferencias conceptuales y metodológicas. En una primera época, las propuestas seguían la línea expuesta por Tyler en su planteamiento, que ha venido a llamarse de “Consecución de Metas”. Para estos autores los objetivos propuestos siguen siendo el criterio fundamental de valoración, pero enfatizan la necesidad de aportar datos sobre la congruencia o discrepancia entre las pautas de instrucción diseñadas y la ejecución de las mismas en la realidad del aula.

Otros modelos consideran el proceso de evaluación al servicio de las instancias que deben tomar decisiones. Ejemplos notables de ellos son: probablemente el más famoso y utilizado de todos, el C.I.P.P. (contexto, input, proceso y producto), propuesto por Stufflebeam (1971) y el C.E.S. (toma sus siglas del Centro de la Universidad de California para el Estudio de la Evaluación) dirigido por Alkin (1969). Estos autores van más allá de la evaluación centrada en resultados finales, puesto que en sus propuestas suponen diferentes tipos de evaluación, según las necesidades de las decisiones a las que sirven.

Una segunda época en la proliferación de modelos es la representada por los modelos alternativos, que con diferentes concepciones de la evaluación y de la metodología a seguir comienzan a aparecer en la segunda mitad de esta década de los setenta. Entre ellos destacan la Evaluación Responsable de Stake (1976), la Evaluación Democrática de MacDonald (1976), la Evaluación Iluminativa de Parlett y Hamilton (1977) y la Evaluación como crítica artística de Eisner (1985).

En líneas generales, este segundo grupo de modelos evaluativos enfatiza el papel de la audiencia de la evaluación y de la relación del evaluador con ella. La audiencia prioritaria de la evaluación en estos modelos no es quien debe tomar las decisiones, como en los modelos orientados a la toma de decisiones, ni el responsable de elaborar los currículos u objetivos, como en los modelos de consecución de metas. La audiencia prioritaria son los propios participantes del programa. La relación entre el evaluador y la audiencia debe ser "transaccional y fenomenológica".

Este resumen de modelos de la época de eclosión es suficiente para aproximarnos al amplio abanico conceptual teórico y metodológico que hoy se relaciona con la evaluación. Ello explica que cuando Nevo (1989) pretende realizar una conceptualización de la evaluación, a partir de la revisión de la literatura especializada, atendiendo a los tópicos ¿qué es la evaluación? ¿qué funciones tiene? ¿cuál es el objeto de evaluación?... no encuentra una única respuesta a estas cuestiones. Es fácilmente comprensible que las exigencias que plantea la evaluación de programas de una parte, y la evaluación para la toma de decisiones sobre los individuos de otra, conducen a una gran variedad de esquemas evaluativos reales utilizados por profesores, directores, inspectores y administradores públicos. Pero también es cierto que bajo esta diversidad subyacen diferentes concepciones teóricas y metodológicas sobre la evaluación. Diferentes concepciones que han dado lugar a una apertura y pluralidad conceptual en el ámbito de la evaluación en varios sentidos. A continuación se destaca los puntos mas sobresalientes de esta pluralidad conceptual.

a) Diferentes conceptos de evaluación. Por una parte existe la clásica definición dada por Tyler: la evaluación como el proceso de determinar el grado de congruencia entre las realizaciones y los objetivos previamente establecidos, a la que corresponden los modelos orientados hacia la consecución de metas. Contrasta esta definición con aquella más amplia que se propugna desde los modelos orientados a la toma de decisiones: la evaluación como el proceso de determinar, obtener y proporcionar información relevante para juzgar decisiones alternativas.

Además, el concepto de evaluación de Scriven (1967), como el proceso de estimar el valor o el mérito de algo, es retomado por Cronbach (1982), con objeto de señalar las diferencias que comportarían los juicios valorativos en caso de estimar el mérito (se vincularía a características intrínsecas de lo que se evalúa) o el valor (se vincularía al uso y aplicación que tendría para un contexto determinado).

b) Diferentes criterios. De las definiciones apuntadas anteriormente se desprende que el criterio a utilizar para la valoración de la información también cambia. Desde la óptica de la consecución de metas, una buena y operativa definición de los objetivos constituye el criterio fundamental. Desde la perspectiva de las decisiones y situados dentro de un contexto político.

Las definiciones de evaluación que acentúan la determinación del "mérito" como objetivo de la evaluación, utilizan criterios estándares sobre los que los expertos o profesionales están de acuerdo. Se trata de modelos relacionados con la acreditación y el enjuiciamiento profesional.

c) Pluralidad de procesos evaluativos dependiendo de la percepción teórica que sobre la evaluación se mantenga. Los modelos de evaluación citados y otros más que pueden encontrarse en la bibliografía, representan diferentes propuestas para conducir una evaluación.

d) Pluralidad de objetos de evaluación. Como dice Nevo (1989), existen dos conclusiones importantes que se obtienen de la revisión de la bibliografía sobre la evaluación. Por un lado, cualquier cosa puede ser objeto de evaluación y ésta no debería limitarse a estudiantes y profesores y, por otro, una clara identificación del objeto de evaluación es una importante parte en cualquier diseño de evaluación.

e) Apertura, reconocida en general por todos los autores, de la información necesaria en un proceso evaluativo para dar cabida no sólo a los resultados pretendidos, sino a los efectos posibles de un programa educativo, sea pretendido o no. Incluso Scriven (1974) propone una evaluación en la que no se tenga en cuenta los objetivos pretendidos, sino valorar todos los efectos posibles. Apertura también respecto a la recogida de información no sólo del producto final, sino también sobre el proceso educativo. Y apertura en la consideración de diferentes resultados de corto y largo alcance. Por último, apertura también en considerar no sólo resultados de tipo cognitivo, sino también afectivos.

f) Pluralidad también reconocida de las funciones de la evaluación en el ámbito educativo, recogiéndose la propuesta de Scriven entre evaluación formativa y sumativa, y añadiéndose otras de tipo socio-político y administrativas (Nevo, 1983).

g) Diferencias en el papel jugado por el evaluador, lo que ha venido a llamarse evaluación interna vs. evaluación externa. No obstante, una relación directa entre el evaluador y las diferentes audiencias de la evaluación es reconocida por la mayoría de los autores (Nevo, 1983).

h) Pluralidad de audiencia de la evaluación y, por consiguiente, pluralidad en los informes de evaluación. Desde informes narrativos, informales, hasta informes muy estructurados.

i) Pluralidad metodológica. Las cuestiones metodológicas surgen desde la dimensión de la evaluación como investigación evaluativa, que viene definida en gran medida por la diversidad metodológica.

El anterior resumen recoge las aportaciones a la evaluación en los años setenta y ochenta, la época que se ha denominado época de la profesionalización, se profundizó en los planteamientos teóricos y prácticos y se consolidó la evaluación como investigación evaluativa en los términos antes definida.

La cuarta generación

A finales de los ochenta, tras todo este desarrollo antes descrito, Guba y Lincoln (1989) ofrecen una alternativa evaluadora, que denominan cuarta generación, pretendiendo superar lo que según estos autores son deficiencias de las tres generaciones anteriores, tales como una visión gestora de la evaluación, una escasa atención al pluralismo de valores y un excesivo apego al paradigma positivista. La alternativa de Guba y Lincoln la denominan respondente y constructivista, integrando de alguna manera el enfoque respondente propuesto en primer lugar por Stake (1975), y la epistemología postmoderna del constructivismo (Russell y Willinsky, 1997). Las demandas, las preocupaciones y los asuntos de los implicados o responsables (stakeholders) sirven como foco organizativo de la evaluación (como base para determinar qué información se necesita), que se lleva a cabo dentro de los planteamientos metodológicos del paradigma constructivista.

La utilización de las demandas, preocupaciones y asuntos de los implicados es necesaria, según Guba y Lincoln, porque:

a) Son grupos de riesgo ante la evaluación y sus problemas deben ser convenientemente contemplados, de manera que se sientan protegidos ante tal riesgo.

b) Los resultados pueden ser utilizados en su contra en diferentes sentidos, sobre todo si están al margen del proceso.

c) Son potenciales usuarios de la información resultante de la evaluación.

d) Pueden ampliar y mejorar el rango de la evaluación.

e) Se produce una interacción positiva entre los distintos implicados.

El cambio paradigmático lo justifican estos autores porque:

a) La metodología convencional no contempla la necesidad de identificar las demandas, preocupaciones y asuntos de los implicados.

b) Para llevar a cabo lo anterior se necesita una postura de descubrimiento más que de verificación, típica del positivismo.

c) No se tienen en cuenta suficientemente los factores contextuales.

d) No se proporcionan medios para valoraciones caso por caso.

e) La supuesta neutralidad de la metodología convencional es de dudosa utilidad cuando se buscan juicios de valor acerca de un objeto social.

Partiendo de estas premisas, el evaluador es responsable de determinadas tareas, que realizará secuencialmente o en paralelo, construyendo un proceso ordenado y sistemático de trabajo. Las responsabilidades básicas del evaluador de la cuarta generación son las siguientes:

1) Identificar todos los implicados con riesgo en la evaluación.

2) Resaltar para cada grupo de implicados sus construcciones acerca de lo evaluado y sus demandas y preocupaciones al respecto.

3) Proporcionar un contexto y una metodología hermenéutica para poder tener en cuenta, comprender y criticar las diferentes construcciones, demandas y preocupaciones.

4) Generar el máximo acuerdo posible acerca de dichas construcciones, demandas y preocupaciones.

5) Preparar una agenda para la negociación acerca de temas no consensuados.

6) Recoger y proporcionar la información necesaria para la negociación.

7) Formar y hacer de mediador para un "forum" de implicados para la negociación.

8) Desarrollar y elaborar informes para cada grupo de implicados sobre los distintos acuerdos y resoluciones acerca de los intereses propios y de los de otros grupos.

9) Reciclar la evaluación siempre que queden asuntos pendientes de resolución.

La propuesta de Guba y Lincoln (1989) se extiende bastante en la explicación de la naturaleza y características del paradigma constructivista en contraposición con las del positivista.

Cuando se habla de los pasos o fases de la evaluación en esta cuarta generación, sus proponentes citan doce pasos o fases, con diferentes subfases en cada una de estas. Estos pasos son los siguientes:

1) Establecimiento de un contrato con un patrocinador o cliente.

• Identificación del cliente o patrocinador de la evaluación.

• Identificación del objeto de la evaluación.

• Propósito de la evaluación (Guba y Lincoln, 1982).

• Acuerdo con el cliente por el tipo de evaluación.

• Identificación de audiencias.

• Breve descripción de la metodología a usar.

• Garantía de acceso a registros y documentos.

• Acuerdo por garantizar la confidencialidad y anonimato hasta donde sea posible.

• Descripción del tipo de informe a elaborar.

• Listado de especificaciones técnicas.

2) Organización para reciclar la investigación.

• Selección y entrenamiento del equipo evaluador.

• Consecución de facilidades y acceso a la información (Lincoln y Guba, 1985).

3) Identificación de las audiencias (Guba y Lincoln, 1982).

• Agentes.

• Beneficiarios.

• Victimas.

4) Desarrollo de construcciones conjuntas dentro de cada grupo o audiencia (Glaser y Strauss, 1967; Glaser, 1978; Lincoln y Guba, 1985).

5) Contraste y desarrollo de las construcciones conjuntas de las audiencias.

• Documentos y registros.

• Observación.

• Literatura profesional.

• Círculos de otras audiencias.

• Construcción ética del evaluador.

6) Clasificación de las demandas, preocupaciones y asuntos resueltos.

7) Establecimiento de prioridades en los temas no resueltos.

8) Recogida de información.

9) Preparación de la agenda para la negociación.

10) Desarrollo de la negociación.

11) Informes (Zeller, 1987; Licoln y Guba, 1988).

12) Reciclado/revisión.

Para juzgar la calidad de la evaluación, se nos ofrecen tres enfoques que se denominan paralelo, el ligado al proceso hermenéutico y el de autenticidad.

Los criterios paralelos, de confianza, se denominan así porque intentan ser paralelos a los criterios de rigor utilizados muchos años dentro del paradigma convencional. Estos criterios han sido validez interna y externa, fiabilidad y objetividad. Sin embargo, los criterios deban ser acordes con el paradigma fundamentador. En el caso de la cuarta generación los criterios que se ofrecen son los de credibilidad, transferencia, dependencia y confirmación (Lincoln y Guba, 1986).

El criterio de credibilidad es paralelo al de validez interna, de forma que la idea de isomorfismo entre los hallazgos y la realidad se reemplaza por el isomorfismo entre las realidades construidas de las audiencias y las reconstrucciones del evaluador atribuidas a ellas. Para conseguir esto existen varias técnicas, entre las que destacan las siguientes: a) el compromiso prolongado, b) la observación persistente, c) el contraste con colegas, d) el análisis de casos negativos (Kidder, 1981), e) la subjetividad progresiva y f) el control de los miembros. Latransferencia puede verse como paralela a la validez externa, la dependencia es paralela al criterio de fiabilidad y la confirmación puede verse como paralela a la objetividad.

Otra manera de juzgar la calidad de la evaluación es el análisis dentro del propio proceso, algo que encaja con el paradigma hermenéutico, a través de un proceso dialéctico.

Pero estos dos tipos de criterios, aunque útiles, no son del todo satisfactorios para Guba y Lincoln, que defienden con más ahínco los criterios que denominan de autenticidad, también de base constructivista. Estos criterios incluyen los siguientes: a) imparcialidad, justicia, b) autenticidad ontológica, c) autenticidad educativa, d) autenticidad catalítica y e) autenticidad táctica (Lincoln y Guba, 1986).

Este análisis de la cuarta generación se puede terminarse con los rasgos con los que definen Guba y Lincoln a la evaluación:

a) La evaluación es un proceso sociopolítico.

b) La evaluación es un proceso conjunto de colaboración.

c) la evaluación es un proceso de enseñanza/aprendizaje.

d) La evaluación es un proceso continuo, recursivo y altamente divergente.

e) La evaluación es un proceso emergente.

f) La evaluación es un proceso con resultados impredecibles.

g) La evaluación es un proceso que crea realidad.

En esta evaluación, se retienen las características del evaluador fruto de las tres primeras generaciones, esto es, la de técnico, la de analista y la de juez, pero estas deben ampliarse con destrezas para recoger e interpretar datos cualitativos, con la de historiador e iluminador, con la de mediador de juicios, así como un papel más activo como evaluador en un contexto socio-político concreto.

El nuevo impulso alrededor de Stufflebeam

Para terminar este recorrido analítico-histórico desde los primeros intentos de medición educativa hasta la actual investigación evaluativa en educación, queremos recoger las recomendaciones que más recientemente nos viene ofreciendo una de las figuras señeras de este campo en la segunda mitad del siglo XX. Nos estamos refiriendo a Daniel L. Stufflebeam, proponente del modelo CIPP (el más utilizado) a finales de los sesenta.

Se parte de los cuatro principios, esto es, de la idea de que cualquier buen trabajo de investigación evaluativa debe ser:
a) Útil, esto es, proporcionar información a tiempo e influir,
b) Factible, esto es, debe suponer un esfuerzo razonable y debe ser políticamente viable,
c) Apropiada, adecuada, legítima, esto es, ética y justa con los implicados, y
d) Segura y precisa a la hora de ofrecer información y juicios sobre el objeto de la evaluación. Además, la evaluación se ve como una "transdisciplina", pues es aplicable a muchas disciplinas diferentes y a muchos objetos diversos (Scriven, 1994).

Stufflebeam invoca a la responsabilidad del evaluador, que debe actuar de acuerdo a principios aceptados por la sociedad y a criterios de profesionalidad, emitir juicios sobre la calidad y el valor educativo del objeto evaluado y debe asistir a los implicados en la interpretación y utilización de su información y sus juicios. Sin embargo, es también su deber, y su derecho, estar al margen de la lucha y la responsabilidad política por la toma de decisiones y por las decisiones tomadas.

Para evaluar la educación en una sociedad moderna, Stufflebeam (1994) nos dice que se deben tomar algunos criterios básicos de referencia como los siguientes:

• Las necesidades educativas. Es necesario preguntarse si la educación que se proporciona cubre las necesidades de los estudiantes y de sus familias en todos los terrenos a la vista de los derechos básicos, en este caso, dentro de una sociedad democrática.

• La equidad. Hay que preguntarse si el sistema es justo y equitativo a la hora de proporcionar servicios educativos, el acceso a los mismos, la consecución de metas, el desarrollo de aspiraciones y la cobertura para todos los sectores de la comunidad .

• La factibilidad. Hay que cuestionar la eficiencia en la utilización y distribución de recursos, la adecuación y viabilidad de las normas legales, el compromiso y participación de los implicados y todo lo que hace que el esfuerzo educativo produzca el máximo de frutos posibles.

• La excelencia como objetivo permanente de búsqueda. La mejora de la calidad, a partir del análisis de las prácticas pasadas y presentes es uno de los fundamentos de la investigación evaluativa.

Tomando el referente de estos criterios y sus derivaciones, Stufflebeam sumariza una serie de recomendaciones para llevar a cabo buenas investigaciones evaluativas y mejorar el sistema educativo. Estas recomendaciones son las siguientes:

1) Los planes de evaluación deben satisfacer los cuatro requerimientos de utilidad, factibilidad, legitimidad y precisión.

2) Las entidades educativas deben examinarse por su integración y servicio a los principios de la sociedad democrática, equidad, bienestar, etc.

3) Las entidades educativas deben ser valoradas tanto por su mérito (valor intrínseco, calidad respecto a criterios generales) como por su valor (valor extrínseco, calidad y servicio para un contexto particular), como por su significación en la realidad del contexto en el que se ubica. Scriven (1998) nos señala que usando otras denominaciones habituales, mérito tiene bastante equivalencia con el término calidad, valor con el de relación coste-eficacia y significación con el de importancia. En todo caso, los tres conceptos son dependientes del contexto, sobre todo significación, de manera que entender la diferencia entre dependencia del contexto y arbitrariedad es parte de la comprensión de la lógica de la evaluación.

4) La evaluación de profesores, instituciones educativas, programas, etc, debe relacionarse siempre con el conjunto de sus deberes, responsabilidades y obligaciones profesionales o institucionales, etc. Quizás uno de los retos que deben abordar los sistemas educativos es la definición más clara y precisa de estos deberes y responsabilidades. Sin ello, la evaluación es problemática, incluso en el terreno formativo (Scriven, 1994).

5) Los estudios evaluativos deben ser capaces de valorar hasta qué medida los profesores y las instituciones educativas son responsables y rinden cuentas del cumplimiento de sus deberes y obligaciones profesionales (Scriven, 1994).

6) Los estudios evaluativos deben proporcionar direcciones para la mejora, porque no basta con emitir un juicio sobre el mérito o el valor de algo.

7) Recogiendo los puntos anteriores, todo estudio evaluativo debe tener un componente formativo y otro sumativo.

8) Se debe promover la autoevaluación profesional, proporcionando a los educadores las destrezas para ello y favoreciendo actitudes positivas hacia ella.

9) La evaluación del contexto (necesidades, oportunidades, problemas en un área,...) debe emplearse de manera prospectiva, para localizar bien las metas y objetivos y definir prioridades. Asimismo, la evaluación del contexto debe utilizarse retrospectivamente, para juzgar bien el valor de los servicios y resultados educativos, en relación con las necesidades de los estudiantes (Scriven, 1991)

10) La evaluación de las entradas (inputs) debe emplearse de manera prospectiva, para asegurar el uso de un rango adecuado de enfoques según las necesidades y los planes.

11) La evaluación del proceso debe usarse de manera prospectiva para mejorar el plan de trabajo, pero también de manera retrospectiva para juzgar hasta qué punto la calidad del proceso determina el por qué los resultados son de un nivel u otro (Stufflebean 1987).

12) La evaluación del producto es el medio para identificar los resultados buscados y no buscados en los participantes o afectados por el objeto evaluado. Se necesita una valoraciónprospectiva de los resultados para orientar el proceso y detectar zonas de necesidades. Se necesita una evaluación retrospectiva del producto para poder juzgar en conjunto el mérito y el valor del objeto evaluado (Scriven, 1991).

13) Los estudios evaluativos deben emplear múltiples perspectivas, múltiples medidas de resultados, y métodos tanto cuantitativos como cualitativos para recoger y analizar la información. La pluralidad y complejidad del fenómeno educativo hace necesario emplear enfoques múltiples y multidimensionales en los estudios evaluativos (Scriven, 1991)

14) Los estudios evaluativos deben ser evaluados, incluyendo metaevaluaciones formativas para mejorar su calidad y su uso y metaevaluaciones sumativas para ayudar a los usuarios en la interpretación de sus hallazgos y proporcionar sugerencias para mejorar futuras evaluaciones.

Estas recomendaciones proporcionan elementos esenciales para un enfoque de los estudios evaluativos que Stufflebeam denomina objetivista y que se basa en la teoría ética de que la bondad moral es objetiva e independiente de los sentimientos personales o meramente humanos.

Sin entrar en el debate sobre estas valoraciones finales de Stufflebeam, ni en análisis comparativos con otras propuestas, por ejemplo con las de Guba y Lincoln (1989), nos resulta evidente que las concepciones de la investigación evaluativa son diversas, dependiendo del origen epistemológico desde el que se parte, pero apareciendo claros y contundentes algunos elementos comunes a todas las perspectivas como la contextualización, el servicio a la sociedad, la diversidad metodológica, la atención, respeto y participación de los implicados, etc., así como una mayor profesionalización de los evaluadores y una mayor institucionalización de los estudios.

Stufflebeam defiende una mayor colaboración en la mejora de las evaluaciones, estableciendo los estándares de manera participativa, pues cree que es posible la aproximación de planteamientos, con contribuciones importantes desde todos los puntos de vista.

Weiss (1998) también toma posiciones parecidas cuando nos dice que las ideas constructivistas deben hacernos pensar más cuidadosamente al usar los resultados de las evaluaciones, sintetizarlas y establecer generalizaciones, pero duda que todo haya que interpretarlo en términos exclusivamente individuales, pues existen muchos elementos comunes entre las personas, los programas y las instituciones.

Enfoques modélicos y metodológicos de la evaluación y la última perspectiva de Scriven

Tras este análisis del desarrollo de la evaluación a lo largo del Siglo XX, parece oportuno, a modo de síntesis y de conclusión, recoger y resaltar los que son considerados los principales modelos, planteamientos metodológicos, diseños, perspectivas y visiones de la evaluación en la actualidad. Su análisis, de manera compacta, es un complemento necesario para una visión como la histórica que, por su linealidad, tiene el riesgo de ofrecer una imagen disciplinar artificiosamente fraccionada.

Hemos visto que en la década de los setenta y en sus alrededores se produce una especie de eclosión de propuestas evaluativas, que tradicionalmente han venido siendo denominadas como modelos y en algunos casos como diseños de investigación evaluativa. Sabemos que existieron varias decenas de estas propuestas, pero muy concentradas en el tiempo, en la década citada. De hecho, el asunto de los propuestos modelos para la evaluación parece un tema prácticamente cerrado desde hace cuatro lustros. Ya no surgen nuevos modelos o propuestas, salvo alguna excepción como vemos más adelante.

A pesar de lo dicho, se sigue hablando de modelos, métodos y diseños en la literatura especializada, sobre todo buscando su clasificación de acuerdo con diversos criterios, origen paradigmático, propósito, metodología, etc. También en las clasificaciones, no sólo en los modelos, existe diversidad, lo que prueba que, además de dinamismo académico en el terreno de la investigación evaluativa, todavía existe cierta debilidad teórica al respecto.

Se recomienda que a la hora de plantearnos una investigación evaluativa, no contamos todavía con unos pocos modelos bien fundamentados, definidos, estructurados y completos, entre los que elegir uno de ellos, pero sí tenemos distintos enfoques modélicos y un amplio soporte teórico y empírico, que permiten al evaluador ir respondiendo de manera bastante adecuada a las distintas cuestiones que le va planteando el proceso de investigación, ayudándole a configurar un plan global, un organigrama coherente, un «modelo» científicamente robusto para llevar a cabo su evaluación.
¿Cuáles son las cuestiones que hay que responder en este proceso de construcción modélica? deben responderse y delimitar su respuesta al construir un modelo de investigación evaluativa, los aspectos siguientes:

1) Objeto de la investigación evaluativa.

2) Propósito, objetivos.

3) Audiencias/implicados/clientela.

4) Énfasis/aspectos prioritarios o preferentes.

5) Criterios de mérito o valor.

6) Información a recoger.

7) Métodos de recogida de información.

8) Métodos de análisis.

9) Agentes del proceso.

10) Secuenciación del proceso.

11) Informes/utilización de resultados.

12) Límites de la evaluación.

13) Evaluación de la propia investigación evaluativa / metaevaluación.

Para definir estos elementos hay que buscar, lógicamente, el apoyo de los diferentes enfoques modélicos, métodos, procedimientos, etc., que la investigación evaluativa ha desarrollado, sobre todo en las últimas décadas.

Volviendo a los denominados modelos de los setenta y a sus clasificaciones, podemos recoger algunas de las aparecidas en la última década en nuestro entorno académico, apoyándose en distintos autores, (Stufflebeam y Shinkfield, 1987). Esta clasificación es la siguiente :

Por su parte, Castillo y Gento (1995) ofrecen una clasificación de «métodos de evaluación» dentro de cada uno de los modelos (paradigmas), que ellos denominan conductivista-eficientistas, humanísticos y holísticos (mixtos). Una síntesis de estas clasificaciones es la siguiente:

También Scriven (1994) ofrece una clasificación de los "modelos anteriores", previamente a introducir su perspectiva transdisciplinar que luego comentamos. Este autor identifica seis visiones o enfoques alternativos en la fase «explosiva» de los modelos, además de algunas más que denomina "exóticas" y que se mueven entre los modelos de jurisprudencia y de experto. A continuación comentamos sucintamente estas visiones y los «modelos» que se adscriben a ellas.

La visión fuerte hacia la toma de decisiones, concibe al evaluador investigando con el objetivo de llegar a conclusiones evaluativas que le ayuden al que debe tomar decisiones. Los que apoyan este enfoque se preocupan de si el programa alcanza sus objetivos, pero van más allá, cuestionándose si tales objetivos cubren las necesidades que deben cubrir. Esta posición es mantenida, aunque no la hiciera explícita, por Ralph Tyler y extensamente elaborada en el modelo CIPP (Stufflebeam y otros, 1971).

Según el planteamiento tyleriano, las decisiones acerca de un programa deben basarse en el grado de coincidencia entre los objetivos y los resultados. El cambio de los alumnos, habitualmente el objetivo perseguido, es el criterio de evaluación.

A diferencia de Tyler, Stufflebeam ofrece una perspectiva más amplia de los contenidos a evaluar. Estos son las cuatro dimensiones que identifican su modelo, donde tiene lugar el programa o está la institución, inputs (I) elementos y recursos de partida, proceso (P) que hay que seguir hacia la meta y producto (P) que se obtiene. Además, se deja constancia de que el objetivo primordial de la investigación evaluativa es la mejora, la toma de decisiones para la mejora de todas y cada una de las cuatro dimensiones antes citadas.

Scriven (1994) nos dice que Stufflebeam ha seguido desarrollando su perspectiva desde que desarrolló el CIPP. Sin embargo, uno de sus colaboradores en tal empresa, Guba, tomó posteriormente una dirección diferente, tal como hemos visto al analizar la cuarta generación de la evaluación (Guba y Lincoln, 1989).

La visión débil hacia la toma de decisiones concibe al evaluador proporcionando información relevante para la toma de decisiones, pero no le obliga a emitir conclusiones evaluativas o críticas a los objetivos de los programas.

Stake, en su primera etapa, es tayleriano en cuanto a concepción evaluativa centrada en los objetivos planteados, proponiendo el método de evaluación de la figura (Stake, 1967), como rostro o imagen total de la evaluación. Esta gira en torno a los tres componentes, antecedentes, transacciones y resultados, elaborando dos matrices de datos, una de descripción y otra dejuicio. En la primera se recogen de un lado las intenciones y de otro las observaciones y, en la segunda, las normas, lo que se aprueba y los juicios, lo que se cree que debe ser.

A mitad de los setenta, Stake se aleja de la tradición tayleriana de preocupación por los objetivos y revisa su método de evaluación hacia un planteamiento que él califica como«respondente» (Stake, 1975 y 1975a), asumiendo que los objetivos del programa pueden modificarse sobre la marcha, con la finalidad de ofrecer una visión completa y holística del programa y responder a los problemas y cuestiones reales que plantean los implicados. Según Stufflebeam y Shinkfield (1987), este modelo hizo de Stake el líder de una nueva escuela de evaluación, que exige un método pluralista, flexible, interactivo, holístico, subjetivo y orientado al servicio. Este modelo sugiere la «atención al cliente» propuesta por Scriven (1973), valorando sus necesidades y expectativas.

En el método respondente el evaluador ha de entrevistar a los implicados para conocer sus puntos de vista y buscar la confluencia de las diversas perspectivas. El evaluador deberá interpretar las opiniones y diferencias de puntos de vista y presentar una amplia gama de opiniones o juicios, en lugar de presentar sus conclusiones personales.

La evaluación iluminativa (Parlett y Hamilton, 1977) tiene un enfoque holístico, descriptivo e interpretativo, con la pretensión de iluminar sobre un complejo rango de cuestiones que se dan de manera interactiva (Fernández, 1991). La evaluación democrática de MacDonald (1971 y 1976), también denominada holística, supone la participación colaborativa de los implicados, siendo el contraste de opiniones de los implicados el elemento evaluativo primordial.

Scriven (1994) analiza las seis visiones críticamente y se muestra más cercano a la visión A, la visión fuerte sobre la toma de decisiones, representada fundamentalmente por el modelo CIPP de Stufflebeam y sus planteamientos, pues dice que es la más cercana de todas a la visión del sentido común, que es la que tienen los evaluadores trabajando con sus programas, de la misma manera que los médicos trabajan con los pacientes, haciéndolo lo mejor posible, independientemente del tipo y del estado general del paciente. Scriven quiere extender esta visión con una visión o modelo que denomina transdisciplinar y que él califica como significativamente distinta de la aludida visión A y radicalmente diferente de las restantes.

En la perspectiva transdisciplinar, la investigación evaluativa tiene dos componentes: el conjunto de campos de aplicación de la evaluación y el contenido de la propia disciplina. Algo parecido a lo que ocurre a disciplinas como la estadística y la medición. En definitiva, la investigación evaluativa es una disciplina que incluye sus propios contenidos y los de otras muchas disciplinas; su preocupación por el análisis y mejora se extiende a muchas disciplinas, es transdisciplinar.

Para concluir la presente recopilación, podría cerrar este capítulo con una crítica que podría hacerse a este planteamiento de Scriven está en el excesivo énfasis relativo de la orientación al cliente, al usuario en sentido estricto. Pensamos que esta orientación debe integrarse dentro de una orientación a los implicados, donde existen distintos tipos y distintas audiencias y, por supuesto, una muy importante, son los usuarios en el sentido de Scriven, pero nos parece que la investigación evaluativa hoy en día tiene una orientación prioritaria más plural que la defendida en este apunte.

Extraído de:

Carreño, H. F. (1977). Enfoques y principios teóricos de la evaluación. Mexico: Trillas.
Castillo, S. y Gento, S. (1995). Modelos de evaluación de programas educativos. En A.Medina y L. M. Willar (Coord.), Evaluación de programas educativos, centros y profesores(pp.25-69). Madrid: Editorial Universitas, S. A.
Escudero, T. (1993). Enfoques modélicos en la evaluación de la enseñanza universitaria, Actas de las III Jornadas Nacionales de Didáctica Universitaria «Evaluación y Desarrollo Profesional» (pp. 5-59). Las Palmas: Servicio de Publicaciones, Universidad de Las Palmas.
Escudero, T. (1996). Proyecto docente e investigador. Zaragoza: Universidad de Zaragoza.
Escudero, Tomás (2003). Desde los tests hasta la investigación evaluativa actual. Un siglo, el XX, de intenso desarrollo de la evaluación en educación. Revista Electrónica de Investigación y Evaluación Educativa, v. 9, n. 1.
Fernández Ballesteros, R. (1981). Perspectivas históricas de la evaluación conductual. En R. Fernández, y J.A.I Carrobles. (Ed.), Evaluación conductual. Madrid: Ediciones Pirámide.
Fernández de Castro, J. (1973). La enseñanza programada. Madrid: CSIC.

Buscar este blog

Docentes Andragógicos