Printer Friendly

Analisis cuantitativo de items complejos de opcion multiple en ciencia, tecnologia y sociedad: escalamiento de items.

Palabras clave: Ciencia, tecnologia y sociedad (CTS); evaluacion, cuestionario de opiniones, escalamiento de items.

Quantitative Analysis of Complex Multiple-Choice Items in Science Technology and Society: Item Scaling

Resumen

La escasa atencion prestada a la calificacion y evaluacion en la investigacion de didactica de las ciencias ha sido especialmente danina para la educacion en ciencia, tecnologia y sociedad (CTS), debido a la naturaleza dialectica, hipotetica, cargada de valores y polemica de la mayoria de los temas CTS. Para superar los defectos metodologicos de los instrumentos de evaluacion CTS usados en el pasado este articulo propone un instrumento empiricamente desarrollado: el Cuestionario de Opiniones sobre Ciencia, Tecnologia y Sociedad (COCTS). Para mejorar la aplicacion del cuestionario se han sugerido algunas propuestas metodologicas, como el modelo de respuesta multiple y el calculo de un indice actitudinal global. El paso final de estas propuestas metodologicas para la aplicacion del COCTS requiere la clasificacion previa en categorias de frases CTS. Este estudio describe el proceso de clasificacion por medio de un procedimiento de escalamiento basado en un panel de jueces expertos, atendiendo al cuerpo de conocimientos de historia, epistemologia y sociologia de ciencia. La clasificacion de las frases permite un fundamento solido de las cuestiones CTS, haciendolas utiles para la evaluacion educativa, la investigacion didactica, asi como para aumentar la confianza en si mismos de los profesores en el desarrollo del curriculo CTS en las aulas de ciencias.

Abstract

The scarce attention to assessment and evaluation in science education research has been especially harmful for Science-Technology-Society (STS) education, due to the dialectic, tentative, value-laden, and controversial nature of most STS topics. To overcome the methodological pitfalls of the STS assessment instruments used in the past, an empirically developed instrument (VOSTS, Views on Science-Technology-Society) have been suggested. Some methodological proposals, namely the multiple response models and the computing of a global attitudinal index, were suggested to improve the item implementation. The final step of these methodological proposals requires the categorization of STS statements. This paper describes the process of categorization through a scaling procedure ruled by a panel of experts, acting as judges, according to the body of knowledge from history, epistemology, and sociology of science. The statement categorization allows for the sound foundation of STS items, which is useful in educational assessment and science education research, and may also increase teachers' self-confidence in the development of the STS curriculum for science classrooms.

Key words: Science Technology Society (STS), evaluation, opinion survey, item scaling.

Introduccion: la necesidad de evaluar los temas CTS

Muchos estudiosos en didactica de las ciencias y disenadores de planes de estudios coinciden en la necesidad de innovar la ciencia escolar mediante temas de ciencia, tecnologia y sociedad (CTS), lo que se ha visto reflejado en las reformas de diversos paises (Solomon y Aikenhead, 1994). Sin embargo, una seria dificultad para la innovacion de la ciencia escolar a traves de CTS es la dificultad de evaluar estos temas. La evaluacion de contenidos CTS puede convertirse en un obstaculo curricular importante cuando los profesores deciden llevar a cabo la educacion CTS, ya que pocos profesores desean incluir estos nuevos temas en sus lecciones de ciencias al no tener una idea clara de como evaluarlos (Bell, Lederman y Abd-El-Khalick, 2000).

La evaluacion del aprendizaje general ha recibido escasa atencion en la investigacion de didactica de las ciencias, con pocas excepciones (Kempa, 1986). Por ejemplo, la seccion dedicada a la evaluacion en el International Handbook of Science Education (Fraser y Tobin, 1998) es mas corta que las otras secciones; ademas, la primera linea del primer articulo dedicado a la evaluacion expresa: "esta seccion (...) no se habria escrito hace diez anos" (Tamir, 1998, p. 761). En un libro de McComas (2000) sobre la naturaleza de la ciencia solo uno de los 21 capitulos se dedica a la evaluacion. Estos hechos subrayan la escasa atencion dada en el pasado y el creciente interes actual por la evaluacion en la didactica de las ciencias. Hace anos, algunos especialistas en educacion de ciencia tecnologia y sociedad (CTS) expresaron su preocupacion por la evaluacion del aprendizaje de los estudiantes y una mayor coherencia entre la evaluacion de los estudiantes y los objetivos educativos CTS (Hofstein, Aikenhead y Riquarts, 1988). Ellos demandaban alternativas a la evaluacion tradicional, mediante instrumentos validos y nuevos criterios de evaluacion especificamente disenados para la evaluacion en el marco CTS. La justificacion racional de la educacion CTS es la multiplicidad de enfoques potenciales que permiten a los estudiantes asimilar el conocimiento cientifico del complejo y problematico mundo en el que viven. Asi mismo, la educacion CTS es compleja, diversa y esta cargada de valores, los cuales son nuevos aspectos importantes en la educacion CTS, en contraste con la ciencia escolar tradicional (Ziman, 1994). A pesar de la importancia creciente de la educacion CTS en los curriculos reformados de ciencia, la evaluacion de los temas CTS aun esta poco desarrollada y precisa de mejoras (Acevedo, 1997). La carga de valores CTS se agrega a las dificultades de ensenar ciencias y, sobre todo, de evaluar los temas CTS, donde el profesorado no solo debe evaluar conocimientos cientificos y procedimientos, como en las clases tradicionales, sino tambien valores de la ciencia. Los valores tienen un fuerte significado afectivo, arraigado en la capacidad humana para seleccionar entre diferentes alternativas y se integran de modo complejo en los contenidos y procedimientos CTS. Mas alla de conceptos, opiniones o creencias, se necesitan estructuras mas potentes para responder de modo fiable a los valores en la educacion CTS. En los proximos parrafos se sugiere el concepto de actitud como la estructura que permite esta evaluacion integrada de los temas CTS.

Las actitudes en la educacion cientifica

El concepto de actitud en psicologia social surge de los problemas sociales (la actitud hacia la pena de muerte) y los politicos (votar candidatos), pero se ha extendido a otros muchos campos como el de la educacion. Los profesores, en general, y los de ciencias, en particular, suelen tener un concepto de actitud de sentido comun, relacionado con el interes (o desinteres) hacia el aprendizaje de la ciencia escolar; por ejemplo, cuando un estudiante participa poco en los debates en el aula de ciencia, los profesores estiman que tiene una actitud pobre hacia la ciencia. Sin embargo, el concepto de actitud es mucho mas amplio, pues abarca cognicion, conducta y sentimientos, siendo esta complejidad la principal razon por la que se usa en este trabajo, en vez de otros conceptos algo mas simples, como creencias u opiniones, que tambien son bastante comunes en la bibliografia relativa a la educacion cientifica. Por otro lado, la actitud es una estructura muy establecida en psicologia social, que esta mejor fundamentada que las creencias o las opiniones (Stahlberg y Frey, 1990).

La actitud es un constructo hipotetico de los psicologos sociales que puede definirse como:
   Una tendencia psicologica que se expresa evaluando una entidad
   particular con algun grado de agrado o desagrado (...) Una
   tendencia psicologica se refiere a un estado interior de la
   persona y evaluar se refiere a todos los tipos de respuestas de
   la evaluacion, explicitas o implicitas, cognoscitivas, afectivas
   o conductuales [Traduccion libre de los autores] (Eagly y
   Chaiken, 1993, p.1).


La expresion "entidad", tambien conocida como objeto de la actitud, contiene los estimulos (cosas, ideas o personas) que suscitan las respuestas de la evaluacion que expresan la actitud.

El uso del constructo actitud puede parecer un poco extrano aqui, pero se justifica porque muchos problemas CTS estan cargados de valores. Requiere del estudiante (y del profesorado) no solo conocimiento de hechos, sino tambien la adhesion a una posicion o a una accion de acuerdo con esta posicion. La actitud es la estructura que integra simultaneamente los componentes cognoscitivos, afectivos y conductuales, los cuales responden a los contenidos cargados de valores CTS en la educacion cientifica. La cognicion y comprension siempre estan presentes, pero el nucleo central de la actitud es la opcion de la persona a lo largo del espectro de diversas posiciones actitudinales, entre el agrado y desagrado, que es caracteristica de la actitud. El termino actitud da mejor cuenta de los tipos de cuestiones de la educacion CTS, porque abarca al mismo tiempo cognicion (conocimiento), sentimientos (acuerdo o desacuerdo) y conducta (por ejemplo, actuar para hacer el ambiente mas saludable). Mientras el conocimiento de la ciencia no siempre implica una actitud (por ejemplo, comprender la ley de gravedad y sus aplicaciones no genera diferentes actitudes, pues nadie discute su validez), en la base de cualquier actitud relacionada con la ciencia hay siempre algo de conocimiento (por ejemplo, adherirse a la posicion de que el conocimiento de la ciencia es provisional), pues hay personas que aceptan esta posicion (y otras que no), aunque su conocimiento del tema sea superficial.

Las actitudes en didactica de las ciencias han tenido un camino largo y dificil que va desde su clarificacion conceptual a su evaluacion empirica. Gardner (1975) sugirio una distincion entre dos objetos actitudinales diferentes: las actitudes frente la ciencia y las actitudes cientificas. En anos recientes muchos autores han asumido esta distincion (Laforgia, 1988; Schibeci, 1983; Wareing, 1990). Por su parte, Hodson (1985) sugirio nuevos objetos actitudinales cuyos significados son especialmente importantes para la educacion CTS: los aspectos sociales de la ciencia y de la ciencia escolar. La educacion CTS es un enfoque innovador transversal en el curriculo de ciencia escolar, que se centra en los valores de la ciencia (Aikenhead, 1994; Bybee, 1987; Vazquez y Manassero, 1997; Waks y Prakash, 1985), de modo que el concepto de actitud es la estructura que mejor abarca los objetivos de ensenanza y aprendizaje CTS, pues integra cognicion, afecto y conducta. La gran cantidad de investigacion actitudinal realizada en la didactica de las ciencias ha ido anadiendo una variedad de objetos en este campo, cada uno de los cuales define una actitud diferente, lo que hace necesaria su sistematizacion. Para integrarlos ordenadamente, Vazquez y Manassero (1995) han sugerido una taxonomia de actitudes relacionadas con la ciencia que clasifica diferentes objetos actitudinales CTS (todos ellos relativos a la ciencia y tecnologia) en tres dimensiones basicas y siete subdimensiones:

* Las actitudes hacia la ciencia y la tecnologia escolar, su ensenanza y aprendizaje, los resultados de ciencia y tecnologia escolar, etcetera.

* Las actitudes hacia las interacciones entre la ciencia, la tecnologia y la sociedad: la imagen social de la ciencia y la tecnologia; los aspectos sociales de la ciencia y la tecnologia.

* Las actitudes hacia las caracteristicas del conocimiento cientifico y tecnologico: las caracteristicas de los cientificos y tecnologos; el constructivismo social en la ciencia y la tecnologia; la naturaleza de la ciencia y la tecnologia.

El concepto de actitud se ha usado en didactica de las ciencias desde los inicios (Gardner, 1975; Gauld y Hukins, 1980; Haladyna y Shaughnessy, 1982; Munby 1983; Ormerod y Duckworth, 1975; Schibeci, 1983, 1984), pero la bibliografia actual emplea diversas denominaciones para referirse indistintamente al mismo constructo, tales como conceptos, creencias, opiniones e ideas, quizas debido a la influencia del enfoque constructivista del aprendizaje o simplemente por sentido comun. Proponer el termino "actitud" para representar los complejos problemas (cognoscitivos, conductuales y afectivos) integrados en la dialectica de los temas CTS cargados de valores no es solo una disputa nominal, sino un cambio teorico que puede ampliar el simple significado de ideas, creencias u opiniones en la didactica de las ciencias. Una discusion de las relaciones entre actitud y las demas denominaciones usadas en la bibliografia (creencias, opiniones, etc.), asi como las razones por las que la actitud es un constructo que se ajusta mejor a las caracteristicas de los problemas CTS --a la vez cognoscitivos, afectivos y conductuales-- puede revisarse en otros lugares (Eagly y Chaiken, 1993, Manassero, Vazquez y Acevedo, 2004). Por ultimo, las actitudes permiten resaltar los principales objetivos curriculares de los temas CTS que implican valores y el dominio afectivo de la educacion, aunque hay tambien otros objetivos educativos CTS importantes, por ejemplo, en los dominios cognoscitivo o procedimental. Se subrayan asi las actitudes como una importante estructura para lograr los objetivos del dominio afectivo (valores).

Medida de actitudes relacionadas con la ciencia

El diseno de los nuevos curriculos de ciencias ha incluido los temas CTS como una consecuencia directa de la gran cantidad de investigacion que ha mostrado que los estudiantes y los profesores no poseen concepciones adecuadas sobre estos temas CTS (vease, por ejemplo, Lederman [1992]).

La investigacion de las actitudes relacionadas con la ciencia ha repetido algunos de los mismos fallos de la investigacion de las actitudes generales realizada en psicologia social, porque que se han subestimado e ignorado (Shrigley y Koballa, 1992). La conceptualizacion y medida de actitudes dentro de este campo han desarrollado dos tradiciones basicas: el escalamiento psicofisico y la evaluacion psicometrica. El primero se basa en la graduacion de los estimulos aplicados a las personas y en observar sus reacciones en una dimension psicologica. El origen de la evaluacion psicometrica tiene su base en los metodos de los tests mentales y psicologicos. Las tecnicas de Likert y el diferencial semantico de Osgood corresponden a la tradicion psicometrica, cuya validez esta basada en la capacidad de cada cuestion para representar adecuadamente los objetos actitudinales subyacentes a las escalas (casi siempre dados por supuesto).

Las controversias alrededor de la validez de los instrumentos y los procesos de evaluacion de actitudes han sido y aun son frecuentes. Diversas revisiones (Gardner, 1975; Gauld y Hukins, 1980; Schibeci, 1984; Shrigley y Koballa, 1992) coinciden en las importantes limitaciones metodologicas de los instrumentos de evaluacion de actitudes, y han criticado ampliamente los resultados obtenidos con ellos (Gardner, 1996). Las principales criticas pueden resumirse del siguiente modo:

* La inexacta definicion del objeto de actitud en los instrumentos (validez de constructo) y la falta de correspondencia entre lo que se quiere medir y lo que realmente se mide (Gauld y Hukins, 1980).

* La falta de una legitima fundamentacion epistemologica explicita del contenido del instrumento. Dada la naturaleza compleja y dialectica de los contenidos de las actitudes relacionadas con la ciencia, la ausencia de especificaciones para la base filosofica de las escalas debilita los resultados obtenidos con estos instrumentos y sus interpretaciones (Aikenhead, 1988; Gardner, 1975, 1996; Haladyna y Shaughnessy, 1982; Ormerod y Duckworth, 1975; Schibeci, 1984; Shrigley y Koballa, 1992).

* Los instrumentos violan implicitamente la hipotesis unidimensional, que es una condicion para lograr medidas validas. Los cuestionarios no tienen a menudo una unica estructura comun para todos los items e, incluso, a veces muestran una multidimensionalidad explicita (Bratt, 1984; Munby, 1983; Zeidler, 1984). En estos casos la actitud medida no es unica, sino multiple.

Otros problemas relacionados con la validez son los sesgos de los alumnos para satisfacer las expectativas de sus profesores y las dificultades de la formulacion de las cuestiones para evitar la denominada "percepcion inmaculada" (la hipotesis implicita de que sujetos e investigador perciben el mismo significado de las frases en los cuestionarios). Por ultimo, la confrontacion entre el paradigma cuantitativo y el cualitativo, basada principalmente en las entrevistas clinicas y el analisis de casos, es otro problema polemico para la investigacion de las actitudes. Las demandas de "dekuhnificar" esta discusion, romper los estereotipos y abrir el procedimiento, estan dando lugar a enfoques para la integracion de ambos metodos en lugar de excluir alguno de ellos (Shadish, 1995).

Los instrumentos de evaluacion actitudinal CTS

Los contenidos CTS (la naturaleza de la ciencia y la tecnologia, las relaciones entre la ciencia, la tecnologia y la sociedad, etc.) se han ido elaborado por medio de los instrumentos actitudinales aplicados en la investigacion. Una revision de los instrumentos de evaluacion de las actitudes CTS se ha mostrado en otros trabajos (Lederman, Wade y Bell, 1998; Vazquez y Manassero, 1995).

Como se ha indicado antes, la fiabilidad y la validez de los instrumentos de evaluacion actitudinales, asi como la interpretacion parcial de los resultados, con frecuencia ha sido la principal fuente de problemas metodologicos en la evaluacion CTS (Gardner, 1975, 1996). Aikenhead (1988) comparo la fiabilidad de diferentes tecnicas e instrumentos --escalas Likert, preguntas abiertas, cuestionarios de opcion multiple empiricamente desarrollados y entrevistas semiestructuradas-- y concluyo que los cuestionarios de opcion multiple desarrollados empiricamente estan mas equilibrados, pues reducen la ambiguedad, pueden aplicarse a muestras grandes que aumentan la representacion de los resultados y pueden evitar las trampas metodologicas, tales como la doctrina de la percepcion inmaculada de los cuestionarios desarrollados exclusivamente por los investigadores. Posteriormente, Lederman, Wade y Bell (1998) han revisado tambien los instrumentos que evaluan las concepciones de la naturaleza de ciencia y han cuestionado su validez debido a sus fallos de construccion y a las interpretaciones parciales de los resultados. Aunque estos autores concluyeron que la evaluacion de los conceptos que tienen las personas sobre la naturaleza de la ciencia debe cambiarse por aproximaciones mas cualitativas y abiertas, tambien consideran que el cuestionario de papel y lapiz de opcion multiple Views on Science, Technology and Society (VOSTS) es un instrumento valioso para la evaluacion de las opiniones de los estudiantes y un esfuerzo importante por ahondar en las razones que tienen los estudiantes para dar sus respuestas.

El VOSTS es un conjunto de 114 items empiricamente desarrolladas que abarcan la mayor parte de los contenidos CTS (Aikenhead, Fleming y Ryan, 1987; Aikenhead y Ryan, 1989, 1992). Asumiendo las mismas normas del VOSTS, Rubba y Harkness (1993) desarrollaron un conjunto de items de opcion multiple denominado Teacher's Belief About Science-Technology-Society (TBA-STS) para investigar las creencias de los profesores sobre los temas CTS. El COCTS tiene 100 items, seleccionados del VOSTS y del TBA-STS, que han sido adaptados a la cultura espanola. El COCTS se ha aplicado en una investigacion sobre las actitudes CTS de una amplia muestra de estudiantes y profesores (Manassero y Vazquez, 1998).

Un item tipico del COCTS muestra un texto inicial que plantea un tema CTS seguido por varias frases cortas, etiquetadas con una letra en orden alfabetico; cada frase desarrolla diferentes razones para responder al item. Dentro de cada item, el conjunto de frases ofrece a la persona que responde una serie amplia de distintas posiciones sobre el tema; las actitudes se definen mediante la eleccion hecha o por medio de la valoracion de cada frase. Esta manera de definir actitudes indica que el cuestionario no impone a la persona que responde ningun valor o modelo concreto sobre CTS; al contrario, las personas que responden pueden definir libremente las actitudes mediante sus elecciones de las frases proporcionadas. La Tabla I muestra un ejemplo de item, junto con las puntuaciones de los jueces a las frases correspondientes y la categoria asignada a cada una de ellas (segun el criterio que se desarrollara en este articulo). La version en castellano del COCTS, el manual de uso y las claves de puntuacion se han incorporado a la extensa biblioteca del Test Collection of Educational Testing Service (accesible en linea en: www.ets.org).

El formato basico de respuesta propuesto para el VOSTS consiste en seleccionar una opcion entre las diversas frases de cada item (Modelo de respuesta unica [MRU]). El MRU es metodologicamente muy limitado, pues solo permite comparaciones centradas en cada cuestion particular, pero no pruebas de comparaciones test-retest o de comprobacion de hipotesis. Rubba, Schoneweg-Bradford y Harkness (1996) propusieron puntuar la unica respuesta de cada cuestion segun un esquema de tres categorias (Realista / Meritoria / Ingenua) previamente asignado a las respuestas dadas por expertos, las cuales reflejan claramente el caracter actitudinal de la evaluacion. Este esquema de puntuacion en tres categorias fue sugerido por uno de los autores del VOSTS en una comunicacion personal (Rubba y Harkness, 1993). En el caso de responder varias cuestiones diferentes, las puntuaciones de las cuestiones individuales se suman para conseguir una puntuacion total que es internamente consistente y actitudinalmente significativa (actitud mas o menos adecuada). Este metodo mejora el MRU simple, pero no diferencia de manera fiable ni adecuada las actitudes que mide. Ademas, el MRU tiene una segunda limitacion importante: la actitud medida se basa en una sola eleccion no usa toda la informacion disponible en las restantes frases no seleccionadas.

Para superar estos serios inconvenientes, se ha sugerido un Modelo de Respuesta Multiple (MRM), donde las personas que responden valoran todas las frases de cada cuestion en una escala de 9 puntos para expresar su grado de acuerdo o desacuerdo. A continuacion, las valoraciones de las frases se transforman en un indice actitudinal global (rango: -1, +1) mediante un metodo interpretativo que requiere una clasificacion previa de cada frase en un escalamiento de tres categorias (Vazquez y Manassero, 1999):

* Adecuada (A): La frase expresa un punto de vista apropiado.

* Plausible (P): Aunque no es totalmente adecuada, la frase expresa algunos aspectos aceptables.

* Ingenua (I): La frase expresa un punto de vista que no es ni adecuado ni plausible.

El esquema de tres categorias para evaluar las respuestas de la cuestion no es un procedimiento del tipo verdadero o falso para buscar respuestas correctas; no tiene nada que ver con un esquema absoluto porque es relativo, de acuerdo con el conocimiento dialectico de la historia, epistemologia y sociologia de la ciencia. Se espera que la efectividad de la clasificacion se mejore cuando el progreso de las controversias actuales pueda arrojar nueva luz sobre los temas CTS. Por otro lado, la clasificacion tampoco tiene nada que ver con los tajantes procedimientos de calificacion del tipo correcto o incorrecto, habituales en las pruebas y examenes de ciencias, porque evalua la actitud de los estudiantes a partir del conjunto de sus respuestas a todas las frases de cada item como adecuadas, plausibles e ingenuas y no solamente a partir de una de ellos.

El VOSTS se ha usado con el MRU para evaluar las actitudes de las personas encuestadas con fines descriptivos y formativos. Los propositos sumativos estan excluidos de las posibilidades del VOSTS, porque el MRU es incapaz de lograr cualquier puntuacion sumativa, como se requiere tanto en investigacion como en educacion. El objetivo de este trabajo no es sustituir cualquier finalidad descriptiva o formativa de la evaluacion con el COCTS, sino ampliar las posibilidades del instrumento, detallando mas la descripcion y mejorando ampliamente los objetivos formativos, aunque se mantengan todas las ventajas metodologicas anteriores.

Escalamiento de las frases mediante jueces

Un denominador comun de la gran cantidad de investigacion sobre las actitudes hacia la ciencia es la existencia de algunas creencias adecuadas, asi como otras menos adecuadas. Sin embargo, el proposito de este estudio no es evaluar las puntuaciones de los estudiantes o los profesores, aunque una de las principales utilidades del metodo que se propone es la investigacion que involucra valoraciones de creencias CTS. Para aplicar apropiadamente a la medida la escala anterior de tres categorias es necesaria la clasificacion previa de todo el cuestionario; es decir, un escalamiento de los estimulos actitudinales representados por las diversas frases de cada cuestion. La clasificacion de las frases es un paso imprescindible para la evaluacion valida y fiable de los temas CTS.

El objetivo de este articulo es presentar el metodo seguido y los resultados obtenidos para la clasificacion de las frases del COCTS en una de las tres categorias a partir del escalamiento mediante jueces. Asi, el centro del analisis esta en las respuestas del grupo de jueces en lugar del analisis de cada frase, el cual necesitaria muchas paginas y tablas debido al elevado numero de frases que se analizan.

Aunque el procedimiento general de escalamiento es similar al escalamiento de Thurstone o el de Guttman (Eagly y Chaiken, 1993), algunas areas CTS aun son muy polemicas para que el acuerdo sobre la adecuacion de una frase sea facil de conseguir, incluso para los propios expertos (Alters, 1997a, 1997b; Smith, Lederman, Bell, McComas y Clough, 1997). Por ejemplo, McComas, Almazroa y Clough (1998) han sugerido algunos puntos de acuerdo general sobre la naturaleza de ciencia (empirica,

racional, provisional, cargada de teoria), aunque el nucleo real de las dificultades para definir concepciones adecuadas surge de los aspectos inciertos y dialecticos involucrados en muchos temas CTS. La provisionalidad se vuelve un rasgo central de los resultados alcanzados mediante la tecnica de escalamiento, debido a la naturaleza dialectica y polemica de los temas CTS. Rubba, Schoneweg-Bradford y Harkness (1996) clasificaron las 16 cuestiones del TBA-STS mediante cinco jueces e informaron que se encontraron dos de ellos outliers, lo que muestra la dificultad para evaluar los temas CTS. Recomendaron trabajar al menos con nueve jueces y usar como criterio para decidir la categoria de cada frase el acuerdo de al menos siete de los nueve jueces.

Por otro lado, algunos estudios han reportado que una persona puede manifestar creencias diferentes u opuestas (diversidad intrapersonal) sobre el mismo problema cuando se inspeccionan por medio de items que difieren en formato o contexto (Acevedo, 2000; Clough y Driver, 1986; Oliva, 1999; Taber, 2000). En la investigacion general de actitudes, la presencia simultanea de actitudes opuestas en la misma persona es un hecho muy conocido que normalmente se atribuye al papel latente de estas, sobre todo, cuando se refieren a temas no ensenados explicitamente, como es el caso de los temas CTS, al menos en el curriculo de ciencias espanol actual. Estas actitudes opuestas se han considerado respuestas indiferentes, intermedias, incoherentes, ambivalentes o ambiguas. A pesar de su apariencia escasamente definida, con frecuencia se han atribuido a las debilidades metodologicas de los instrumentos de la medida; por ello, la atencion se ha dirigido a mejorar la exactitud de estos (Breckler, 1994). Sin embargo, algunos estudiosos reconocen esa inconsistencia en las actitudes como un problema complejo que surge de la falta de consistencia entre la conducta, la cognicion o los afectos, aunque la cuestion relativa a las respuestas ambivalentes se refiere principalmente a la inconsistencia entre la actitud y la cognicion (Eagly y Chaiken, 1993). Algunas investigaciones sostienen que las personas muy consistentes muestran actitudes mas estables, mas predictivas de la conducta y mas resistente a la influencia por induccion, mientras que a las personas de baja consistencia les faltaria una actitud genuina (Chaiken, Pomerantz y Giner-Sorolla, 1995). Ademas, para completar el dificil cuadro de la investigacion de las actitudes, las creencias complejas pueden asociarse con actitudes moderadas, pero tambien con actitudes extremas (Eagly y Chaiken, 1993). El MRM propuesto para el COCTS, junto con la clasificacion obtenida en este estudio, permite la medida de estas actitudes contradictorias sobre un tema de modo natural, las cuales pueden coexistir en una misma persona, por medio del analisis individualizado de las respuestas a cada cuestion. Las propuestas para refinar la medida de la intensidad de la actitud pueden ayudar a tratar la ambivalencia o la inconsistencia en las actitudes relacionadas con la ciencia (veanse las contribuciones en Petty y Krosnick, 1995) y, desde esta perspectiva, el indice de actitud global puede representar un gran avance practico para la medida de la actitud relativa a la ciencia.

En el marco de la evaluacion de actitudes relacionadas con la ciencia, este estudio muestra el proceso de escalamiento de las diversas frases de las cuestiones del COCTS, mediante un panel de expertos que actuan como jueces. Este escalamiento es la fase final de los procedimientos empiricos disenados y expuestos en otro lugar (Vazquez y Manassero, 1999) para el desarrollo de un metodo cuantitativo que mida items complejos de opcion multiple, que permite el uso valido y fiable de las cuestiones del COCTS en la evaluacion de actitudes CTS, incluyendo tambien la verificacion de hipotesis y las comparaciones entre grupos.

Metodologia de escalamiento

Una muestra valida de 16 jueces expertos espanoles puntuo las frases de todas las cuestiones del COCTS. Todos ellos estan acreditados como potenciales expertos competentes para emitir juicios validos y fiables sobre las frases del COCTS, debido a su entrenamiento especifico en temas CTS, independientemente de sus trabajos realizados o su formacion inicial. Una mayoria de ellos (13) posee formacion inicial cientifica (licenciados en fisica, quimica, biologia o geologia) y 3 de ellos son licenciados en filosofia. Los trabajos actuales son como profesores de educacion secundaria (5), como asesores o formadores de profesores de ciencia (4) y como profesores universitarios e investigadores (7). La mayoria (12) participa activamente en investigacion en didactica de las ciencias y algunos de ellos (8) publican investigaciones concretas sobre temas CTS. Rubba, Schoneweg-Bradford y Harkness (1996) usaron solo 5 jueces (profesores y cientificos) y recomendaron un minimo de 8 o 9 jueces para lograr una clasificacion mas valida y fiable.

A los jueces se les proporcionaron las cuestiones del COCTS y se les pidio valorar cada frase en una escala de 9 puntos (1-9), donde debian expresar su desacuerdo o acuerdo respecto a los conocimientos actuales de historia, filosofia y sociologia de la ciencia. Para asignar un significado mas claro a los puntos de la escala, con el proposito de aumentar la exactitud y la fiabilidad de los juicios y obtener un voto simple para las valoraciones directas de los jueces, la escala de 9 puntos fue dividida en tres intervalos iguales:

* Puntuaciones de 1 a 3: categoria ingenua (I) (frases inadecuadas).

* Puntuaciones de 4 a 6: categoria plausible (P) (frases parcialmente adecuadas).

* Puntuaciones de 7 a 9: categoria adecuada (A) (frases apropiadas).

La escala de 9 puntos se eligio debido al uso de numeros enteros simples para evaluar las tres categorias, dandoles la oportunidad a los jueces de ampliar sus juicios, en lugar de restringirlos a una escala corta de 3 puntos que habria sido mas simple para los propositos cuantitativos, pero habria reducido mucho y limitado la expresion de opiniones ligeramente diferentes de los jueces. Estas asignaciones definen, al mismo tiempo una escala de tres categorias, que corresponden a rangos naturales con un significado fijo --adecuado, plausible e ingenuo--, y la escala entera original de 9 puntos, que permite a los jueces afinar con mas precision sus valoraciones dentro de cada categoria y obtener una percepcion clara del significado de cada puntuacion.

El COCTS consta de 100 items con 637 frases para seleccionar como respuesta, cada una de ellas expresa actitudes, creencias y opiniones diferentes sobre el tema planteado en cada item. Cada uno de los 16 jueces se considera una variable pertinente del analisis, mientras las 637 frases que constituyen el COCTS serian los casos de la descripcion. Este estudio pretende mostrar los procedimientos y analisis, empiricos y racionales, desarrollados para asignar cada frase a una de las tres categorias sugeridas (ingenua, plausible y adecuada), a partir de las puntuaciones directas de los jueces. El analisis se centra en los jueces, no en los items, de modo que el criterio para la asignacion de categorias a las frases debe deducirse de las puntuaciones concedidas por los jueces. El primer criterio de clasificacion sera la puntuacion media que estos otorguen a cada frase, puesto que este parametro sintetiza todos los matices de sus valoraciones. El segundo criterio sera que la mayoria de jueces este a favor de una categoria especifica de acuerdo con las puntuaciones. La clasificacion de las frases del COCTS en una de las tres categorias normalizadas se basara en estos dos criterios basicos, temperados por los modelos globales y los sesgos de las puntuaciones de los jueces.

Los jueces valoraron las 637 frases' pero cinco de ellos rechazaron puntuar cuatro items que plantean los siguientes temas: influencia de la cultura y la religion en el conocimiento cientifico, elegancia de las teorias cientificas, naturaleza probabilistica del conocimiento cientifico y el papel de un ser sobrenatural en la ciencia. Para estos items, las respuestas de los objetores se perdieron, lo que da lugar a un numero de votos inferior.

Resultados del escalamiento

Las estadisticas descriptivas de las puntuaciones de los jueces (medias, variaciones, rangos, etc.) muestran la existencia de tendencias concretas en sus respuestas, como puntuaciones demasiado altas o demasiado bajas y el uso incompleto de las puntuaciones enteras de la escala de 9 puntos, etcetera (Tabla II). La diferencia entre las puntuaciones medias mas alta (J4) y mas baja (J12) de los jueces es de aproximadamente dos puntos (25% del rango de la escala). Tambien las desviaciones tipicas de las puntuaciones de los jueces varian mucho, con un minimo de 1.38 puntos (J9) y un maximo de 2.79 (J13). Por otro lado, algunos jueces no usan los 9 puntos de la escala para evaluar las 637 frases de las cuestiones del COCTS. Dos de ellos (J4 y J9) no valoran ninguna frase con 1 punto y, ademas, J9 nunca usa la puntuacion 2. Otro juez (J11) nunca usa la puntuacion 9, siendo su puntuacion maxima 8. En resumen, estos rasgos estadisticos de la distribucion global de las puntuaciones de los jueces muestran algunos sesgos individuales en los juicios expresados mediante sus valoraciones.

Para mejorar la calidad de la toma de decisiones en la clasificacion de las frases, estos sesgos plantean la posibilidad de eliminar algunos jueces. El rechazo de un juez debe fundamentarse bien y, por esa razon, se desarrollaron diversos analisis adicionales sobre las dimensiones subyacentes en las respuestas de los jueces (analisis factorial de componentes principales, analisis de cluster y analisis discriminante), para considerar con mas detalle los estilos de respuesta de los jueces.

Los analisis de cluster y discriminante sirvieron para verificar la estabilidad de las clasificaciones de las frases del COCTS en cada una de las tres categorias. El primer tipo de analisis usa una medida de la distancia para asignar cada frase a un grupo, segun la proximidad relativa entre los miembros de este. Con las puntuaciones asignadas por los jueces el analisis de cluster agrupo las frases del COCTS en tres conglomerados (que se corresponden bien con las categorias ingenua, plausible y adecuada).

El analisis discriminante parte del conocimiento de la pertenencia de los individuos a algunos grupos, para deducir despues la asignacion de un nuevo individuo cuyo grupo no es conocido. Los resultados del analisis de cluster previo se usaron como asignacion de pertenencia para el analisis discriminante y probar asi la estabilidad de la asignacion anterior. Los resultados del analisis discriminante muestran que los tres grupos empiricos de categorias exhiben una buena estabilidad en los dos analisis, de cluster y discriminante, de modo que valida el uso de las tres categorias para clasificar todas las frases del COCTS. Por tanto, los resultados de estos dos analisis confirman empiricamente la estabilidad y la potencia del sistema de clasificacion en tres categorias de las frases del COCTS.

Analisis factorial de componentes principales

El analisis factorial de componentes principales (PCFA) tiene como objetivo reducir el numero de variables originales y busca nuevas (llamadas factores), que resumen la varianza total de las variables originales en un numero inferior de factores. Las variables dependientes del analisis factorial son los jueces, mientras que las variables independientes son las puntuaciones de estos en las frases del COCTS. El analisis agrupa a los jueces segun la intensidad de sus correlaciones mutuas mediante las 637 puntuaciones dadas a las frases, de modo que los jueces mejor interrelacionados tienden a agruparse en el mismo factor principal. El analisis de componentes principales permite la identificacion de los jueces que sistematicamente quedan fuera de los factores principales en las diferentes dimensiones.

Se ensayaron varios analisis factoriales exploratorios independientes para todas las frases y para cada una de las dimensiones del COCTS. Segun los resultados de los analisis, se probaron las eliminaciones de algunos jueces para mejorar la maxima coherencia empirica entre jueces y la maxima parsimonia (simplicidad) en el numero de factores obtenidos. Las sucesivas eliminaciones de algunos jueces en los diversos analisis factoriales mostraron que la varianza total explicada por los factores empiricos no disminuia significativamente, pero si disminuyo el numero de factores (mayor parsimonia) y mejoro la correlacion y cohesion entre los jueces restantes.

La Tabla III muestra el analisis factorial de componentes principales para todos los jueces, el numero de factores y la varianza que dichos factores explican para cada dimension. El analisis factorial, utilizando todas las frases del cuestionario, agrupa a los 16 jueces en dos factores, que explican cada uno 33% y 20% de la varianza total. Para cada dimension del COCTS se obtiene un numero diferente de factores, que oscilan entre dos y cinco, aunque la mitad de las dimensiones (4 de 8) tiene una estructura de tres factores.

La informacion obtenida de estos analisis sugiere que al eliminar a algunos jueces se permitira una reduccion significativa del numero de factores (aproximadamente la mitad de ellos) y tambien aumentara la coherencia, sin perder pluralidad de opiniones. Por otro lado, los diferentes analisis factoriales indican que jueces quedan fuera de los factores principales y quienes pueden ser los candidatos mas probables a ser eliminados sin que disminuya el poder explicativo (aquellos que reducen las variaciones explicadas significativamente). A partir de este analisis interpretativo, se eliminaron 5 de 16 jueces del grupo inicial y quedo un conjunto de 11 jueces para volver a comprobar en un nuevo analisis de factores.

El analisis de componentes principales de estos 11 jueces muestra el numero de factores y la cantidad de varianza explicada en cada dimension (vease la Tabla III). Para todas las frases del COCTS, los 11 jueces se agrupan en un unico factor que explica 52% de la varianza total. Para cada dimension, se obtiene un numero variable de factores (uno a tres), aunque la mayoria de las dimensiones (cinco) tiene un solo factor. En suma, el grupo de 11 jueces tiene la mitad del numero de factores que 16 jueces, mientras aumenta significativamente la coherencia y la parsimonia en la descripcion de los datos.

Al probar la eliminacion de tres jueces mas (dejando solo un grupo de 8 jueces que son quienes han investigado en el tema de CTS), la comparacion de resultados con el conjunto de 11 jueces no muestra mejoras significativas. El numero de factores es casi el mismo en ambos casos y las diferencias en la varianza explicada no son importantes (vease la Tabla III) excepto en dos dimensiones (una de ellas con solo cuatro items). En otros terminos, esta reduccion adicional de jueces no supone una mejora sustancial de la coherencia global de los jueces. A partir de estos analisis, el grupo de 11 jueces parece el mejor conjunto posible para la clasificacion de las frases del COCTS. La seleccion de 11 jueces validos de los 16 disponibles permite inicialmente una notable reduccion en el numero de factores, sin disminuir significativamente el porcentaje de varianza explicada. Un unico factor explica mas de la mitad de la varianza total para el conjunto completo de las frases del cuestionario, asi como para la mitad de las dimensiones del COCTS, resultado que es particularmente pertinente para la parsimonia y simplicidad.

Las categorias de las frases del COCTS

Es importante notar que la reduccion del numero de jueces propuesta en el parrafo anterior se basa en criterios globales, no especificos o personales, y en el analisis general de las 637 puntuaciones emitidas por cada juez.

Reducir a 11 el numero de jueces no tiene un impacto significativo en la clasificacion de las frases del COCTS. La comparacion de la distribucion de la puntuacion directa entre los grupos inicial y reducido de los jueces (16 y 11, receptivamente) muestra que las diferencias cuantitativas entre los dos grupos no son relevantes. No obstante, el grupo inicial de 16 jueces presenta frecuencias mayores en las puntuaciones centrales de la escala, mientras que el grupo reducido de 11 jueces tiene frecuencias mayores en las puntuaciones mas bajas (vease la Figura 1).

[FIGURA 1 OMITIR]

Por otro lado, la comparacion de las clasificaciones de las frases basadas en el criterio del intervalo absoluto y las zonas de frontera difusas (las puntuaciones entre 3-4 y 6-7) muestra que el numero total de frases que cambian su clasificacion entre ambos modelos no es excesiva (aproximadamente 14%). La diferencia mas importante entre ambos grupos de jueces aparece en la categoria ingenua (vease la Tabla IV).

Las puntuaciones de las respuestas directas del grupo de 11 jueces se usaron para clasificar todas las frases del COCTS (escalas) en cada una de las tres categorias (I/P/A), mediante la aplicacion de dos criterios fundamentales: la puntuacion media de la frase (la media aritmetica de las puntuaciones individuales de los 11 jueces) y el voto mayoritario de los jueces a favor de una categoria (categoria asignada por la mayoria de jueces). En general, parece razonable que todas las frases cuyas puntuaciones medias caen dentro de los intervalos enteros naturales definidos para la escala presentada a los jueces deben asignarse a la categoria acorde correspondiente con su valor medio. Asi, las puntuaciones medias comprendidas entre 1 y 3 puntos serian ingenuas, las puntuaciones medias entre 4 y 6 serian plausibles y entre 7 y 9 adecuadas. De acuerdo con este criterio, las frases cuyas puntuaciones medias pertenecen a los intervalos fronterizos (3, 4) y (6, 7), no se podrian clasificar (frases denominadas "difusas" en la Tabla IV).

En ausencia de sesgo o distorsion en las puntuaciones de los jueces, la clasificacion de las frases cuyas puntuaciones medias se situan en los intervalos fronterizos --entre dos categorias vecinas-- podrian clasificarse mediante el criterio simple de dividir el intervalo fronterizo en dos partes iguales, asignando cada puntuacion media a la parte correspondiente del intervalo (vease la Tabla IV). Sin embargo, las puntuaciones de los jueces muestran dos sesgos importantes, uno que proviene directamente de la distribucion de puntuaciones medias de todas las frases y otro debido al propio esquema de clasificacion empleado.

La distribucion de la puntuacion media de las frases muestra un sesgo hacia las puntuaciones bajas (veanse la Tabla III y la Figura 1). Los indicadores principales de este sesgo son las puntuaciones medias personales para la mayoria de los jueces, que son inferiores a 5 puntos (el punto central de la escala original), y la distribucion general de la puntuacion media de las frases (media = 4.43; DT = 1.60), que esta sesgada hacia las puntuaciones mas bajas. Asimismo, las puntuaciones medias de las frases tampoco estan distribuidas homogeneamente a lo largo del rango de la escala, la cual tiene una longitud de ocho intervalos con nueve posiciones de valores enteros. Las puntuaciones medias de los jueces en las 637 frases varian entre 1.18 puntos (puntuacion minima) y 8.18 puntos (puntuacion maxima), intervalo claramente asimetrico respecto al rango de la escala. La distancia entre este minimo y maximo es de 7 puntos, lo que indica que la escala empirica proveniente de las puntuaciones de los jueces se acorta en una unidad (un intervalo menos) respecto a la escala original (ocho intervalos). Ademas, puede verse que la mayor reduccion de la escala tiene lugar en el intervalo mas alto del rango, entre 8 y 9 puntos, que esta practicamente vacio (vease la Figura 1). Esta distribucion sesgada negativamente manifiesta el patron que siguen los jueces de asignar menos puntuaciones altas que bajas.

El criterio de clasificacion de las frases deberia neutralizar este sesgo para representar con mas fiabilidad las opiniones de los jueces. Una manera de compensar las consecuencias del sesgo podria consistir en mantener un escalamiento equilibrado de tres intervalos iguales, pero aplicando este escalamiento al rango de puntuaciones empirico [1.18 - 8.18]. Por ejemplo, si este intervalo real se distribuye homogeneamente entre las tres categorias, a cada una le corresponderia una longitud de intervalo de 2.33 puntos, de modo que el posible escalamiento basado en las puntuaciones medias reales dibujaria este criterio del intervalo homogeneo con los siguientes puntos de corte: ingenua, menor que 3.52; plausible, entre 3.52 y 5.84; adecuada, superior a 5.84 puntos.

La aplicacion de estos puntos de corte llevaria a una clasificacion definida de las frases. Sin embargo, la clasificacion resultante aun puede ser incompleta, pues solo se basa en las puntuaciones medias de los jueces, mientras que otros aspectos significativos de sus puntuaciones quedan fuera. El primero de estos surgiria de considerar las puntuaciones directas emitidas por los jueces en las frases como si fueran un voto registrado a favor de cada categoria. Parece de sentido comun que las frases que logren una mayoria absoluta (seis o mas votos favorables) o relativa (cinco votos) deberian asignarse a la categoria mas votada. No obstante, el criterio de votacion tiene tambien algun inconveniente, como pueden ser los frecuentes empates; cuando dos categorias alcanzan el mismo numero de votos mayoritarios, el metodo de la votacion no permite decidir la categoria, de modo que el criterio principal deberia ser la puntuacion media de los jueces.

Por ultimo, tambien debe tomarse en consideracion otro sesgo estructural que proviene de la ordenacion en tres categorias, adoptada para el escalamiento: ingenua (puntuaciones mas bajas), plausible (puntuaciones intermedias) y adecuada (puntuaciones mas altas). Sin embargo, es bien conocida la tendencia hacia el centro de las puntuaciones medias, que desplaza la clasificacion hacia la categoria intermedia (plausible). En efecto, las desviaciones potenciales de las puntuaciones mas bajas, debidas a que algunos jueces evaluan las frases presumiblemente ingenuas con puntuaciones mas altas de lo debido, solo pueden tender hacia las puntuaciones mayores, desplazando siempre las puntuaciones medias de las frases ingenuas hacia arriba y contribuyendo a aumentar el numero de frases en la categoria plausible. Analogamente, las puntuaciones mas altas tienden a ser desplazadas hacia abajo, porque algunos jueces evaluan las frases adecuadas con puntuaciones mas bajas, contribuyendo a aumentar tambien el numero de frases plausibles. Por otro lado, para las frases potencialmente plausibles, las desviaciones parciales pueden tender hacia arriba, logrando puntuaciones mas altas, asi como hacia abajo, logrando puntuaciones mas bajas. En general, el efecto neto medio de estas desviaciones al azar seria nulo para la categoria intermedia. Este sesgo estructural produce una inflacion en la categoria central (frases plausibles) por ser topologicamente la categoria intermedia entre las otras dos. En resumen, el efecto final de estos sesgos seria siempre aumentar el numero de frases en la categoria plausible.

Afrontar este sesgo estructural requeriria disminuir el numero de frases plausibles, clasificando algunas de ellas como ingenuas o adecuadas. Las frases que probablemente son mas susceptibles de esta compensacion deben quedar situadas en las areas fronterizas de la categoria central (plausible), por encima y por debajo. Una manera de tratar este sesgo seria reducir el rango de puntuaciones asignado a la categoria central (plausible), decidiendo los puntos de corte mas apropiados para cada categoria. El modelo de intervalo homogeneo con su puntos de corte en 1.18-3.51-5.84-8.18 tiene su punto de corte intermedio superior a 3, la puntuacion ingenua mas alta en 3.51 puntos; las puntuaciones en la zona fronteriza entre 3 (extremo superior de las puntuaciones ingenuas) y 4 puntos (inicio de puntuaciones plausibles) podrian corresponder a cualquiera de las categorias ingenua o plausible. Parece bastante racional asignar las frases que quedan en la mitad inferior a la primera categoria (ingenua) y las frases que quedan en la mitad superior a la categoria central (plausible). Asimismo, el area fronteriza entre las categorias adecuadas y plausibles tiene su punto de corte en 5.85, por debajo de 6 puntos (la puntuacion entera mas alta asignada a la categoria plausible), dando lugar a un serio problema conceptual, ya que asignaria algunas frases con puntuaciones medias menores que 6 puntos (puntuacion superior de la categoria plausible) a la categoria superior (adecuadas). Parece obvio que el minimo punto de corte conceptualmente aceptable debe ser la puntuacion de 6. Los resultados para las asignaciones de categoria, segun el modelo de puntos de corte fijos a la puntuacion 3.51 (para la frontera entre ingenua y plausible) y a la puntuacion 6 (para la frontera entre plausible y adecuada) se muestran en la Tabla V. Con este modelo de puntos de corte, el numero de frases en la categoria plausible es con mucho el mas frecuente (casi la mitad de las frases).

En este punto, el analisis de los votos de la mayoria de los jueces podria mejorar la asignacion de la categoria para ciertas frases. Algunas de ellas (17) localizadas en el area fronteriza inferior tienen puntuaciones medias superiores a 3.51 puntos (correspondiendo a la categoria plausible); pero la mayoria de los jueces les han asignado puntuaciones individuales correspondientes a la categoria ingenua. Parece logico en estos pocos casos compensar el sesgo de la categoria intermedia (plausible); de esta manera, el criterio de la mayoria de los jueces prevaleceria para asignar estas frases definitivamente a la categoria ingenua.

De modo semejante, algunas frases (19) localizadas en el area fronteriza superior, cuyas puntuaciones medias son menores que 6 puntos (puntuacion entera mas alta de la categoria plausible), reciben el apoyo de la mayoria de los jueces para asignarles la categoria adecuada en sus puntuaciones individuales. En este caso, no parece tan razonable aplicar el criterio de la mayoria de votos para clasificar todas estas frases como adecuadas sin ninguna otra condicion adicional que lo haga estrictamente necesario, como ocurre cuando un item no tiene ninguna frase clasificada como adecuada. De este modo, solo 12 de las 19 frases cumplieron ambas condiciones y se asignaron a la categoria adecuada, aunque sus puntuaciones medias fueran menores que 6 (vease un ejemplo en la Tabla VI).

Por ultimo, estas asignaciones de clasificacion para las frases del COCTS basadas en las puntuaciones medias y los votos de la mayoria de los jueces todavia dejan ocho items cuyas frases solo reciben clasificaciones ingenuas o plausibles porque carecen de una frase adecuada. Como ultimo recurso, la asignacion de la categoria para estos ocho items dificiles requeriria un escrutinio cuidadoso de sus contenidos y, quizas, nuevas puntuaciones de jueces para mejorar su diseno y clasificacion.

Conclusiones

En los ultimos anos, la medida de las actitudes relacionadas con la ciencia y la tecnologia ha mejorado por la contribucion tanto de la investigacion cualitativa (entrevistas y portafolios) como de la investigacion cuantitativa (vease la revision de Lederman, Wade y Bell, 1998), donde sobresalen los cuestionarios desarrollados empiricamente como el VOSTS (Aikenhead y Ryan, 1989), el TBA-CTS (Rubba y Harkness, 1993) y la adaptacion espanola de ambos denominada COCTS (Manassero y Vazquez, 1998). Estos instrumentos ofrecen algunas de las ventajas de los metodos cualitativos y cuantitativos y disminuyen algunos de sus inconvenientes. Con el fin de mejorar su aplicacion se han sugerido y discutido distintos modelos para responder los cuestionarios, diferente a solo escoger la frase preferida en cada item.

El Modelo de Respuesta Multiple (MRM) ofrece mejoras importantes a los otros modelos de respuesta, puesto que aborda toda la informacion disponible en cada item. Para llevar a cabo el MRM y su procedimiento de puntuacion (calculando un indice actitudinal) es necesaria la clasificacion previa de las diversas frases de cada item.

Este estudio se ha ocupado de informar la metodologia de escalamiento aplicada mediante un panel de jueces expertos para clasificar las numerosas frases del COCTS en una de las tres categorias normalizadas, siguientes: ingenua, plausible y adecuada. El escalamiento de las frases del COCTS es una piedra angular para el computo de un indice actitudinal cuantitativo, global e independiente para cada item, como se ha explicado en otro lugar (Vazquez y Manassero, 1999). Esta propuesta muestra los progresos interpretativos y cuantitativos en la evaluacion de las actitudes hacia la ciencia y en los estudios para la posterior investigacion empirica, pues el indice actitudinal permite todo tipo de procedimientos de inferencia estadistica (comparaciones entre grupos, verificacion de hipotesis, etc.), habituales en este tipo de investigacion.

La fortaleza y validez del indice actitudinal para la investigacion cuantitativa es clara, pero al mismo tiempo tambien debe prestarse atencion a las posibilidades interpretativas del mismo, respecto a los items del COCTS; por ejemplo, la capacidad de describir detalles cualitativos de las actitudes de los individuos respecto a una amplia gama de temas CTS. Por consiguiente, esta propuesta permite lograr los siguientes objetivos: Medir validamente las actitudes, aprovechar toda la informacion disponible en cada item, perfilar interpretativamente las actitudes de los individuos y posibilitar la aplicacion a las diferentes respuestas de los metodos cuantitativos avanzados, tales como analisis e inferencias estadisticos.

Rubba, Schoneweg-Bradford y Harkness (1996) al aplicar en su trabajo seminal un acuerdo general de mayoria entre cinco jueces encontraron diferencias muy significativas entre las opiniones de estos sobre las interacciones CTS, hasta el extremo de que dos de ellos se situaban sistematicamente fuera del rango. En consecuencia recomendaron aumentar el numero de jueces. La clasificacion por jueces de las frases del COCTS presentada aqui se basa en las puntuaciones de un panel de 11 jueces, extraido de un conjunto inicial de 16, por medio de criterios estadisticos globales y no individuales (las estadisticas descriptivas generales de las puntuaciones de los jueces y el analisis factorial de componente principales). Los criterios aplicados para obtener parsimonia y consistencia y evitar los sesgos han sido multiples: las puntuaciones medias de los jueces, el acuerdo general de la mayoria de ellos y algunas correcciones de sesgos globales, como la definicion de una escala del intervalo igual asimetrica y la compensacion por la ausencia de frases de categoria adecuada en algunas cuestiones. Despues de aplicar racionalmente estos criterios por medio de la metodologia descrita anteriormente, las 637 frases de opcion multiple de todas las cuestiones del COCTS se han clasificado en una de las tres categorias, obteniendose 143 frases en la categoria adecuada, 274 en la categoria plausible y 220 en la categoria ingenua.

La clasificacion del COCTS puede tener un papel en el desarrollo del curriculo CTS para las aulas de ciencia, como una guia curricular para la amplia gama de temas de esta area. De hecho, cada cuestion puede verse como una aproximacion introductoria a las diferentes posiciones sobre el tema CTS planteado, las cuales se formulan en las frases correspondientes. Asimismo, la gran variedad de temas de los items del COCTS puede permitir al profesorado de ciencias seleccionar, ordenar y desarrollar los contenidos CTS para las distintas etapas y niveles, seleccionar el conjunto apropiado de items para desarrollar los temas y emplear los items del COCTS como si fueran un guion. Estos pueden utilizarse en las aulas de ciencias como contenidos CTS explicitos, de varias maneras, como fomentar las discusiones entre los estudiantes, buscar casos historicos, leer textos ilustrativos o buscar autores que defiendan o critiquen las diferentes opciones. Teniendo en cuenta que los profesores de ciencias reciben poca formacion en los temas CTS, las recomendaciones curriculares anteriores tambien son validas para la formacion inicial o continua del profesorado que se dirige a poner al dia y mejorar las actitudes de los profesores hacia los temas CTS (Abd-El-Khalick, Bell y Lederman, 1998; Akerson, Abd-El-Khalick y Lederman, 2000).

Por otra parte, los procesos de escalamiento por medio de los jueces siempre tienen un desajuste estadistico que desafia la calidad global del COCTS como instrumento de evaluacion CTS. Este desajuste proviene de la variabilidad de juicio causada por el caracter dialectico de los temas CTS y por el propio proceso de clasificacion, ya que involucra el uso de parametros estadisticos afectados por errores humanos aleatorios. Estas fuentes de error estadistico inherentes al escalamiento de los jueces constituyen un paso valioso, pero provisional, que necesita mejorar mediante procesos iterativos de realimentacion. Por ejemplo, Rubba, Schoneweg-Bradford y Harkness (1996) lograron el acuerdo por medio de la discusion abierta y directa con sus cinco jueces, una tarea que esta mas alla del alcance de este estudio porque los jueces integrantes del panel provienen de lugares distantes y, por consiguiente, la tarea de revision es realmente dificil. Un juez (cientifico) comento que la tarea de clasificar las cuestiones CTS fue "una de las tareas mas duras que he realizado jamas" (Rubba, Schoneweg-Bradford y Harkness, 1996, p. 396). En su lugar, se propuso a los investigadores de didactica de las ciencias discutir los resultados que se han publicado con detalle (Manassero, Vazquez y Acevedo, 2001). Aunque pueda parecerlo, no se pretende sostener que exista un amplio acuerdo dentro de las comunidades de ciencia, historia, filosofia y sociologia de la ciencia; si este fuera el caso, obviamente no hubieramos apelado a los jueces para que clasificaran las posiciones. Aunque estos resultados puedan interpretarse como una prueba definitiva de la falta de acuerdo general en las cuestiones CTS, hay que destacar que, como conclusion del trabajo de los jueces son posibles algunos acuerdos parciales sobre los temas CTS (McComas, Clough y Almazroa, 2000). Asi pues, la clasificacion de las frases no constituye ningun tipo de sistema absoluto para clasificar rigidamente las respuestas como correctas o falsas, sino solo para perfilar aproximadamente las actitudes de las personas.

Las cuestiones del COCTS y del VOSTS se desarrollaron empiricamente, como un esfuerzo por evitar los fallos comunes de los instrumentos de evaluacion actitudinales aplicados en la bibliografia mencionada en la introduccion. La naturaleza empirica del COCTS es, ciertamente, un aspecto metodologico fuerte, pero el proceso de escalamiento por medio de los jueces muestra algunas debilidades especificas. Algunos de ellos expresaron descontento y criticas sobre cuestiones concretas; por ejemplo, los jueces fueron incapaces de encontrar alguna frase adecuada en varios items. Por otro lado, un juez reclamo que algunas cuestiones necesitaban una distribucion mas equilibrada y simetrica de opciones para representar mejor el rango completo de las respuestas potenciales (entre los dos extremos actitudinales). Ademas, el proceso de escalamiento por medio de los jueces desplego otras dificultades que necesitan ser consideradas, tales como: disenar cuestiones mas equilibradas que puedan presentar las tres categorias en cada cuestion (por ejemplo, aumentando el numero de opciones en algunos items). Estas sugerencias son especialmente criticas porque afectan el caracter empiricamente desarrollado de los items, pues algunos de ellos tendrian que ser modificados o reconstruidas y quizas perderian entonces sus COCTS propiedades empiricas iniciales (validez de constructo).

La atencion a todas estas sugerencias representaria una mejora neta para la calidad del COCTS, porque tales demandas surgen de la especializacion de los jueces y no es probable que pudieran surgir del conocimiento simple de personas poco expertas, como los jovenes encuestados como base de su desarrollo empirico. Sin embargo, para mantener el caracter empiricamente desarrollado del COCTS, su mejora debe hacerse con cautela; por ejemplo, por medio de la comprobacion empirica previa de las nuevas frases que pudieran incluirse.

Por ultimo, se debe destacar que el enfoque actitudinal en los temas CTS puede parecer extrano a muchos que preferirian los terminos "concepciones", "opiniones" o "creencias". Todos estos enfoques pueden ser complementarios, pero estimamos que el enfoque actitudinal parece mas global, mientras el enfoque conceptual se limita al conocimiento de hechos o procedimientos. Esta diferencia puede verse en un ejemplo clasico, como seria la distincion entre poseer el conocimiento sobre los efectos adversos del tabaco en la salud y la actitud personal (acuerdo o desacuerdo) hacia el acto de fumar; es decir, la comprension de los efectos de tabaco en la salud es un factor importante que puede afectar la actitud personal, pero no es el unico factor determinante y, de hecho, hay personas legas en este asunto que no fuman en absoluto y medicos que son grandes fumadores. El mismo esquema se aplica a la naturaleza cargada de valores de los temas CTS; una persona puede entender los procesos de calentamiento global del planeta, pero al mismo tiempo puede tener un comportamiento contradictorio con esa comprension. Nuestra posicion es que la responsabilidad de la ciencia escolar debe ser contribuir significativamente a la comprension publica de la ciencia en nuestra sociedad, lo que sin duda puede interpretarse en terminos del conocimiento, pero tambien puede referirse a las convicciones civicas, compromisos y conductas de los estudiantes.

El enfoque actitudinal integra de modo bastante natural conocimientos, afectos y conductas y subraya la conciencia de que la ciencia escolar tiene que alcanzar finalidades educativas de valores, los cuales implican comprension pero tambien una opcion personal; metas que deben ser importantes para todos los estudiantes. En general, educar en valores en este campo no significa inculcar un cierto conjunto de ellos sobre la ciencia y la tecnologia; mas bien significa exponer el conjunto completo de valores en torno a un tema (cada item del COCTS despliega una amplia gama de posibles posiciones sobre un tema), explorarlos, discutirlos y facilitar la adhesion personal cuando sea posible. Sin embargo, en algunos casos concretos los expertos estan de acuerdo (por ejemplo, la naturaleza provisional del conocimiento cientifico, la creatividad en la metodologia cientifica, la influencia de la sociedad en la ciencia, etc.) en que educar para lograr valores tambien significa senalar la respuesta adecuada.

Metodologicamente, el procedimiento de escalamiento presentado aqui aporta un sistema mas completo para evaluar el perfil en una cuestion CTS, mostrando explicitamente el marco de referencia para calcular las puntuaciones (Manassero y Vazquez, 2002; Manassero, Vazquez y Acevedo, 2003). Por otro lado, el metodo cuantitativo no excluye la interpretacion de los datos a traves de un analisis cualitativo; de hecho, el analisis mas simple basado en cada frase permite conseguir rapidamente conclusiones cualitativas (Manassero, Vazquez y Acevedo, 2004). Sin embargo, el objetivo de la aplicacion del COCTS no es tanto clasificar personas o grupos segun el grado de adecuacion de sus actitudes, sino ayudar a describir y comparar con detalle sus complejas posiciones.

Para concluir, conviene senalar que este estudio no asume que exista un acuerdo general sobre los temas CTS, aunque el acuerdo parcial tambien esta surgiendo en algunos items especificos (McComas, Clough y Almazroa, 2000; Vazquez, Acevedo y Manassero, 2004); no obstante, hay un reconocimiento explicito de que la principal dificultad para evaluar los temas CTS es la falta de acuerdo general. En este caso, la clasificacion presentada aqui es una aproximacion simple, pero explicita, de un marco de referencia para la evaluacion, que se somete a las criticas de la comunidad de investigadores y expertos en educacion cientifica. En suma, la aplicacion de esta clasificacion en los futuros proyectos de investigacion relativos a la evaluacion de actitudes relacionadas con la ciencia y los temas de CTS por medio del MRM y la nueva metrica, deberian ofrecer la prueba empirica de estos rasgos del COCTS.

(Recibido: 14 de enero de 2005; aceptado para su publicacion: 25 de febrero de 2005)

Referencias

Abd-El-Khalick, F., Bell, R. L. y Lederman, N. G. (1998). The nature of science and instructional practice: making the unnatural natural. Science Education, 82 (4), 417-436.

Acevedo, J. A. (1997). Ciencia, tecnologia y sociedad (CTS). Un enfoque innovador para la ensenanza de las ciencias. Revista de Educacion de la Universidad de Granada, 10, 269-275.

Acevedo, J. A. (2000). Algunas creencias sobre el conocimiento cientifico de los profesores de Educacion Secundaria en formacion inicial. Bordon, 52 (1), 5-16. Consultado en la seccion Sala de Lecturas CTS+I de la OEI, el 10 de enero de 2005 en: http://www.campus-oei.org/salactsi/acevedo18.htm.

Aikenhead, G. S. (1988). An analysis of four ways of assessing student beliefs about STS topics. Journal of Research in Science Teaching, 25 (8), 607-629.

Aikenhead, G. S. (1994). Consequences to learning science trough STS: a research perspective. En J. Solomon y G. S. Aikenhead (Eds.), STS education: International perspectives on reform (pp. 169-186). Nueva York: Teachers College Press.

Aikenhead, G. S., Fleming, R. W. y Ryan, A .G. (1987). High school graduates' beliefs about science-technology-society: I. Methods and issues in monitoring students views. Science Education, 71 (2), 145-161.

Aikenhead, G. S. y Ryan, A. G. (1989). The development of a multiple choice instrument for monitoring views on science-technology-society topics (Final report of SSHRCC Grant). Saskatoon, Canada: University of Saskatchewan, Department of Curriculum Studies.

Aikenhead, G. S. y Ryan, A. G. (1992). The development of a new instrument: "Views on science-technology-society" (VOSTS). Science Education, 76 (5), 477-491. Tambien disponible en: http://www.usask.ca/education/people/aikenhead/vosts_2.pdf

Akerson, V. L., Abd-El-Khalick, F. y Lederman, N. G. (2000). Influence of a reflective explicit activity-based approach on elementary teachers' conceptions of nature of science. Journal of Research in Science Teaching, 37 (4), 295-317.

Alters, B. J. (1997a). Whose nature of science? Journal of Research in Science Teaching, 34 (1), 39-55.

Alters, B. J. (1997b). Nature of science: a diversity or uniformity of ideas? Journal of Research in Science Teaching, 34 (10), 1105-1108.

Bell, R.L., Lederman, N. G. y Abd-El-Khalick, F. (2000). Developing and acting upon one's conception of the nature of science: A follow-up study. Journal of Research in Science Teaching, 37 (6), 563-581.

Bratt, M. (1984). Further comments on the validity studies of attitude measures in science education. Journal of Research in Science Teaching, 21 (9), 951.

Breckler, S. J. (1994). A comparison of numerical indexes for measuring attitude ambivalence. Educational and Psychological Measurement, 54 (2), 350-365.

Bybee, R. W. (1987). Science education and the science-technology-society (S-T-S) theme. Science Education, 71 (5), 667-683.

Clough, E. E. y Driver, R. (1986). A study of consistency in the use of students' conceptual frameworks across different task contexts. Science Education, 70 (4), 473-496.

Chaiken, S., Pomerantz, E. M. y Giner-Sorolla, R. (1995). Structural consistency and attitude strength. En R. E. Petty y J. A. Krosnick, Attitude strength. Antecedents and consequences (pp. 387-412). Mahwah, NJ: LEA.

Eagly, A. H. y Chaiken, S. (1993). The psychology of attitudes. Forth Worth TX: Harcourt Brace College Publishers.

Fraser, B. J. y Tobin, K. G. (Eds.). (1998). International handbook of science education. Dordrecht, Paises Bajos: Kluwer Academic Publishers.

Gardner, P. L. (1975). Attitude measurement: A critique of some recent research. Education Research, 17 (2)101-105.

Gardner, P. L. (1996). The dimensionality of attitude scales: a widely misunderstood idea. International Journal of Science Education, 18 (8), 913-919.

Gauld, C. F. y Hukins, A. A. (1980). Scientific attitudes: A review. Studies in Science Education, 7, 129-161.

Haladyna, T. y Shaughnessy, J. (1982). Attitudes towards science: A quantitative synthesis. Science Education, 66 (4), 547-563.

Hodson, D. (1985). Philosophy of science, science, and science education. Studies in Science Education, 12, 25-57.

Hofstein, A., Aikenhead, G. y Riquarts, K. (1988). Discussions over STS at the Fourth IOSTE Symposium. International Journal of Science Education, 10 (4), 357-366.

Kempa, R. (1986). Assessment in science. Cambridge: Cambridge University Press.

Laforgia, J. (1988). The affective domain related to science education and its evaluation. Science Education, 72 (4), 407-421.

Lederman, N. G. (1992). Students' and teachers' conceptions of the nature of science: A review of the research. Journal of Research in Science Teaching, 29 (4), 331-359.

Lederman, N. G., Wade, P. D. y Bell, R. L. (1998). Assessing the nature of science: What is the nature of our assessments? Science and Education, 7 (6), 595-615.

Manassero, M. A. y Vazquez, A. (1998). Opinions sobre ciencia, tecnologia i societat. Palma de Mallorca: Conselleria d'Educacio, Cultura i Esports.

Manassero, M. A. y Vazquez, A. (2002). Instrumentos y metodos para la evaluacion de las actitudes relacionadas con la ciencia, la tecnologia y la sociedad. Ensenanza de las Ciencias, 20 (1), 15-27.

Manassero, M. A., Vazquez, A. y Acevedo, J. A. (2001). Avaluacio del temes de ciencia, tecnologia i societat. Palma de Mallorca: Conselleria d'Educacio i Cultura.

Manassero, M. A., Vazquez, A. y Acevedo, J. A. (2003). Cuestionario de Opiniones sobre Ciencia, Tecnologia y Sociedad (COCTS). Princeton, NJ: Educational Testing Service. Disponible en: http://www.ets.org/testcoll/.

Manassero, M. A., Vazquez, A. y Acevedo, J. A. (2004). Evaluacion de las actitudes del profesorado respecto a los temas CTS: nuevos avances metodologicos. Ensenanza de las Ciencias, 22 (2), 299-312.

McComas, W. F. (Ed.). (2000). The nature of science in science education: Rationales and strategies. Dordrecht, Paises Bajos: Kluwer Academic Publishers.

McComas, W. F., Almazroa, H. y Clough, M. P. (1998). The Nature of Science in Science Education: An Introduction. Science and Education, 7 (6), 595-615.

McComas, W. F., Clough, M. P. y Almazroa, H. (2000). The role and character of the nature of science in science education. En W. F. McComas (Ed.), The nature of science in science education: Rationales and strategies (pp. 3-39). Dordrecht, Paises Bajos: Kluwer Academic Publishers.

Munby, H. (1983). Thirty studies involving the "Scientific Attitude Inventory": What confidence can we have in this instrument? Journal of Research in Science Teaching, 20 (2), 141-162.

Oliva, J. M. (1999). Algunas reflexiones sobre las concepciones alternativas y el cambio conceptual. Ensenanza de las Ciencias, 17 (1), 93-107.

Ormerod, M. B. y Duckworth, D. (1975). Pupils attitudes' to science: a review of research. Windsor, Reino Unido: NFER Publishing.

Petty, R. E. y Krosnick, J. A. (1995). Attitude strength. Antecedents and consequences. Mahwah, NJ: LEA.

Rubba, P. A. y Harkness, W. L. (1993). Examination of preservice and in-service secondary science teachers' beliefs about Science-Technology-Society interactions. Science Education, 77 (4), 407-431.

Rubba, P. A., Schoneweg-Bradford, C. S. y Harkness, W. L. (1996). A new scoring procedure for the Views on Science-Technology-Society instrument. Internacional. Journal of Science Education, 18 (4), 387-400.

Schibeci, R. A. (1983). Selecting appropriate attitudinal objectives for school science. Science Education, 67 (5), 595-603.

Schibeci, R. A. (1984). Attitudes to science: Un update. Studies in Science Education, 11, 26-59.

Shadish, W. R. (1995). The quantitative-qualitative debates: 'Dekuhnifying' the conceptual context. Evaluation and Program Planning, 18, 47-49.

Shrigley, R. L. y Koballa Jr., T. R. (1992). A decade of attitude research based on Hovland's learning model. Science Education, 76 (1), 17-42.

Smith, M. U., Lederman, N. G., Bell, R. L., McComas, W. F. y Clough, M. P. (1997). How great is disagreement about the nature of science: A response to Alters. Journal of Research in Science Teaching, 34 (10), 1101-1103.

Solomon, J. y Aikenhead, G. (Eds.). (1994). STS education: International perspectives on reform. Nueva York: Teachers College Press.

Stahlberg, D. y Frey, D. (1990). Actitudes I: estructura, medida y funciones. En M. Hewstone, W. Stroebe, J. P. Codol y G. M. Stephenson (Dirs.), Introduccion a la Psicologia Social (pp. 149-170). Barcelona: Ariel.

Taber, K. S. (2000). Multiple frameworks? Evidence of manifold conceptions in individual cognitive structure. International Journal of Science Education, 22 (4), 399-418.

Tamir, P. (1998). Assessment and evaluation in science education. Opportunities to learn and outcomes. En B. J. Fraser y K. G. Tobin (Eds.), International handbook of science education (pp. 761-790). Dordrecht, Paises Bajos: Kluwer Academic Publishers.

Vazquez, A., Acevedo, J. A. y Manassero, M. A. (2004). Consensos sobre la naturaleza de la ciencia: evidencias e implicaciones para su ensenanza. Revista Iberoamericana de Educacion, edicion digital. Consultado el 3 de enero de 2005, en: http://www.campus-oei.org/revista/deloslectores/702Vazquez.PDF.

Vazquez, A. y Manassero, M. A. (1995). Actitudes relacionadas con la ciencia: una revision conceptual. Ensenanza de las Ciencias, 13 (3), 337-346.

Vazquez, A. y Manassero, M. A. (1997). Una evaluacion de las actitudes relacionadas con la ciencia. Ensenanza de las ciencias, 15 (2), 199-213.

Vazquez, A. y Manassero, M. A. (1999). Response and scoring models for the "Views on Science-Technology-Society" instrument. International Journal of Science Education, 21 (3), 231-247.

Waks, L. J. y Prakash, M. S. (1985). STS education and its three step-sisters. Bulletin of Science, Technology and Society, 52 (2), 105-116.

Wareing, C. (1990). A survey of antecedents of attitudes toward science. Journal of Research in Science Teaching, 27 (4), 371-386.

Zeidler, D. L. (1984). Thirty studies involving the "scientific attitude inventory": what confidence can we have in this instrument. Journal of Research in Science Teaching, 21 (3), 341-342.

Ziman, J. (1994). The rationale of STS. Education is in the approach. En J. Solomon y G. Aikenhead (Eds.), STS education: International perspectives on reform (pp. 21-31). Nueva York: Teachers College Press.

Angel Vazquez Alonso (1)

angel.vazquez@uib.es

Departamento de Ciencias de la Educacion

Universidad de las Islas Baleares

Maria Antonia Manassero Mas (1)

ma.manassero@uib.es

Departamento de Psicologia

Universidad de las Islas Baleares

Jose Antonio Acevedo Diaz (2)

ja_acevedo@vodafone.es

Inspeccion educativa

Consejeria de Educacion de la Junta de Andalucia

(1) Edificio Guillem Cifre de Colonya, Carretera de Valldemossa, Km. 7.5 07122, Palma de Mallorca, Espana

(2) Delegacion Provincial de Huelva Servicio de Inspeccion de Educacion C/ Los Mozarabes 8, 3a planta 21071, Huelva, Espana
Figura 1. Distribucion de las punctuaciones medias de las frases sobre los
intervalos de las escala de puntuaciones de los once jueces

                         Frecuericias

Escala de los jueces     Jueces-11       Jueces-16

                1              37              19
                2             116              91
                3             123             134
                4             126             150
                5             118             129
                6              81              81
                7              33              31
                8               3               2
                9

Nota: Tabla derivada de grafico de barra.]

Tabla I. Resultados de la clasificacion del item 10211 relativo
a la definicion de tecnologia

                Puntuaciones directas de
                      los jueces                Texto de la cuestion

J   J   J   J   J   J   J   J   J   J    J
1   2   3   4   5   6   7   8   9   10   11   10211. Definir que es la
                                              tecnologia puede
                                              resultar dificil porque
                                              esta sirve para muchas
                                              cosas. Pero la
                                              tecnologia
                                              PRINCIPALMENTE es:

1   1   6   5   2   4   3   9   1    5    4   A. Muy parecida a la
                                              ciencia.

2   2   2   3   2   3   2   2   1    5    3   B. La aplicacion de la
                                              ciencia.

4   6   6   2   7   5   5   4   6    5    5   C. Nuevos procesos,
                                              instrumentos, maquinaria,
                                              herramientas,
                                              aplicaciones,
                                              artilugios, ordenadores
                                              o aparatos practicos
                                              para el uso de cada dia.

4   5   5   2   7   5   4   5   1    5    2   D. Robots, electronica,
                                              ordenadores, sistemas de
                                              comunicacion,
                                              automatismos, maquinas.

8   6   5   6   6   5   5   1   5    6    9   E. Una tecnica para
                                              construir cosas o una
                                              forma de resolver
                                              problemas practicos.

6   7   5   6   6   5   5   6   5    8    6   F. Inventar, disenar y
                                              probar cosas (por
                                              ejemplo, corazones
                                              artificiales,
                                              ordenadores y vehiculos
                                              espaciales).

9   8   5   6   8   7   6   3   2    5    7   G. Ideas y tecnicas para
                                              disenar y hacer cosas;
                                              para organizar a los
                                              trabajadores, la gente
                                              de negocios y los
                                              consumidores; y para el
                                              progreso de la sociedad.

6   5   4   4   4   6   5   1   1    6    8   H.* Saber como hacer
                                              cosas (por ejemplo,
                                              instrumentos,
                                              maquinaria, aparatos).

      Votos de jueces     Punt.   Cate-
      por categoria       media   goria    Texto de la cuestion

Ingen.   Plaus.   Adec.                    10211. Definir que es la
                                           tecnologia puede
                                           resultar dificil porque
                                           esta sirve para muchas
                                           cosas. Pero la
                                           tecnologia
                                           PRINCIPALMENTE es:

  5        5        1      3.73   Plaus.   A. Muy parecida a la
                                           ciencia.

  10       1        0      2.45   Ingen.   B. La aplicacion de la
                                           ciencia.

  1        9        1      5.00   Plaus.   C. Nuevos procesos,
                                           instrumentos, maquinaria,
                                           herramientas,
                                           aplicaciones,
                                           artilugios, ordenadores
                                           o aparatos practicos
                                           para el uso de cada dia.

  3        7        1      4.09   Plaus.   D. Robots, electronica,
                                           ordenadores, sistemas de
                                           comunicacion,
                                           automatismos, maquinas.

  1        8        2      5.64   Plaus.   E. Una tecnica para
                                           construir cosas o una
                                           forma de resolver
                                           problemas practicos.

  0        9        2      5.91   Plaus.   F. Inventar, disenar y
                                           probar cosas (por
                                           ejemplo, corazones
                                           artificiales,
                                           ordenadores y vehiculos
                                           espaciales).

  2        4        5      6.00   Adec.    G. Ideas y tecnicas para
                                           disenar y hacer cosas;
                                           para organizar a los
                                           trabajadores, la gente
                                           de negocios y los
                                           consumidores; y para el
                                           progreso de la sociedad.

  2        8        1      4.55   Plaus.   H.* Saber como hacer
                                           cosas (por ejemplo,
                                           instrumentos,
                                           maquinaria, aparatos).

Tabla II. Estadistica descriptiva de las puntuaciones directas
emitidas por los 16 jueces

Jueces     J1     J2     J3     J4     J5     J6     J7     J8

Media      4.23   4.79   4.26   5.54   4.11   4.84   4.23   4.89
Desv.
estandar   2.74   2.46   2.22   1.83   2.17   2.15   1.65   2.32
Varianza   7.51   6.07   4.93   3.36   4.72   4.63   2.72   5.37
Minimo      1      1      1      2      1      1      1      1
Maximo      9      9      9      9      9      9      9      9

Jueces     J9     J10    J11    J12    J13    J14    J15    J16

Media      5.34   4.67   4.19   3.81   3.91   4.87   4.64   5.09
Desv.
estandar   1.38   2.23   1.58   2.61   2.79   2.35   2.23   2.51
Varianza   1.92   4.95   2.49   6.83   7.79   5.50   4.98   6.30
Minimo      3      1      1      1      1      1      1      1
Maximo      9      9      8      9      9      9      9      9

Tabla III. Comparacion de los resultados de los analisis
factoriales * para 8, 16 y 11 jueces. ** Las varianzas
multiples se corresponden con el numero de factores indicado

                                                     Factores

Temas del COCTS                  Items/       16       11       8
                                 Frases     jueces   jueces   jueces

Todos los temas del             100 / 637     2        1        1
COCTS.

Relaciones entre ciencia y       10 / 70      2        1        1
tecnologia.

Influencia de la sociedad en    15 / 101      3        1        1
la ciencia y la tecnologia.

Influencia de la ciencia y la   22 / 140      3        2        1
tecnologia en la sociedad.

Educacion en ciencia y           3 / 20       4        2        2
tecnologia.

Caracteristicas personales       12 / 82      3        2        2
de los cientificos y
cuestiones de genero.

Construccion colectiva del       14 / 84      3        1        1
conocimiento cientifico
(Sociologia interna de la
ciencia).

Toma de decisiones               4 / 27       5        3        2
tecnologicas.

Naturaleza del conocimiento     20 / 113      2        1        1
cientifico (Epistemologia de
la ciencia).

                                Varianza explicada (%)

Temas del COCTS                   16        11         8
                                jueces    jueces    jueces

Todos los temas del             33 / 20     52        54
COCTS.

Relaciones entre ciencia y      32 / 27     53        58
tecnologia.

Influencia de la sociedad en    30 / 16     52        55
la ciencia y la tecnologia.      / 14

Influencia de la ciencia y la   24 / 20   32 / 29     54
tecnologia en la sociedad.       / 18

Educacion en ciencia y          26 / 20   35 / 35   45 / 28
tecnologia.                     / 17 /
                                  17

Caracteristicas personales      29 / 19   37 / 25   33 / 33
de los cientificos y             / 16
cuestiones de genero.

Construccion colectiva del      32 / 15     52        53
conocimiento cientifico          / 13
(Sociologia interna de la
ciencia).

Toma de decisiones              25 / 17   37 / 18   40 / 31
tecnologicas.                   / 15 /     / 17
                                11 / 10

Naturaleza del conocimiento     38 / 19     56        57
cientifico (Epistemologia de
la ciencia).

* Metodo de componentes principales y rotacion Varimax.

** Todos los jueces tienen experiencia en investigacion sobre
temas CTS.

Tabla IV. Distribucion del numero de frases en las tres categorias
(ingenuas, plausibles y adecuadas), segun sus puntuaciones medias
(11 y 16 jueces) y tres criterios diferentes

               Intervalo
               absoluto de      Intervalo absoluto y
             puntos de corte   fronteras indefinidas   Voto de la
Categorias     en el medio          I <= 3; 4 >=       mayoria de
               I <=3.5 <            P <=6; 7<= A         jueces
               P < 6.5<= A

                11 jueces      11 jueces   16 jueces   11 jueces

Ingenuas           202            153         101         220
Plausibles         364            258         261         252
Adecuadas          71             43          62          105
Difusos             0             183         209          58

Tabla V. Distribucion de las frases en las tres categorias, segun las
puntuaciones medias por los 11 jueces, de acuerdo con el modelo del
intervalo igual y el refinamiento que aplica al modelo de la mayoria
de votos

              Modelo de                  Plausible
              intervalos    Plausible   con mayoria    Asignacion de
Categorias     iguales         con        adecuada      categorias
             I<=3.51; 4>=    mayoria    en cuestion     definitiva
              P<=6; 6< A     ingenua    sin adecuada

Ingenua          203           +17                         220
Plausible        303           -17          -12            274
Adecuada         131                        +12            143

Tabla VI. Texto y puntuaciones del item 20411, cuya clasificacion
muestra algunos rasgos especiales: ninguna de sus frases resulta
clasificada como adecuada y un juez (J7) no valora este item

        Puntuaciones directas de
              los jueces

J   J   J   J   J   J   J   J   J   J    J
1   2   3   4   5   6   7   8   9   10   11   Texto del item

                                              20411. Algunas culturas
                                              tienen un punto de
                                              vista particular sobre
                                              la naturaleza y los
                                              humanos. Los cientificos
                                              y la investigacion
                                              cientifica son afectadas
                                              por las creencias
                                              religiosas o eticas de
                                              la cultura donde se
                                              realiza el trabajo.

                                              Las creencias eticas y
                                              religiosas influyen en
                                              la investigacion
                                              cientifica:

1   5   4   3   5   4   X   1   6    7    6   A. Porque algunas
                                              culturas quieren que se
                                              haga investigacion
                                              especifica cuyos
                                              resultados la
                                              beneficien.

9   7   4   5   5   4   X   4   6    7    8   B. Porque
                                              inconscientemente los
                                              cientificos pueden
                                              elegir investigacion
                                              que apoye las creencias
                                              de su cultura.

6   7   4   2   4   4   X   1   3    5    2   C. Porque la mayoria de
                                              los cientificos no
                                              harian investigacion
                                              que fuera contra su
                                              educacion o sus
                                              creencias.

5   2   7   3   4   5   X   6   4    7    5   D. Porque todos
                                              reaccionamos de forma
                                              diferente ante nuestras
                                              culturas. Estas
                                              diferencias individuales
                                              de los cientificos
                                              influyen en el tipo de
                                              investigacion que hacen.

4   3   5   4   7   4   X   7   5    7    3   E. Porque grupos
                                              poderosos que
                                              representan a algunas
                                              creencias religiosas,
                                              politicas o culturales
                                              apoyarian determinados
                                              proyectos de
                                              investigacion, o darian
                                              dinero para que no se
                                              hagan ciertas
                                              investigaciones.

                                              Las creencias eticas y
                                              religiosas NO influyen
                                              sobre la investigacion
                                              cientifica:

4   1   3   4   4   4   X   1   4    4    1   F. Porque la
                                              investigacion continua a
                                              pesar de los
                                              enfrentamientos entre
                                              los cientificos y
                                              ciertos grupos
                                              religiosos o culturales
                                              (por ejemplo, entre
                                              partidarios de la
                                              evolucion y defensores
                                              de la creacion).

5   2   4   4   3   5   X   1   4    3    4   G. Porque los
                                              cientificos investigaran
                                              temas que son de
                                              importancia para
                                              la ciencia y ellos
                                              mismos,
                                              independientemente de
                                              las opiniones
                                              culturales o eticas.

      Puntuaciones medias

                                  Cate-
Ingen.   Plaus.   Adec.   Media   goria   Texto del item

                                          20411. Algunas culturas
                                          tienen un punto de
                                          vista particular sobre
                                          la naturaleza y los
                                          humanos. Los cientificos
                                          y la investigacion
                                          cientifica son afectadas
                                          por las creencias
                                          religiosas o eticas de
                                          la cultura donde se
                                          realiza el trabajo.

                                          Las creencias eticas y
                                          religiosas influyen en
                                          la investigacion
                                          cientifica:

  3        6        1     4.20      P     A. Porque algunas
                                          culturas quieren que se
                                          haga investigacion
                                          especifica cuyos
                                          resultados la
                                          beneficien.

  0        6        4     5.90      P     B. Porque
                                          inconscientemente los
                                          cientificos pueden
                                          elegir investigacion
                                          que apoye las creencias
                                          de su cultura.

  4        5        1     3.80      P     C. Porque la mayoria de
                                          los cientificos no
                                          harian investigacion
                                          que fuera contra su
                                          educacion o sus
                                          creencias.

  2        6        2     4.80      P     D. Porque todos
                                          reaccionamos de forma
                                          diferente ante nuestras
                                          culturas. Estas
                                          diferencias individuales
                                          de los cientificos
                                          influyen en el tipo de
                                          investigacion que hacen.

  2        5        3     4.90      P     E. Porque grupos
                                          poderosos que
                                          representan a algunas
                                          creencias religiosas,
                                          politicas o culturales
                                          apoyarian determinados
                                          proyectos de
                                          investigacion, o darian
                                          dinero para que no se
                                          hagan ciertas
                                          investigaciones.

                                          Las creencias eticas y
                                          religiosas NO influyen
                                          sobre la investigacion
                                          cientifica:

  4        6        0     3.00      I     F. Porque la
                                          investigacion continua a
                                          pesar de los
                                          enfrentamientos entre
                                          los cientificos y
                                          ciertos grupos
                                          religiosos o culturales
                                          (por ejemplo, entre
                                          partidarios de la
                                          evolucion y defensores
                                          de la creacion).

  4        6        0     3.50      I     G. Porque los
                                          cientificos investigaran
                                          temas que son de
                                          importancia para
                                          la ciencia y ellos
                                          mismos,
                                          independientemente de
                                          las opiniones
                                          culturales o eticas.
COPYRIGHT 2005 Universidad Autonoma de Baja California
No portion of this article can be reproduced without the express written permission from the copyright holder.
Copyright 2005 Gale, Cengage Learning. All rights reserved.

Article Details
Printer friendly Cite/link Email Feedback
Author:Vazquez Alonso, Angel; Manassero Mas, Maria Antonia; Acevedo Diaz, Jose Antonio
Publication:Revista Electronica de Investigacion Educativa
Date:Jan 1, 2005
Words:14904
Previous Article:La psicologia de la educacion como disciplina y profesion. Entrevista con Cesar Coll.
Next Article:La formacion del profesor novel en el Departamento de Pedagogia de la Universidad de Los Andes Tachira.
Topics:

Terms of use | Privacy policy | Copyright © 2019 Farlex, Inc. | Feedback | For webmasters