Printer Friendly

Efectos de metodo en las escalas de Ryff: un estudio en poblacion de personas mayores.

Method effects in Ryff's scales: a study in an elderly population.

La varianza de metodo se ha definido tradicionalmente como una forma de error sistematico o contaminacion, debido al metodo de medida y no al rasgo objeto de la medicion (Campbell y Fiske, 1959). Por lo tanto, en una medida observada X, se pueden diferenciar tres componentes:

X = R + M + E donde

R es el rasgo que se pretende medir (puntuacion verdadera en teoria clasica de tests), M es el componente de metodo y E seria el error aleatorio

Asumiendo que los tres componentes son independientes, la varianza de la medida observada se descompone de la siguiente forma:

V(X) = V(R) + V(M) + V(E)

Esta varianza de metodo resulta preocupante, dado que puede distorsionar, y de hecho lo hace, las medidas de asociacion, como las correlaciones, dejando de reflejar las verdaderas relaciones entre las variables de interes. Esta distorsion se conoce como sesgo de metodo (Conway, 2002), y para formularlo matematicamente en terminos de correlaciones, en este contexto, la relacion entre dos variables es funcion de la correlacion verdadera entre los rasgos, la correlacion entre los metodos y la proporcion de varianza de rasgo y de metodo en cada medida. De este modo, para dos variables observadas X e Y (Cote y Buckley, 1988) se cumple:

[r.sub.xy] = [[[rho].sub.ti,tj]([raiz cuadrada de [t.sub.x]] x [raiz cuadrada de [t.sub.y]] + [[[rho].sub.mk,ml] [raiz cuadrada de [m.sub.x]] x [raiz cuadrada de [m.sub.y]]]

donde [r.sub.xy] es la correlacion observada entre las variables de interes y, [[rho].sub.ti,tj] y [[rho].sub.mk,ml] son las correlaciones verdaderas entre los rasgos y los metodos, respectivamente, y [t.sub.x], [t.sub.y], [m.sub.x], y [m.sub.y] son las proporciones de varianza de rasgo y de metodo en las medidas X e Y respectivamente.

La formula muestra claramente que si los metodos se encuentran correlacionados el segundo sumando es mayor de cero, inflando las correlaciones. Sin embargo, resulta tambien obvio que aun siendo no correlacionados, con el segundo sumando cero, la correlacion sigue sin reflejar la relacion verdadera, ya que entonces la varianza de metodo actua como error aleatorio, atenuando las correlaciones (por ejemplo, Bollen, 1989).

Uno de los potenciales sesgos de metodo que se han propuesto, y han sido evaluados en la literatura, consiste en la aparicion de factores de metodo asociados a los items formulados en negativo. La practica de utilizar tanto items formulados en positivo como en negativo, para evitar el sesgo de aquiescencia tiene una larga tradicion en psicologia y otras ciencias sociales, y pueden trazarse sus inicios en los estudios sobre personalidad de los anos 50 (Bass, 1955; Jackson y Messick, 1957; Leavitt, Hax, y Roche, 1955; Messick y Jackson, 1957). De hecho esta tradicion ha dado lugar a una regla usada habitualmente, segun la cual se escogen aproximadamente la mitad de items en positivo y la mitad en negativo (Nunnally, 1978). Sorprendentemente, un formato de pregunta originalmente pensado para evitar un sesgo de respuesta, parece que produce varianza de metodo asociada a la aparicion de factores de metodo en los items en negativo, teniendo entre otros efectos el de complicar los analisis factoriales de las escalas, problema este que subrayamos no por ser el mas relevante, sino por ser el objeto de este estudio.

Efectivamente, existe abundante evidencia en la literatura cientifica de que el uso de items formulados en negativo genera varianza de metodo, lo que hace aparecer factores de metodo negativos no asociados con los rasgos de interes (Williams, Ford y Nguyen, 2002). Este efecto se observa en distintos campos aplicados de la psicologia. Por ejemplo, en el contexto de la psicologia organizacional se ha encontrado este efecto de metodo en muchas de las escalas mas ampliamente utilizadas, como la Job Diagnostic Survey (Cordery y Sevastos, 1993; Harvey, Billings y Nilan, 1985; Idaszak y Drasgow, 1987; Kulik, Oldham y Langner, 1988). De la misma forma, en diversas medidas de compromiso con la organizacion se ha encontrado este efecto (Ladd, Gordon, Beauvais, and Morgan, 1982; Magazine, Williams y Williams, 1996). Sin animo de ser exhaustivos, tambien se han encontrado en medidas de liderazgo (por ejemplo, Schriesheim y Eisenbach, 1995). Estos efectos de metodo tambien se han encontrado en escalas de personalidad y, en general, de auto-evaluaciones personales, como la que es objeto de analisis en este trabajo, asi, se han encontrado en medidas de autoestima, de personalidad o de orientacion vital (Carmines y Zeller, 1979; Di Stefano y Motl, 2006, 2008; Horan, DiStefano y Motl, 2003; Marsh, 1996; Meharabian y Ljunggren, 1997; Motl y DiStefano, 2002; Quilty, Oakman y Risko, 2006; Scheirer, Carver y Bridges, 1994; Tomas y Oliver, 1999; Vautier, Raufaste y Cariou, 2003; Wang, Siegal, Falck y Carlson, 2001).

Diversos de estos autores apuntan tambien a que la aparicion de estos efectos de metodo es diferencialmente relevante en funcion de ciertas caracteristicas personales, incluyendo el grado en que se cae en la deseabilidad social, el nivel educativo, etc. Independientemente de los factores causantes, resulta evidente que existe un amplio consenso en la literatura de que la formulacion de los items, y muy especialmente la formulacion en negativo y/o invertido de estos, puede llevar a la aparicion de factores de metodo, con la consecuencia de distorsiones en la estructura factorial de las escalas analizadas. Uno de los dominios donde es potencialmente posible que aparezcan estos efectos asociados a los items negativos es en las escalas de bienestar, que son casi exclusivamente medidas de autoinforme, de evaluacion personal, percepciones de uno mismo, y que practicamente siempre se han medido con combinaciones de items positivos y negativos.

De entre los cuestionarios empleados para la medicion del bienestar psicologico uno de los de mas amplio uso es el desarrollado por Ryff desde 1989 (Van Dierendonck, 2005). El cuestionario original contaba con 120 items, balanceados en cada una de las seis dimensiones en que la teoria subyacente dividia el bienestar: autoaceptacion, relaciones positivas con los otros, dominio del ambiente, autonomia, crecimiento personal y proposito en la vida. Dada la longitud de dicho instrumento, se han venido proponiendo diferentes versiones de menor tamano. Asi, Ryff, Lee, Essex y Schmutte (1994) desarrollaron una version de 14 items por escala, seleccionados en funcion de sus correlaciones item-total y su ajuste al modelo teorico propuesto. Otra version acortada incluye 9 items por factor (Van Dierendonck, 2005), y ademas, Ryff y Keyes (1995) desarrollaron una version de 3 items por escala, seleccionando aquellos que mejor ajustaban con el modelo teorico propuesto de seis factores.

En cuanto al funcionamiento de las escalas, los autores han indicado que la validez factorial de la version de 14 items por dimension muestra un mal ajuste al modelo teorico propuesto; que la version de 9 items ofrece ajustes factoriales confirmatorios mas bajos de lo deseable; y que la version de 3 items muestra unos indicadores de ajuste ligeramente superiores, pero muy baja consistencia interna debido, probablemente, a su longitud y al criterio de seleccion de items (Keyes, Shmotkin y Ryff, 2002).

En relacion a la estructura factorial de las Escalas de Ryff, estas han sido analizadas mediante analisis factoriales confirmatorios en su version de 54 items por Ryff y Keyes (1995), encontrando que el modelo confirmatorio de mejor ajuste era el de seis factores de primer orden y uno de segundo orden que explicaria a los anteriores, aunque el ajuste resulto pobre. Posteriormente Keyes, Shmotkin y Ryff (2002), tambien mediante analisis confirmatorios, encontraron que a la base de estos seis factores de primer orden se encontrarian dos constructos de nivel superior, bienestar subjetivo y bienestar psicologico, si bien esto ultimo lo pusieron a prueba tomando los seis factores como indicadores observables, y realizando un nuevo analisis factorial confirmatorio con estos dos constructos como factores latentes. Aun asi, el ajuste de este modelo tampoco resulto satisfactorio.

La estructura factorial de las escalas de Ryff ha sido posteriormente analizada en sus diferentes versiones tambien por otros autores. Asi, por ejemplo, en muestras holandesas, van Dierendonck (2005) encuentra que el mejor modelo es el de seis factores con un factor de segundo orden, si bien los ajustes tampoco eran satisfactorios y exigieron la eliminacion de items, dejando la escala en 39 items. Por su parte Abbott, Ploubidis, Huppert, Kuh, Wadsworth y Croudace (2006), encuentran tambien una estructura de seis factores, pero con un factor de segundo orden afectando a cuatro de los factores de primer orden, si bien el ajuste solamente resulto satisfactorio con la reduccion de items y la modelizacion de factores que, al margen del contenido del item, agrupaban a los formulados positiva y negativamente. Tambien Springer, Hauser y Freese (2006) evaluaron diversos modelos factoriales confirmatorios para las escalas de Ryff, en tres grandes masas de datos estadounidenses de caracter nacional, concluyendo que la distincion de seis factores es dudosa dadas sus altas intercorrelaciones. Este articulo ha sido posteriormente replicado por Ryff y Singer (2006), senalando que el mejor ajuste global sigue siendo el de seis factores, lo que no obstante no resuelve el problema de las altas inter-correlaciones entre factores (Springer, Hauser y Freese, 2006).

En nuestro contexto, diferentes estudios han utilizado estas escalas como base para la investigacion empirica del bienestar en el envejecimiento (Navarro, Melendez y Tomas, 2008; Triado, 2003), y algunos han puesto a prueba su estructura factorial y propiedades psicometricas. Asi, el trabajo de Diaz, Rodriguez-Carvajal, Blanco, Moreno-Jimenez, Gallardo, Valle y van Dierendonck (2006) ha probado diversos modelos para poner a prueba la estructura de estas escalas, intentando mejorar sus propiedades psicometricas, reduciendo ampliamente el numero de items hasta una version de 29. Tambien Tomas, Melendez y Navarro (2008) han estudiado la estructura factorial de las escalas, concretamente en muestra de personas jubiladas, no empleando directamente los items, sino agregados de estos, y sin obtener ajustes plenamente satisfactorios. En un trabajo reciente, y tambien con muestra de personas mayores, Triado, Villar, Sole y Celdran (2007) han puesto a prueba las diversas estructuras factoriales encontradas en la literatura para la version de 54 items, y las conclusiones son muy similares, aunque con ajustes altamente insatisfactorios.

Un problema adicional de los resultados de todos los trabajos que han empleado analisis factorial confirmatorio, es que resulta dificil escoger entre los modelos de cinco y seis factores, pues sus indices de ajuste son muy similares, algunas veces a favor del modelo de cinco y otras del de seis, lo que probablemente se encuentra relacionado con las elevadas correlaciones entre las dimensiones, que no favorecen la validez discriminante que los autores defienden de las escalas (Ryff y Singer, 2006).

Dada esta situacion, la posible presencia de efectos de metodo en la escala, y sus versiones, no puede descartarse y un unico trabajo, hasta la fecha, la ha puesto a prueba en el contexto anglosajon y en poblacion general (Springer y Hauser, 2006). Efectivamente, estos autores encontraron que los modelos factoriales de mejor ajuste (que no de ajuste satisfactorio) mejoraban claramente al introducir un efecto de metodo asociado a los items formulados en negativo.

A la vista de todos estos resultados el objetivo de este trabajo es doble. Por un lado estudiar la estructura factorial de la escala de Ryff en sus distintas versiones. Por otro lado, evaluar la presencia de efectos de metodo asociados a los items formulados en negativo.

METODO

Muestra y procedimiento. La muestra estuvo compuesta por un total de 556 personas de mas de 65 anos, jubiladas, de la Comunidad Valenciana (Espana), no institucionalizadas y sin deterioro cognitivo grave ya que debian responder por si mismos a las escalas, siendo el muestreo de tipo incidental. La recogida de datos se realizo de manera directa e individual entre septiembre de 2006 y marzo de 2007 obteniendose previamente el consentimiento informado de los participantes en el estudio. El tiempo estimado de aplicacion fue aproximadamente de 40 minutos por persona. Los entrevistadores fueron previamente entrenados en la aplicacion de los instrumentos. El 59% de la muestra esta compuesta por mujeres. La media de edad es de 76.46 anos (DT = 7.22), con un minimo de 65 anos, por criterios de inclusion, y un maximo de 95 anos. Por estado civil, un 53.5% estan casados, solteros fueron el 11%, viudos el 32.7% y en otros el 2.8% restante. Por nivel de estudios, un 18.4% de la muestra no tenia estudios, un 54.6% primarios, un 17.5% de secundaria y un 9.5% eran universitarios. Por criterios de inclusion, las personas mayores debian vivir en domicilio y no en residencia, pero en casa propia vivian un 75%, un 14.5% en vivienda alquilada, y con familiares un 10.6%. Un 87.3% tienen hijos, la media de hijos es 2.6 (DT = 1.68).

Instrumentos. Para la recogida de datos de esta investigacion, se utilizo una plantilla con diferentes elementos sociodemograficos y varios instrumentos: Indice Barthel (Mahoney y Barthel, 1965), Life Satisfaction Index (LSI-A) de Neugarten, Havighurst y Tobin (1961) y las escalas de Bienestar Psicologico de Ryff (1989), sobre las que versa este trabajo.

Las escalas de Ryff estan compuestas por items redactados tanto en positivo como en negativo, aunque para su posterior analisis se invirtieron los formulados en negativo. El formato de respuesta que se utilizo tiene puntuaciones comprendidas entre 1 (totalmente en desacuerdo) y 6 (totalmente de acuerdo). Dado el procedimiento (encuesta) la no respuesta ha sido practicamente inexistente, en algun caso algun item no ha sido contestado por un participante. Los items se agrupan teoricamente en seis factores, que se presentan a continuacion, asi como el significado de las puntuaciones altas en ellos: a) autonomia, si se es independiente y autodeterminado, capaz de resistir presiones sociales para pensar y actuar de ciertos modos, se regula la conducta internamente y las autoevaluaciones se realizan desde estandares personales; b) dominio del ambiente, si se posee sentido de dominio y competencia manejando el ambiente, se controlan multiples conjuntos de actividades externas, haciendo un uso efectivo de las oportunidades del contexto y siendo capaz de elegir o crear contextos adaptados a las necesidades y valores personales; c) crecimiento personal, cuando se mantiene el sentimiento de desarrollo continuado y de mejora a traves del tiempo, ve el yo en expansion y crecimiento, abierto a nuevas experiencias; sentido de desarrollo del propio potencial y de cambiar en modos que reflejan mas autoconocimiento y efectividad; d) relaciones positivas con otros al mantener relaciones interpersonales cercanas, satisfactorias, de mutua confianza, se preocupa por el bienestar de otros, siendo capaz de desarrollar empatia, afecto, intimidad y desde la comprension del dar y tomar de las relaciones humanas; e) autoaceptacion si posee una actitud positiva hacia si mismo, reconociendo y aceptando los multiples aspectos del yo, incluyendo lo negativo y lo positivo, ademas existe un sentimiento positivo hacia lo ya vivido; y f) proposito en la vida cuando tiene metas en la vida y sentido de direccion, sentimiento de significado en el presente y en el pasado, manteniendo creencias que proporcionan significado a la vida.

Analisis de datos. Se han empleado analisis factoriales confirmatorios, todos ellos estimados mediante el paquete estadistico EQS 6.1. Los modelos confirmatorios se han estimado mediante maxima verosimilitud con correcciones robustas de Satorra-Bentler (Bentler, 1995) dado el alejamiento de la normalidad multivariada en los indicadores, coeficiente de Mardia multivariado de 36.74, siendo este el procedimiento recomendado en estas situaciones (Finney y DiStefano, 2006). Para evaluar el ajuste de los modelos confirmatorios se han utilizado una variedad de indices, tal y como se recomienda en la literatura. Asi se emplea el CFI, GFI para los que se suele indicar 0.9 o superior como indicativo de un minimo para aceptar el modelo; el RMSEA y el SMSR, medidas de cuantia del error, con valores menores de 0.08 considerados como aceptables; y el AIC con el objetivo de comparar modelos; ademas de la prueba de ji-cuadrado (ver, por ejemplo, Hoyle y Panter, 1995; Hu y Bentler, 1995, 1999; Marsh, Balla, y Hau, 1996; Kaplan, 2000). Para evaluar los efectos de metodo asociados a items negativos se ha optado por modelar los factores de rasgo y con un factor adicional que se asocia a los items formulados en negativo (ver figura 1). Este metodo de analisis se ha recomendado frente al de unicidades correlacionadas (Tomas, Hontangas y Oliver, 2000).

RESULTADOS

En un primer momento, se han calculado todos los modelos confirmatorios substantivos que han aparecido en la literatura psicometrica sobre la escala de Ryff, y en sus distintas versiones. Se ha optado por aplicar solamente los modelos de primer orden, y no los modelos confirmatorios en que se incluian factores de segundo orden, pues estos se han planteado por las altas intercorrelaciones entre factores, que podrian, como hemos visto, estar debidas a un efecto de metodo. Por tanto, los pasos a dar son: calcular primero los modelos factoriales de primer orden encontrados en la literatura, para ver cual de ellos presenta el mejor ajuste por comparacion de modelos; y segundo modelar sobre el modelo de mejor ajuste un factor de metodo adicional. Los modelos sustantivos probados seran:

* Modelo de un factor. Todos los items de la escala se agrupan en un unico factor de bienestar que funcionaria como un modelo de linea base.

* Modelo de dos factores, que incluye los factores de bienestar subjetivo y psicologico defendidos por Keyes, Shmotkin y Ryff (2002).

* Modelo de cinco factores, que responde a la modificacion de la estructura original de seis factores de las escalas, con una unica modificacion, la union de los factores de autoaceptacion y dominio del ambiente en un unico factor, dada su elevada correlacion, segun los analisis realizados por van Dierendonck (2005) y Diaz et al. (2006).

* Modelo de seis factores. Los seis componentes originales del bienestar basados en la division teorica de la autora de la escala correlacionados entre si (Ryff, 1989).

Estos modelos se han puesto a prueba en las distintas versiones de la escala, cada una de ellas de longitudes diferentes. Los resultados de los modelos factoriales sin efecto de metodo (ver tabla 1) muestran, en primer lugar, que los indices de ajuste no son adecuados para ninguno de ellos y, en segundo lugar, que los ajustes de todos ellos son similares, si bien el de cinco factores y, especialmente, el de seis factores presentan un ligero mejor ajuste. Este patron de indices de ajuste ocurre en todas las versiones de la escala, tanto en las versiones de 54 items, como en la version corta de 18 items, y tambien en las modificaciones presentadas por otros autores de 29 y 39 items, que se basaban en la logica de eliminar los items con peor comportamiento psicometrico, pero siempre sin evaluar los efectos de metodo.

[FIGURA 1 OMITIR]

<01_TB001>

Dados los resultados de los modelos con diversas dimensiones de bienestar, y a la vista de la abundante literatura, se escogio el modelo de seis factores, el de mejor ajuste, para a partir de este anadir el factor adicional de metodo. Al observar los ajustes de los modelos hay que notar que el ajuste no es claramente satisfactorio para ninguno de ellos. Este resultado es general en todos los trabajos confirmatorios realizados con el escala y en todos los contextos culturales probados. Los indices de ajuste estan cercanos a aceptables, pero no son plenamente adecuados (Tomas, Melendez y Navarro, 2008). Como puede verse en la tabla 1, el anadir un factor de metodo al modelo de seis factores correlacionados ha mejorado de forma clara el modelo. Esta mejora del ajuste es especialmente aparente en el indice AIC, de comparacion de modelos, que se rebaja considerablemente, y ademas, es de caracter general a traves de versiones, incluyendo aquellas como las de 29 y 39 items. En todos los casos, las saturaciones factoriales asociadas al metodo fueron estadisticamente significativas (p < 0.05).

Visto que el factor de metodo mejora el ajuste, y que las saturaciones asociadas son estadisticamente significativas, cabe calcular la cuantia de este efecto de metodo. El analisis de las saturaciones de metodo ofrece un promedio de saturacion estandarizada de 0.31 ([S.sub.x] = 0.096), en absoluto despreciable. Es posible que el efecto de metodo este diferencialmente presente en las cuatro versiones de la escala. La figura 2 muestra las medias e intervalos de confianza para las saturaciones estandarizadas de metodo en las cuatro versiones de la escala de Ryff. Puede verse que las medias son muy similares y los intervalos solapados. Una prueba de Kruskall-Wallis para evaluar posibles diferencias no resulto significativa ([[ji al cuadrado].sub.9] = .478, p= 0.924).

Si los efectos de metodo son significativos, de cuantia no despreciable, y se encuentran por igual en las cuatro versiones de la escala y, dado que los items formulados en negativo estan en todos los factores, quiza las altas correlaciones entre los factores de rasgo queden disminuidas una vez se modela el factor de metodo. Para comprobarlo, se analizaron las correlaciones de los rasgos sin y con el factor de metodo. A la vista de la figura 3 resulta evidente que las altas correlaciones no desaparecen al modelar el efecto de metodo. De hecho una prueba de Mann-whitney no encontro diferencias significativas entre ambos tipos de correlaciones, con y sin factor de metodo (z = 0.427, p = 0.427).

Por ultimo, cabia preguntarse si el introducir los efectos de metodo afecta a la cuantia de las saturaciones de rasgo. El primer detalle es que las saturaciones factoriales siguen siendo estadisticamente significativas. Pero queremos saber mas, queremos saber si la relacion del item con el factor de rasgo disminuye al modelar el factor de metodo. Para comprobarlo se han analizado las diferencias entre las saturaciones estandarizadas de rasgo, sin modelar el factor de metodo, con esas mismas saturaciones al modelar el factor de metodo. Una prueba no parametrica de Mann-Whitney no mostro diferencias significativas (z = -1.17, p = .24). De hecho la media de las saturaciones cuando no se modela el factor de metodo es de 0.4, mientras que si se modela solamente baja a 0.38. La figura 4 muestra los intervalos de confianza de las medias en esas dos situaciones.

[FIGURA 2 OMITIR]

DISCUSION

Como se ha visto en la introduccion, los objetivos de este trabajo eran dos: estudiar la estructura factorial de la escala de Ryff en sus distintas versiones, y evaluar la presencia de efectos de metodo asociados a los items formulados en negativo. Creemos que nuestro trabajo es de interes, porque auna en un solo trabajo evidencia que se encontraba relativamente dispersa en la literatura, y porque hace esto por primera vez en nuestro contexto cultural y en una muestra de poblacion especial, geriatrica, que no procede de la poblacion general.

[FIGURA 3 OMITIR]

En cuanto al primer objetivo, se ha estudiado la estructura factorial de la escala de Ryff, de forma sistematica, a traves de versiones, por primera vez en muestra espanola con poblacion geriatrica. Se han analizado las versiones empleadas mas habitualmente de la escala, las de 54 y 18 items planteadas por la autora, y las versiones depuradas de estas por razones psicometricas realizadas por otros autores (29 y 39 items). En el contexto espanol, se tiene evidencia empirica de la estructura factorial de esta escala en poblacion general (Diaz et al., 2006), y ademas en poblacion geriatrica (Tomas et al., 2008; Triado et al., 2007). Esta evidencia apuntaba en la misma direccion de los resultados de este trabajo. Cuando se plantean modelos solamente de rasgo, sustantivos, el ajuste confirmatorio es inadecuado. Esto, como hemos visto ocurre tambien en los trabajos con muestras anglosajonas (Abbott et al., 2006; Keyes et al., 2002; Ryff y Keyes 1995; Ryff y Singer, 2006; Springer et al., 2006; Van Dierendonck, 2005). Por tanto la evidencia es que las escalas originales no tienen una estructura factorial que pueda defenderse, y son necesarias reducciones, a veces drasticas. En nuestro contexto solamente tras reducir de 54 a 29 items, Diaz et al. (2006) encuentran un ajuste razonable. No obstante, hay que considerar que siguen teniendo una muy baja validez discriminante en los factores, y que no ha habido estudios de validacion cruzada, y el ajuste puede deberse a la capitalizacion del azar.

[FIGURA 4 OMITIR]

Adicionalmente, algunos de estos trabajos (Diaz et al., 2006; Van Dierendonck, 2005) ya ponian sobre la pista, aunque indirectamente, de que podian existir efectos de metodo asociados a los items negativos, pues al probar un modelo de dos factores correlacionados asociados a los items positivos y a los negativos obtenian ajustes muy similares a los de los modelos sustantivos de cinco y seis factores. No obstante, esta evidentemente no es la mejor forma de obtener evidencia sobre efectos de metodo, sino modelarlo explicitamente, lo que solamente se ha realizado en el trabajo de Springer y Hauser (2006), y en muestra de poblacion general estadounidense. Las conclusiones de este trabajo coinciden plenamente con las del nuestro, pues la mejora en terminos de ajuste al introducir el factor de metodo asociado a los items negativos es muy clara y sistematica, en todas las versiones. A nivel incluso mas especifico, los resultados son tambien plenamente coincidentes, pues las cuantias de los efectos de metodo resultan muy similares, y el efecto de modelar un factor de metodo es tambien similar, pues las saturaciones y correlaciones de rasgo permanecen practicamente iguales, de forma que la varianza explicada por el metodo se anade a la explicada por el rasgo en los items. En resumen, que a pesar del salto de poblacion estadounidense a espanola y de personas de todas las edades a mayores de 65, los resultados son coherentes con la evidencia de la literatura.

El trabajo presentado, evidentemente, no supone un punto final a la investigacion, y algunas lineas de investigacion futura pueden claramente atisbarse. Especialmente tres: a) todavia queda por dar respuesta a la estructura de rasgo mas adecuada para la escala y la repercusion del efecto de metodo en la estimacion de los niveles de esos rasgos; b) resultaria interesante evaluar que posibles variables explican la mayor o menor presencia de efectos de metodo asociado a los items negativos (nivel educativo, deseabilidad social, dificultades lectoras, ...); y c) es necesario avanzar en el efecto que puede tener modelar o no este efecto de metodo cuando se relacionan los factores de rasgo de la escala con otras variables de interes en investigaciones empiricas.

(Manuscrito recibido: 21 Julio 2009; aceptado: 16 Octubre 2009)

REFERENCIAS

Abbott, R. A., Ploubidis, G. B., Huppert, F. A., Kuh, D., Wadsworth, M. E. J. y Croudace, T. J. (2006). Psychometric evaluation and predictive validity of Ryff's psychological well-being items in a UK birth cohort sample of women. Health and Quality of Life Outcomes, 4, 76.

Bass, B. M. (1955). Authoritarianism or Acquiescence? Journal of Abnormal and Social Psychology, 51, 616-623.

Bentler, P. M. (1995). EQSprogram manual. Encino, CA: Multivariate Software, Inc.

Bollen, K. A. (1989). Structural equation modelling with latent variables. New York: Wiley.

Campbell, D. T. y Fiske, D. W. (1959). Convergent and discriminant validation by the multitrait-multimethod matrix. Psychological Bulletin, 56, 81-105.

Carmines, E. G. y Zeller, R. A. (1979). Reliability and validity assessment. Beverly Hills, CA: Sage.

Conway, J. M. (2002). Method variance and method bias in Industrial and Organizational Psychology. En S. G. Rogelberg (Ed.), Handbook of research methods in industrial and organizational psychology (pp. 344-365). Malden, MS: Blackwell Publishers Inc.

Cordery, J. L. y Sevastos, P. P. (1993). Responses to the regional and revised Job Diagnostic Survey. Journal of Applied Psychology, 78, 141-143.

Cote, J. A. y Buckley, M. R. (1988). Measurement error and theory testing in consumer behavior research: An illustration of the importance of construct validation. Journal of Consumer Research, 14, 579-582.

Di Stefano, C. y Motl, R. W. (2006). Further investigating method effects associated with negatively worded items on self-report surveys. Structural Equation Modeling, 13, 440-464.

Di Stefano, C. y Motl, R. W. (2008). Personality correlates of method effects due to negatively worded items on the Rosenberg Self-Esteem scale. Personality and Individual Differences, 46, 309-313.

Diaz, D., Rodriguez-Carvajal, R., Blanco, A., Moreno-Jimenez, B., Gallardo, I., Valle, C. y van Dierendonck, D. (2006). Adaptacion espanola de las escalas de bienestar psicologico de Ryff. Psicothema, 18, 572-577.

Finney, S. J. y DiStefano, C. (2006). Non-normal and categorical data in SEM. En G. R. Hancock y R. O. Mueller (Eds.), Structural Equation Modeling: A second course. Greenwich, CO: Information Age Publishing.

Harvey R., Billings R. y Nilan K. (1985). Confirmatory factor analysis of the Job Diagnostic Survey: Good news and bad news. Journal of Applied Psychology, 70, 461-468.

Horan, P. M., Di Stefano, C. y Motl, R. W. (2003). Wording effects in self esteem scales: Methodological artifact or response style? Structural Equation Modeling, 10, 435-455.

Hoyle, R. H. y Panter, A. T. (1995). Writing about structural equation models. En R. H. Hoyle (Ed.), Structural equation modeling: Concepts, issues and applications (pp. 159-176). Thousand Oaks, CA: Sage.

Hu, L. y Bentler, P. M. (1995). Evaluating model fit. En R. H. Hoyle (Ed.), Structural equation modeling: Concepts, issues and applications (pp. 76-99). Thousand Oaks, CA: Sage.

Hu, L. y Bentler, P. M. (1999). Cutoff criteria for fit indexes in covariance structure analysis: Conventional criteria versus new alternatives. Structural Equation Modeling, 6, 1-55.

Idaszak, J. R. y Drasgow, F. (1987). A revision of the Job Diagnostic Survey: Elimination of a measurement artifact. Journal of Applied Psychology, 72, 69-74.

Jackson, D. N. y Messick, S. J. (1957). A note on ethnocentrism and acquiescent response sets. Journal of Abnormal and Social Psychology, 54, 132-134

Kaplan, D. (2000). Structural equation modeling: Foundations and extensions. Thousand Oaks, CA: Sage.

Keyes, C., Shmotkin, D. y Ryff, C. D. (2002). Optimizing well-being: The empirical encounter of two traditions. Journal of Personality and Social Psychology, 82, 1007-1022.

Kulik, C. T., Oldham, G. R. y Langner, P. H. (1988). The measurement of job characteristics: A comparison of the original and the revised Job Diagnostic Survey. Journal of Applied Psychology, 73, 426-466.

Ladd, R. T., Gordon, M. E, Beauvais, L. L. y Morgan, R. L. (1982). Union Commitment: Replication and extension, Journal of Applied Psychology, 67. 640-644.

Leavitt, H. J., Hax, H. y Roche, J. H. (1955). Authoritarianism and agreement with things authoritative. Journal of Psychology, 40, 215-221.

Magazine, S. L., Williams, L. J. y Williams, M. L. (1996). A confirmatory factor analysis examination of reverse coding effects in Meyer and Allen's Affective and Continuance Commitment Scales. Educational and Psychological Measurement, 56, 241-250.

Mahoney, F. I. y Barthel, D. W. (1965). Functional evaluation: The Barthel Index. Maryland State Medical Journal, 14, 61-65.

Mehrabian, A. y Ljunggren, E. (1997). Dimensionality and content of optimism-pessimism analyzed in terms of the PAD Temperament Model. Personality and Individual Differences, 23, 729-737.

Marsh, H. W. (1996). Positive and negative self-esteem: A substantively meaningful distinction or artifactors? Journal of Personality and Social Psychology, 70, 810-819.

Marsh, H. W., Balla, J. R. y Hau, K. T. (1996). An evaluation of incremental fit indices: A clarification of mathematical and empirical properties. En G. A. Marcoulides y R. E. Schumacker (Eds.), Advanced structural equation modeling: Issues and techniques (pp. 315-353). Mahwah, NJ: Erlbaum.

Messick, S. y Jackson, D. (1957). Authoritarianism or acquiescence in Bass' data. Journal of Abnormal and Social Psychology, 54, 424-426.

Motl, R. W. y Di Stefano, C. (2002). Longitudinal invariance of self-esteem and methods effects associated with negatively worded items. Structural Equation Modeling, 9, 562-578.

Navarro, E., Melendez, J. C. y Tomas, J. M. (2008). Analisis del bienestar en la vejez segun la edad. Revista Espanola de Geriatria y Gerontologia, 43, 90-95.

Neugarten, B. L., Havighurst, R. J. y Tobin, S. S. (1961). The measurement of life satisfaction. Journal of Gerontology, 16, 134-143.

Nunnally, J. C. (1978). Psychometric theory. New York: McGraw-Hill.

Quilty, L. C., Oakman, J. M. y Risko, E. (2006). Correlates of the Rosenberg Self-Esteem scale method effects. Structural Equation Modeling, 13, 99-117.

Ryff, C. D. (1989). Happiness is everything: or is it? Explorations on the meaning of psychological well-being. Journal of Personality and Social Psychology, 57, 1069-1081.

Ryff, C. D. y Keyes, C. (1995). The structure of psychological well-being revisited. Journal of Personality and Social Psychology, 69, 719-727.

Ryff, C. D. y Singer, B. H. (2006). Best news yet on the six-factor model of well-being. Social Science Research, 35, 1103-1119.

Ryff, C. D., Lee, Y. H., Essex, M. J., y Schmutte, P. S. (1994). My children and me: Midlife evaluations of grown children and of self. Psychology and Aging, 9, 195-205.

Scheirer, M. F., Carver, C. S. y Bridges M. W. (1994). Distinguishing optimism from neuroticism (and trait anxiety, self-mastery and self-esteem): A reevaluation of the Life Orientation Test. Journal of Personality and Social Psychology, 67, 1063-1078.

Schriesheim, C. A. y Eisenbach, R. J. (1995). An exploratory and confirmatory factor-analytic investigation of item wording effects on the obtained factor structures of survey questionnaire measures. Journal of Management, 21, 1177-1193.

Springer, K. W., Hauser, R. M. y Freese, J. (2006). Bad news indeed for Ryff's six-factor model of well-being. Social Science Research, 35, 1119-1130.

Springer, K. W. y Hauser, R. M. (2006). An assessment of the construct validity of Ryff's scales of psychological well-being: Method, mode, and measurement effects. Social Science Research, 35, 1080-1102.

Tomas, J. M. y Oliver, A. (1999). Rosenberg's self-esteem scale: Two factors or method effects. Structural Equation Modeling, 6, 84-98.

Tomas, J. M., Hontangas, P. M. y Oliver, A. (2000). Linear confirmatory factor models to evaluate multitrait-multimethod matrices: The effects of number of indicators and correlation among methods. Multivariate Behavioral Research, 35, 469-500.

Tomas, J. M., Melendez, J. C. y Navarro, E. (2008). Modelos factoriales confirmatorios de las escalas de Ryff en una muestra de personas mayores. Psicothema, 20, 298-304.

Triado, C. (2003). Envejecer en entornos rurales. Madrid: IMSERSO, Estudios I+D+I, no 19.

Triado, C., Villar, F., Sole, C. y Celdran, M. (2007). Construct validity of Ryff's scale of psychological well-being in Spanish older adults. Psychological Reports, 100, 1151-1164.

Van Dierendonck, D. (2005). The construct validity of Ryff's scale of psychological well-being and its extension with spiritual well-being. Personality and Individual Differences, 36, 629-644.

Vautier, S., Raufaste, E. y Cariou, M (2003). Dimensionality of the Revised Life Orientation Test and the status of filler items. International Journal of Psychology, 38, 390-400.

Wang, J., Siegal, H. A., Falck, R. S. y Carlson, R. G. (2001). Factorial structure of Rosenberg's self-esteem scale among crack-cocaine drug users. Structural Equation Modeling, 8, 275-286.

Williams, L. J., Ford, L. R. y Nguyen, N. (2002). Basic and advanced measurement models for confirmatory factor analysis. En S. Rogelberg (Ed.), Research Methods in Industrial and Organizational Psychology (pp. 366-389). Oxford: Blackwell Publishers.

Jose Manuel Tomas *, Juan Carlos Melendez, Amparo Oliver, Esperanza Navarro y Gustavo Zaragoza

Universitat de Valencia, Spain

* Correspondencia: Jose Manuel Tomas Miguel, Departamento de Metodologia de las Ciencias del Comportamiento, Facultad de Psicologia, Universitat de Valencia, Av. Blasco Ibanez, 21, 46010, Valencia (Spain), E-mail: tomasjm@uv.es
Tabla 1. Ajuste global de los modelos confirmatorios para las distintas
versiones de las escalas de bienestar de Ryff.

                         [ji al
Version    Modelo      [cuadrado]     d.f.     AIC      GFI    SRMR

18 items   1 factor      414.65       135     144.65   0.910   0.064
           2f            399.14       134     131.14   0.913   0.063
           5f             36.81       125      11.81   0.920   0.061
           6f            312.48       120      72.47   0.931   0.057
           6f 1 met      226.13       112       2.13   0.952   0.046

29 items   1f            1075.7       377     321.79   0.849   0.065
           2f            1067.5       376     315.50   0.851   0.065
           5f            964.94       367      23.93   0.864   0.063
           6f            924.89       361     202.89   0.867   0.062
           6f 1 met      799.64       406      95.64   0.892   0.055

39 items   1f            2139.4       702     735.49   0.775   0.074
           2f            2117.0       701     715.01   0.779   0.074
           5f            1948.5       692     564.51   0.801   0.073
           6f            1928.8       687     554.84   0.806   0.073
           6f 1 met      1584.3       670     244.26   0.845   0.062

54 items   1f            3847.2      1377     1093.2   0.711   0.075
           2f            3827.0      1376     1075.0   0.714   0.076
           5f            3665.2      1367     931.26   0.722   0.075
           6f            3637.1      1362     913.10   0.724   0.075
           6f 1 met      2789.3      1334     121.27   0.811   0.059

Version    Modelo      CFI    RMSEA

18 items   1 factor   0.684   0.061
           2f         0.700   0.059
           5f         0.733   0.058
           6f         0.782   0.053
           6f 1 met   0.871   0.043

29 items   1f         0.727   0.057
           2f         0.730   0.057
           5f         0.767   0.054
           6f         0.780   0.053
           6f 1 met   0.825   0.048

39 items   1f         0.621   0.060
           2f         0.627   0.060
           5f         0.669   0.057
           6f         0.673   0.057
           6f 1 met   0.759   0.049

54 items   1f         0.516   0.057
           2f         0.519   0.057
           5f         0.549   0.055
           6f         0.554   0.055
           6f 1 met   0.715   0.044
COPYRIGHT 2010 Universidad de Valencia
No portion of this article can be reproduced without the express written permission from the copyright holder.
Copyright 2010 Gale, Cengage Learning. All rights reserved.

Article Details
Printer friendly Cite/link Email Feedback
Author:Tomas, Jose Manuel; Melendez, Juan Carlos; Oliver, Amparo; Navarro, Esperanza; Zaragoza, Gustavo
Publication:Psicologica
Date:Jul 1, 2010
Words:6537
Previous Article:Bayesian item selection in constrained adaptive testing using shadow tests.
Next Article:A new nonparametric Levene test for equal variances.

Terms of use | Privacy policy | Copyright © 2021 Farlex, Inc. | Feedback | For webmasters |