Printer Friendly

Analysis of the gender variable in the sensation seeking scales (SSS-V) using differential item functioning techniques/Analisis de la variable sexo en la escala de busqueda de sensaciones (SSS-V) empleando tecnicas de funcionamiento diferencial de los items/Analise da variauel sexo na escala de busca de sensacoes (SSS-V) empregando tecnicas de funcionamento diferencial dos itens.

La literatura cientifica es rica en estudios dirigidos a investigar las diferencias de sexo en los rasgos de personalidad (Colom & Jayme-Zaro, 2004; Feingold, 1994; Jorm, 1987). Una de las dimensiones de personalidad considerada mas frecuentemente es la busqueda de sensaciones, constructo desarrollado por Marvin Zuckerman y otros autores (Zuckerman, 1979, 1984, 1990; Zuckerman, Eysenck & Eysenck, 1978) y que ha merecido una considerable atencion desde su desarrollo original (Chico, 2000). Zuckerman (1994) define la Busqueda de Sensaciones como: "un rasgo definido por la busqueda de sensaciones y emociones variadas, nuevas, complejas e intensas, y la disposicion a asumir riesgos fisicos, sociales, legales y financieros con el fin de obtener tales experiencias y sensaciones" (p. 27).

En la actualidad, la explicacion de la dimension de busqueda de sensaciones se basa en un modelo influenciado por factores geneticos, bioquimicos, psicofisiologicos y sociales que influyen en ciertos comportamientos, en concreto, varios tipos de conductas de riesgo (Roberti, 2004; Roth & Hammelstein, 2003; Zuckerman, 1994, 2005). De hecho, este rasgo de personalidad se ha asociado sistematicamente con deportes de riesgo, profesiones peligrosas, consumo de drogas, conducta sexual arriesgada o preferencias esteticas (Aluja, 1991; Chico, 2000; Goma, 1995; Trimpop, Kerr & Kirkcaldy, 1999).

El instrumento mas frecuentemente empleado para evaluar la busqueda de sensaciones es el Seeking Sensation Scale-Form V (SSS-V), desarrollado originalmente por Zuckerman, Eysenck y Eysenck (1978), un cuestionario de autoinforme compuesto por cuatro subescalas, cada una de ellas medida a partir de 10 items dicotomicos: la busqueda de emociones y aventuras (tas), la busqueda de experiencia (es), la desinhibicion (des) y la susceptibilidad al aburrimiento (bs). Las cuatro escalas contribuyen al computo de una puntuacion total de busqueda de sensaciones (sss).

Hasta el momento, tres importantes estudios han examinado las diferencias de sexo en busqueda de sensaciones, empleando muestras con un amplio rango de edad. Los primeros datos globales en ss provienen de una muestra inglesa analizada por Zuckerman et al. (1978). Estos autores encontraron que la puntuacion total en la escala descendia gradualmente desde el grupo de edad mas joven (16-19 anos) hasta el grupo de mas edad (mayores de 60 anos), en ambos sexos. Ademas, las diferencias de sexo fueron estadisticamente significativas para todos los niveles de edad, siendo los hombres quienes puntuaban sistematicamente mas alto que las mujeres. Estos resultados iniciales fueron parcialmente apoyados por Ball, Farnnill, y Wangeman (1984), al emplear una muestra australiana con edades comprendidas entre los 17 y los 70 anos. En la escala total, Ball et al. (1984) tambien encontraron un descenso de la puntuacion, segun se incrementa la edad para ambos sexos. Sin embargo, encontraron un efecto significativo de la interaccion sexo y edad, con una disminucion mas pronunciada de la busqueda de sensaciones en los hombres de 30-39 anos, lo que dio como resultado una media ligeramente superior para las mujeres en ese mismo grupo de edad. Ball et al. (1984) especularon que las diferencias en sss son generacionales y no relacionadas con la edad, porque las mujeres de 30-39 anos "fueron criadas en condiciones de posguerra y en tiempos de dificultades economicas" (p. 264). Finalmente, los resultados de un estudio con muestra alemana realizado por Beauducel, Strobel y Brocke (2003) parece apuntar en una direccion similar. Este estudio replico ampliamente el patron de resultados encontrados originariamente por Zuckerman et al. (1978), con la unica excepcion de la subescala es, los hombres puntuaron significativamente por encima de las mujeres en las otras tres subescalas y en el conjunto de la escala.

Empleando muestras espanolas, hay que destacar el estudio de Chico (2000), si bien con un rango de edad sensiblemente menor al de los estudios anteriores, siendo su grupo de mayor edad el comprendido entre los 30 y los 39 anos. Este estudio reproduce, en gran medida, los resultados anteriores. Se encontraron diferencias significativas a favor de los varones en tres de las cuatro subescalas (tas, des y bs) y en la puntuacion total (sss). Tanto los hombres como las mujeres presentaron con la edad un progresivo descenso de sus puntuaciones en sss.

Todos los estudios anteriores utilizaron la escala SSS-V para medir la busqueda de sensaciones, que puede ser considerada como una medida estandar de este rasgo (Ferrando & Chico, 2001).

Las principales propiedades psicometricas de la SSS-V se pueden encontrar en los cientos de estudios realizados en los ultimos anos (una sintesis de la evidencia disponible al respecto puede consultarse en Gray & Wilson, 2007 y Zuckerman, 1979, 1994, 2007a, 2007b). La validez convergente y discriminante ha sido puesta a prueba en decenas de estudios donde los resultados mostraron el grado de relacion con distintos criterios (Zuckerman 2007a). La estructura factorial de la prueba SSS-V se ha replicado en muchos estudios, incluso en los que se realizan en las versiones adaptadas y traducidas a otras lenguas y culturas (Zuckerman, 2005, 2007a, 2007b). En suma, la evidencia empirica disponible parece indicar que la SSS-V es una prueba con unas propiedades psicometricas lo suficientemente buenas como para haberse convertido en una medida ampliamente utilizada en el ambito de la personalidad.

En cuanto a los usos que se le han dado a SSS-V, cabe destacar uno en el ambito de la seleccion de personal, pues aunque el cociente intelectual es considerado habitualmente como el mejor predictor del rendimiento futuro de los individuos en numerosos contextos socialmente relevantes (Jensen, 1998), en los ultimos anos se ha incrementado el uso de instrumentos estandarizados para evaluar dimensiones de personalidad (Corr & Mathews, 2009). Asi, por ejemplo, en algunos contextos de seleccion de personal--como la seleccion de controladores de trafico aereo (CTA)--se utilizan puntuaciones elevadas en la dimension de busqueda de sensaciones como criterio para rechazar individuos (Arend, Botella, Contreras, Hernandez & Santacreu, 2003; Delgado, 1995).

Dado que los tests son frecuentemente utilizados para tomar decisiones importantes en la vida de las personas, resulta esencial determinar si las diferencias observadas entre hombres y mujeres en las puntuaciones de los test son el resultado de una diferencia real en personalidad, es decir, si son el reflejo de una diversidad que existe realmente; o si, por el contrario, estas diferencias son un mero artefacto producido por los propios items que componen el test, diferencias que pueden llevar a la discriminacion cuando hombres y mujeres intentan acceder al mercado laboral o en algun contexto educativo. Los analisis del (dif) pueden ayudar a examinar esta cuestion.

Los metodos estadisticos del (dif) constituyen una herramienta muy valiosa para examinar a fondo las diferencias en la actuacion en un test o escala de sujetos pertenecientes a distintos grupos. El estudio del dif permite distinguir entre diferencias reales (impacto) y espureas (dif) en la actuacion de distintos grupos de sujetos.

Un item presenta impacto cuando la probabilidad de elegir una determinada alternativa de respuesta difiere de un grupo a otro y estas diferencias reflejan diferencias reales entre los grupos en la o las variable/s medida/s por el test (Abad, Olea, Ponsoda & Garcia, 2011; Ackerman, 1992; Fidalgo, 1996). Un item presenta dif cuando, para sujetos con identico nivel en la caracteristica medida con el test, la probabilidad de un sujeto de elegir una opcion de respuesta depende del grupo al que este pertenezca. Esto es, en un item con dif la probabilidad de un sujeto de elegir una determinada alternativa depende de su nivel en la caracteristica evaluada y de su grupo de adscripcion. Habitualmente, se denomina grupo focal al grupo de interes, al grupo minoritario o socialmente desfavorecido, y grupo de referencia al grupo con el que se va a comparar el de interes, normalmente, el grupo mayoritario. Cuando la probabilidad de elegir una opcion de respuesta, para personas con el mismo nivel estimado en el rasgo, es sistematicamente mayor en un grupo que en otro durante el continuo del rasgo, se habla de dif uniforme; en caso contrario, de dif no uniforme.

La mayoria de los estudios llevados a cabo en el area de la personalidad y dirigidos a analizar las diferencias de sexo se han limitado a la evaluacion del impacto. Los estudios sobre la posible existencia de dif en instrumentos comunmente empleados para la evaluacion de la personalidad son relativamente recientes y escasos (Borsboom, Mellenbergh & Van Heerden, 2002; Collins, Raju & Edwards, 2000; Ellis & Mead, 2000; Escorial & Navas, 2006, 2007; Gelin & Zumbo, 2003; Lange, Irwin, & Houran, 2000; Leo, Van Dam, Hobkirk & Earleywine, 2011; Reise, Smith, & Furr, 2001; Smith, 2002).

El objetivo principal de esta investigacion es analizar las diferencias de sexo en la dimension de busqueda de sensaciones empleando tecnicas de dif. Para ello, en primer lugar, se procedera a analizar las diferencias de sexo en las puntuaciones observadas, seguidamente se analizara el posible dif de los items de la prueba SSS-V con distintas tecnicas de deteccion. Finalmente, se evaluara el impacto, es decir, se analizara la posible existencia de diferencias reales en el constructo analizado. Pese a ser una medida muy utilizada por los investigadores del ambito de la personalidad, nunca antes se ha analizado el dif en este instrumento. Lo que se persigue, basicamente, es encontrar evidencia empirica para determinar si las diferencias observadas entre varones y mujeres son diferencias genuinas en el rasgo latente que subyace a la medida o bien estan producidas artificialmente por un sesgo en los items que componen la prueba.

Metodo

Participantes

La muestra estaba formada por 1191 participantes pertenecientes a la comunidad de Madrid. Para la seleccion de los participantes se utilizo un procedimiento incidental con sistema de cuotas para el sexo y la edad. Los datos fueron recogidos por 75 evaluadores, todos ellos licenciados universitarios convenientemente entrenados, quienes administraron el test a un hombre y una mujer en cada uno de los siguientes subgrupos de edad: <20, 20-29, 30-39, 40-49, 50-59 y >60. La media de edad para la muestra total fue 34,24 (DT = 17,27, rango 14-88). Dentro del grupo de hombres la media de edad fue 35,61 (DT = 17,54, rango 1485) y para las mujeres fue de 32,94 (DT = 16,91, rango 16-88).

Los grupos elegidos coinciden con los utilizados en otros estudios sobre el SSS-V (Ball et al., 1984; Chico, 2000; Zuckerman et al., 1978; Zuckerman & Neeb, 1980). El trabajo de campo tuvo una duracion de tres semanas y la tasa de no-respuesta (personas que rehusaron participar) fue del 12 %. La distribucion por sexo en la muestra final fue del 48,9 % para los hombres y del 51,1 % para las mujeres, con un porcentaje similar para cada uno de los seis grupos de edad.

Instrumentos

Se utilizo la version espanola del SSS-V (Perez & Torrubia, 1986), un test compuesto por cuatro subescalas de 10 items con un formato de respuesta dicotomico. La busqueda de emociones y aventuras (TAS) es una subescala que refleja el deseo de participar en la busqueda de emociones y actividades recreativas, arriesgadas y aventureras. La busqueda de experiencia (ES) es una subescala que representa la necesidad de buscar nuevas experiencias por medio de, por ejemplo, viajes, drogas, musica, arte o un estilo de vida poco convencional. La desinhibicion (DES) es una subescala que refleja un deseo de liberacion social por medio de la bebida, las fiestas o una variedad de experiencias sexuales; mientras que los items de la subescala susceptibilidad al aburrimiento (BS) estan apresando la aversion de los sujetos por las experiencias repetitivas.

La tabla 1 muestra los valores obtenidos en este estudio para el coeficiente Alfa de Cronbach para el indice global de busqueda de sensaciones (SSS) y para las cuatro subescalas, divididos en funcion del sexo, junto con los intervalos de confianza al 95 % para los coeficientes, usando una aproximacion mediante la distribucion central F (Fan & Thompson, 2001).

Las estimaciones obtenidas son similares para hombres y mujeres, y exceden, para el test global, el punto de corte de 0,8 generalmente aceptado en el ambito de investigacion. De hecho, la fiabilidad global para la escala sss-v fue de 0,855, un valor superior al encontrado en otros estudios (vease Deditius-Island & Caruso, 2002). Respecto de las subescalas, tas muestra el valor mas alto (0,86), seguido por des (0,75), ambos por encima del valor promedio de otros estudios, mientras que es y bs mostraron valores inferiores (0,51 y 0,52) a los que se encontraron en estudios similares (Deditius-Island & Caruso, 2002). En cualquier caso, la fiabilidad global es aceptable, maxime cuando el proposito del analisis del dif llevara un enfoque en el test global.

Analisis

En primer lugar, se examinaron las diferencias de sexo en las puntuaciones observadas. Para las respuestas a los items, se empleo el estadistico [chi square]. Para la escala global, una prueba estadistica de diferencia de medias para dos muestras independientes. Estas pruebas de significacion estadisticas fueron acompanadas con la correspondiente medida del tamano del efecto (d de Cohen).

En segundo lugar, se aplicaron una serie de tecnicas para detectar la presencia de dif en los items del sss-v. Las tecnicas utilizadas fueron la regresion logistica, la prueba [chi square] de Lord, el modelo dfit y el procedimiento sibtest. Dado que la prueba [chi square] de Lord y los estadisticos basados en el modelo dfit operan dentro del marco de la teoria de respuesta al item (IRT), es imprescindible verificar que los datos obtenidos tienen un ajuste razonable a algun modelo de IRT. Con este proposito, se utilizo la aproximacion propuesta por Hambleton y Swaminathan (1985). La estimacion de parametros se realizo con el programa MULTILOG (Thissen, 1991).

Regresion logistica. Cuando la regresion logistica es utilizada para estudiar el DIF (Swaminathan & Rogers, 1990), el objetivo es determinar si es suficiente introducir el nivel en el rasgo de los participantes en la funcion matematica para predecir la respuesta a un item (modelo sin DIF) o si, por el contrario, es necesario incluir un termino que se refiera al grupo de pertenencia de los participantes (modelo de dif uniforme) o un termino que se refiera a la interaccion entre el grupo de pertenencia de los participantes y su nivel de rasgo (modelo de dif no uniforme).

Zumbo y Thomas (1997) proponen combinar la significacion estadistica con una medida del tamano del efecto para concluir si un item presenta o no dif, utilizando una estrategia de comparacion de modelos. Se considera que existe algun efecto cuando el incremento en el coeficiente de pseudodeterminacion (en el presente estudio se ha utilizado el de Nagelkerke) en los modelos comparados es de al menos 0,035, de modo que valores entre 0,035 y 0,070 denotarian un dif moderado y por encima de 0,070 un dif severo (Jodoin & Gierl, 2001).

Estadistico [chi square] de Lord. Este estadistico esta basado en la irt y contrasta la hipotesis nula de que los parametros que definen la curva caracteristica del item son iguales en el grupo focal y de referencia o, lo que es lo mismo, que el item no presenta DIF (Lord, 1980). Su valor ha sido determinado con el programa LINKDIF (Waller, 1998).

Modelo DFIT. Fue propuesto por Raju, van der Linden y Fleer (1995) dentro del marco de la irt. El modelo DFIT permite estudiar no solo el dif, sino tambien el funcionamiento diferencial del test completo. En concreto, este modelo ofrece un estadistico para el funcionamiento diferencial del test (DTF) y dos estadisticos de dif: un indice compensatorio (CDIF) y otro no compensatorio (NCDIF). Se dispone de tests de significacion estadistica para los indices DTF y NCDIF, pero no existen para el indice CDIF. En este caso, si el indice global no fuera estadisticamente significativo, se asumira que ninguno de los valores de CDIF lo es. Pero si el indice DTF resulta estadisticamente significativo, se eliminara el item con un valor absoluto para el CDIF mas elevado, repitiendo este proceso item por item hasta que el indice DTF deje de ser significativo. Al alcanzar este punto, se considera que los items eliminados podrian presentar problemas de DIF.

Es tambien esencial tener en cuenta la significacion practica a la hora de interpretar los estadisticos DFIT, con independencia de que se disponga o no de una prueba de significacion estadistica. Se considerara que un item muestra DIF cuando los anteriores procedimientos iterativos lo identifiquen como tal (en el caso de CDIF), o cuando asi se concluya por medio de las pruebas de significacion (en el caso del NCDIF), pero solo cuando los valores obtenidos para los estadisticos (CDIF o NCDIF) superen cierto valor de corte. Los valores criticos fueron obtenidos mediante un estudio de simulacion, siendo de 0,0276 para el CDIF y 0,0131 para el NCDIF. Para este procedimiento se empleo el programa LINKDIF.

SIBTEST. Este procedimiento detecta el funcionamiento diferencial de los items individualmente y de un conjunto de items simultaneamente (Shealy & Stout, 1993). Asi, se comparan los promedios para los grupos focal y de referencia en un subtest compuesto por un conjunto de items sospechosos de mostrar DIF, lo que empareja a los participantes conforme a la puntuacion obtenida en otro subtest compuesto por el resto de los items que, se considera, no presentan DIF (subtest valido). Para decidir que items compondrian los subtest validos y bajo sospecha se utilizo la informacion obtenida mediante los procedimientos de deteccion de dif descritos previamente. Los analisis se realizaron con el programa Dimensionality-Based DIF/DBF Package (Stout & Roussos, 1999).

Finalmente, una vez eliminados los items con dif de la prueba, se procedio a determinar si existen o no diferencias entre hombres y mujeres en la escala de busqueda de sensaciones. Para ello, se utilizo una prueba de diferencia de medias para dos muestras independientes (acompanada con la medida del tamano del efecto).

Resultados

Antes de realizar los analisis de dif, se analizo la dimensionalidad del test. Este es un requisito necesario para los metodos de deteccion del dif basados en la irt (Borsboom, Mellenbergh & Van Heerden, 2002; Stout & Roussos, 1999; Clauser & Mazor, 1998; Holland & Wainer 1993). En este caso, esto implicaba poner a prueba la estructura unidimensional del instrumento sss-v, tal y como sugieren otros autores (Aluja, Garcia & Garcia, 2004). Para ello, se realizo un analisis factorial no lineal con el programa NOHARM (Fraser & McDonald, 1988).

La evaluacion de la dimensionalidad en NOHARM se basa en la inspeccion visual de las covarianzas residuales tras la extraccion del numero prescrito de factores y, como indice, suele utilizarse la raiz cuadratica media residual (RMSR). Tal como sugieren McDonald y Mok (1995), para este estudio se ha utilizado tambien la version para minimos cuadrados del indice normado gamma (g) de bondad de ajuste propuesto por Tanaka y Huba (1985). Los resultados obtenidos para el modelo de un factor formado por todos los items del sss-v (40 items) fueron los siguientes: la rmsr fue de 0,130 y g de 0,860. La inspeccion visual de las cargas factoriales de los items permitio identificar 12 items con pesos factoriales inferiores a 0,25 todos ellos (items 4, 8, 12, 16, 20, 28, 32, 36, 40, 18, 34 y 38). Por esta razon, se procedio a eliminar estos items y volver a estimar el ajuste a un modelo de una dimension de los restantes 28 items del sss-v. Los resultados del ajuste obtenido para este modelo fueron 0,014, la rmsr y 0,960 el indice g. Asi pues, se produce una mejora razonable en la estructura unidimensional de la prueba al pasar de 40 a 28 items.

Los autores entienden que resulta mas apropiado trabajar con esta definicion unidimensional de la escala que, aun prescindiendo de un porcentaje importante de sus items, opera todavia con mas de 20 items por escala, lo que proporciona, de esta forma, un numero de items adecuado para obtener una estimacion razonablemente precisa de la caracteristica medida por la prueba, algo muy importante para poder igualar posteriormente de forma efectiva a los sujetos de los grupos focal y de referencia y estudiar, en esos grupos igualados, la probabilidad de responder en una determinada direccion cada uno de los items. Todos los analisis que se realizaron a partir de este punto se condujeron para la version unidimensional de la prueba, es decir, para la version de 28 items del sss-v.

Por otra parte, para valorar el ajuste de los datos a un modelo tri se calculo el estadistico de razon de verosimilitudes G2, que se distribuye como una [c.sup.2.sub.N-h-1], donde N es el numero de sujetos de la muestra y h el numero de parametros a estimar. Se estimaron los parametros de los items de tres modelos itr: los modelo logisticos de 1, 2 y 3 parametros, respectivamente. Para determinar a que modelo en particular se ajustaban mejor los datos, se procedio a hallar la diferencia entre los valores obtenidos para [G.sup.2], en cada par de posibles modelos, ya que se trata siempre de modelos anidados (Andersen, 1973). Un valor significativo de la diferencia en [G.sup.2] indica que el modelo mas complejo se ajusta mejor a los datos, mientras que, si dicho valor no es significativo, entonces el parametro(s) extra del modelo mas complejo no contribuye significativamente a explicar los datos y se escogera, por tanto, el modelo mas simple. La tabla 2 recoge los valores de [G.sup.2] de todos los modelos irt estimados, asi como los resultados de la comparacion de estos. En la columna C se indica cual es la comparacion que se esta realizando; asi, por ejemplo, 1-2 denotaria que la comparacion de esa fila seria la del modelo listado en primer lugar (1PLM) con el modelo listado en segundo lugar (2PLM). En la siguiente columna aparece la diferencia en el [G.sup.2] de esos modelos que se distribuye con [gl.sub.1] - [gl.sub.2] grados de libertad. A continuacion, se recoge el valor de p para cada comparacion.

Tal y como se desprende de esta tabla (columna mod), el modelo irt que mejor ajuste tuvo a los datos fue el modelo logistico de dos parametros (2PLM), ya que dicho modelo se ajusta significativamente mejor que el de un parametro (1PLM), y no presenta diferencias significativas en el ajuste con respecto al modelo mas complejo (3PLM). Por esta razon, en los posteriores metodos de deteccion del dif basados en la irt, los parametros de los items en el grupo de hombres y mujeres fueron estimados segun este modelo (2plm).

Diferencias entre grupos en puntuaciones observadas

La tabla 3 presenta los estadisticos descriptivos tanto a nivel de item como a nivel de la escala global para ambos grupos. La tabla presenta tambien informacion de tipo inferencial que permite valorar que items muestran una relacion estadisticamente significativa (p< 0,01) entre el sexo y la respuesta al item. Es decir, se puede observar que grupo obtuvo una puntuacion mayor y el tamano del efecto. Estos resultados indican que entre los items analizados de la escala SSS-V existe una alta proporcion de items con diferencias estadisticamente significativas a favor de los hombres, encontrandose diferencias significativas en la escala global (sss) a favor de los hombres (t(1189) = 5,485;p < 0,001; d = 0,3193).

DIF

Para determinar si las diferencias permanecen o desaparecen, al comparar hombres y mujeres previamente emparejados en cuanto a su nivel de busqueda de sensaciones, se llevo a cabo un analisis con objeto de detectar el posible funcionamiento diferencial. La tabla 4 muestra los resultados estadisticos obtenidos con los metodos previamente descritos al ser aplicados a los items de la escala SSS-V. Ademas, dado que algunos procedimientos se basan en la IRT, se presentan tambien en la tabla 4 los parametros de los items estimados segun el 2PLM tanto para el grupo de hombres como para el de mujeres.

El analisis de regresion logistica detecto dif uniforme en ocho items, pero unicamente los items 17 y 30 mostraron un nivel de dif cercano a moderado y severo, respectivamente. Los resultados obtenidos por el metodo del sibtets (a nivel de deteccion de items individualmente) fueron similares, mostrando nueve items con dif uniforme (los mismos encontrados mediante regresion logistica mas el item 3). No obstante, los tamanos del efecto de dif, estimados mediante la magnitud de [beta] (Roussos & Stout, 1996), fueron sistematicamente mayores que los obtenidos con el anterior procedimiento. Ademas, no se detecto la existencia de dif no uniforme en ningun item.

Los resultados obtenidos al trabajar con el modelo dfit ponen de manifiesto que no existe un funcionamiento diferencial de la escala SSS-V en su conjunto (DTF = 1,189; p = 0,466). Por tanto, los items con valores para el indice CDIF por encima del valor de corte no fueron tenidos en cuenta. Por su parte, al utilizar el indice NCDIF se detectaron ocho items con dif, es decir, se detecto la presencia estadisticamente significativa de dif en ocho items en los que, ademas, el valor del ncdif superaba el punto de corte anteriormente especificado en el apartado de metodo. Finalmente, se detecto la presencia de dif en diez items al aplicar el estadistico [chi square] de Lord.

Por otra parte, la tabla 5 presenta de forma resumida la informacion mas relevante en relacion con los analisis llevados a cabo al usar el procedimiento SIBTEST y dirigidos a analizar el efecto del dif en un conjunto de items considerados simultaneamente. En ella se muestran el numero de items en el subtest valido y los items del subtest bajo sospecha. El subtest bajo sospecha estaba compuesto por aquellos items identificados con Dif, por medio de la regresion logistica o el propio SIBTEST (items detectados individualmente), o por estos procedimientos mas algun indice basado en la IRT. La razon de enfatizar los resultados obtenidos mediante metodos no basados en la IRT se relaciona con el hecho de que el tamano de la muestra, aun siendo adecuado para trabajar dentro del marco de la IRT, no era excesivamente grande y el error de estimacion podria estar cumpliendo un papel en los resultados. En la tabla se indican ademas que items mostraron dif uniforme a favor del grupo de hombres y cuales lo hicieron a favor del grupo de mujeres y la probabilidad asociada con el estadistico de contraste que evalua el funcionamiento diferencial del subtest bajo sospecha.

Se observa que nueve items mostraron dif en la escala SSS-V; cuatro de ellos con dif uniforme a favor del grupo de mujeres (items 2, 3, 26 y 30) y cinco items con dif uniforme a favor del grupo de hombres (items 6, 7, 17, 19 y 35). En cualquier caso, no se detecto funcionamiento diferencial en el test bajo sospecha (p = 0,196). Esto puede deberse al efecto de cancelacion, en tanto la escala cuenta con items que favorecen en algunos casos al grupo de mujeres y en otros casos al grupo de hombres.

Si se examinan conjuntamente las tablas 4 y 5, se hace evidente la gran consistencia de los diversos procedimientos utilizados para detectar el dif. Por ejemplo, siete de los nueve items que conformaban el subtest bajo sospecha fueron detectados como items con dif por todos los procedimientos utilizados (items 2, 6, 17, 19, 26, 30 y 35) y otros dos (items 3 y 7) fueron etiquetados con dif por al menos tres procedimientos. Unicamente los items 10 y 13 fueron etiquetados con dif por un solo procedimiento (estadistico [chi square] de Lord).

Para ilustrar el tipo de dif detectado, asi como para dar idea de su magnitud, se examinaron tambien las curvas caracteristicas de los items con dif en el grupo de varones y en el de mujeres. La figura 1 recoge estas representaciones graficas que sirven para complementar la informacion estadistica recogida en las tablas 4 y 5. Dicha figura permite ver graficamente que todos los items detectados con dif mostraron DIF uniforme y que cinco lo hicieron a favor del grupo de hombres (items 6, 7, 17, 19 y 35), mientras que cuatro lo hicieron a favor del grupo de mujeres (items 2, 3, 26 y 30).

Impacto

A la vista de estos resultados seria interesante dar respuesta a la pregunta de si los items que presentan dif son, al menos en parte, los responsables de las diferencias encontradas entre ambos sexos al analizar la escala de manera global. Para responder a esta cuestion, se seleccionaron los items que figuran en la tabla 5 como items del subtest valido, esto es, items de los que se tienen razones fundamentadas para suponer que no operan diferencialmente en funcion del sexo y que proporcionan, en principio, una medida valida de la caracteristica evaluada. A continuacion, se calculo en dicho subtest la puntuacion media de cada sexo y se realizo la correspondiente comparacion de medias. La media en una escala formada por los items que componen el subtest valido en el grupo de los hombres fue 8,42 con una desviacion tipica de 4,75, mientras que en el grupo de mujeres esa media fue de 7,22 y la desviacion tipica fue de 4,30. Esa diferencia resulto ser estadisticamente significativa (t(1189) = 5,706; p < 0,001; d = 0,3315). Notese que el tamano del efecto es similar al que se obtiene cuando se analiza la escala global (ver tabla 2).

Discusion

El objetivo principal de esta investigacion era establecer si las diferencias de sexo observadas en la dimension de busqueda de sensaciones son diferencias genuinas en el constructo o si tales diferencias estan causadas por un funcionamiento diferencial de los items, trabajando con un instrumento ampliamente utilizado pero que, hasta donde se sabe, nunca antes habia sido analizado desde la perspectiva del dif.

Tal y como se senalo anteriormente, el analisis inicial de la dimensionalidad del instrumento condujo a la eliminacion de 12 items. Conviene resaltar que la mayoria de los items eliminados pertenecen a dos subescalas del instrumento SSS-V: las subescalas de ES y BS. La fiabilidad de esas subescalas en los datos de esta investigacion es relativamente baja. Este resultado es congruente con el extenso estudio realizado por Deditius-Island y Caruso (2002), quienes analizaron 244 investigaciones empiricas que empleaban el SSS-V, donde se encontro que sistematicamente las subescalas de es y bs mostraban los menores coeficientes de fiabilidad.

En relacion con este aspecto, es importante subrayar que el hecho de que la mayoria de los items eliminados pertenezcan a las subescalas mencionadas podria suponer una amenaza a la validez de contenido del constructo de busqueda de sensaciones que se analizo en el presente estudio. No obstante, conviene recordar que, (i) los doce items fueron eliminados porque presentaban cargas factoriales inferiores a 0,25 en el analisis factorial confirmatorio realizado con noharm, (ii) los 28 items del SSS-V analizados en este estudio mostraban un buen ajuste a un modelo formado por una unica dimension muy robusta, y (iii) el indice de correlacion entre la puntuacion global de busqueda de sensaciones de la version completa del SSS-V (40 items) y la puntuacion global en la version de los 28 items analizados en este estudio fue de 0,969.

Los resultados obtenidos en el analisis acerca de las diferencias de sexo en las puntuaciones observadas mostraron que se encontraron diferencias significativas en el indice global de busqueda de sensaciones (sss) y en un numero bastante elevado de los items que componen el SSS-V. La direccion de tales diferencias fue consistente con la literatura cientifica previa: los hombres tuvieron una mayor puntuacion que las mujeres en busqueda de sensaciones (Zuckerman et al., 1978; Ball et al., 1984; Beaducel et al., 2003).

El estudio del funcionamiento diferencial de los items mostro que las diferencias de sexo encontradas inicialmente en el analisis de los items no fueron consecuencia de problemas derivados del instrumento de medicion. En efecto, se detecto la presencia de dif en un numero reducido de items, en todos ellos el dif fue uniforme y el tamano del efecto fue, por otra parte, moderado en la mayoria de los casos. Ademas, se podria estar observando un efecto de cancelacion, ya que cinco items presentan dif uniforme a favor del grupo de hombres, mientras que cuatro presentan dif uniforme a favor del grupo de mujeres. Este efecto de cancelacion se traduce en que la escala en su conjunto no funciona de forma diferente en el grupo de hombres y mujeres.

La mayoria de los items en los que se ha detectado dif han sido identificados consistentemente (con al menos cuatro de los cinco metodos de deteccion) ocho items de los nueve que forman parte del subtest sospechoso (2, 3, 6, 17, 19, 26, 30 y 35).

Para completar los resultados obtenidos, se llevo a cabo un analisis dirigido a responder a la pregunta de si los items que funcionan diferencialmente eran, al menos en parte, responsables de las diferencias encontradas entre varones y mujeres, al analizar la escala globalmente. Para dar respuesta a esta cuestion, tal y como se recoge en el apartado de resultados, se seleccionaron los items del subtest valido empleado en el sibtest, esto es, los items de los que se tienen fundadas razones para suponer que no operan diferencialmente en funcion del sexo y que proporcionan, en principio, una medida valida de la caracteristica evaluada. Seguidamente, se calculo en dicho subtest la puntuacion media de hombres y mujeres y se realizo la correspondiente comparacion de medias.

Es decir, con este analisis se trato de comprobar si una vez eliminados los items con dif del test, existian diferencias entre hombres y mujeres en la variable medida. En caso de existir esas diferencias, estas se podrian denominar en este caso como 'impacto'. Los resultados mostraron que la tendencia no cambia cuando los items que presentan dif fueron eliminados. En otras palabras, las diferencias de sexo que se encontraban inicialmente se siguen manteniendo. Mas aun, los tamanos del efecto encontrados para tales diferencias fueron muy similares en la escala original y en la escala formada a partir de los items del subtest valido.

Cuando se realiza un analisis sobre el contenido de los items identificados con dif, se observan algunas caracteristicas que son pertinente resaltar. Asi por ejemplo, parece que hombres y mujeres (igualados en la caracteristica evaluada) difieren en su probabilidad de responder al item en la direccion del rasgo cuando este incluye en su redaccion a determinados colectivos marginales o de opcion sexual no mayoritaria. Asi, por ejemplo, se observa dif a favor de las mujeres en los items 26 ("Me gustaria hacer amigos procedentes de grupos marginales") o, de especial magnitud, el item 30 ("Me gustaria conocer personas homosexuales (hombres o mujeres)"). Sin embargo, se observa dif a favor del grupo de hombres en items que incluyen una clara referencia al sexo o a actividades peligrosas y/o de riesgo. Como ejemplo, en los items 7 ("Me gusta la compania de personas liberadas que practican el cambio de parejas"), 17 ("Me gustaria aprender a volar en avioneta"), 19 ("Me gusta salir con personas del sexo opuesto que sean fisicamente excitantes") o 35 ("Me gusta ver las escenas sexys de las peliculas").

Estos resultados podrian tener algunos correlatos sociales de cierta importancia. Por ejemplo, y congruentemente con la literatura previa, los hombres podrian ser mas vulnerables al desarrollo de comportamientos antisociales, debido, entre otras muchas razones, a su mayor nivel de busqueda de sensaciones (Aluja, 1991; Chico, 2000; Goma, 1995; Trimpop, Kerr & Kirkcaldy, 1999). Por consiguiente, y siguiendo a Lykken (1995), el esfuerzo que se requiere para socializar correctamente a los individuos seria, en lineas generales, en promedio y como grupo, mayor para los hombres que para las mujeres.

En resumen, los resultados del presente estudio proporcionan evidencia empirica para apoyar el hecho de que las diferencias de sexo encontradas en el SSS-V no son el resultado de sesgos importantes en el instrumento de medida. Estos resultados tienen implicaciones importantes para la validez de las puntuaciones en esta prueba, ya que representan un paso mas en el proceso de obtencion de pruebas favorables en apoyo del uso de las puntuaciones obtenidas en contextos aplicados.

No obstante, aunque segun los resultados de este estudio la presencia de items con dif en la SSS-V no estarian incidiendo en las diferencias de sexo que se encuentran en el constructo de busqueda de sensaciones, lo que si pueden sugerir es la conveniencia de que en las investigaciones aplicadas se considere sistematicamente la necesidad de utilizar baremos diferenciados para hombres y mujeres en busqueda de sensaciones. En este sentido, conviene remarcar que, si bien, hasta donde se conoce en esta investigacion, no existen baremos publicados de la SSS-V, todos los estudios revisados analizan las distribuciones de las puntuaciones en el grupo de hombres y en el grupo de mujeres por separado (Chico, 2000; Colom & Jayme-Zaro, 2004; Perez & Torrubia, 1986; Zuckerman, 2007a).

Por otra parte, los resultados de algunos estudios relativamente recientes, como el de Stark, Chernyshenko y Drasgow (2004), ponen de manifiesto que la repercusion practica de la presencia de un funcionamiento diferencial del test (dtf) en diferentes contextos aplicados como la seleccion de personal o la admision en determinadas instituciones educativas no tiene practicamente ningun efecto. Es decir, que aunque muchos items presentaran DIF y DTF, la repercusion de este hecho en las potenciales decisiones de seleccion seria minima. Si esto es asi con test en los que se ha detectado dif en muchos items y un DTF estadisticamente significativo, el panorama en estos contextos sera todavia mucho mas favorable si se emplean pruebas que presenten DIF en muy pocos items y/o que ademas no presenten un DTF significativo, como segun los resultados del presente estudio es el caso de la SSS-V.

Finalmente, el presente estudio tiene algunas limitaciones. Quiza, la mas relevante este relacionada con la muestra de participantes analizada. En este sentido, en el presente estudio no se han considerado variables como profesion, nivel de estudios, nivel socioeconomico, consumo de drogas, estado civil, etc. Dado que en este estudio se analizan diferencias de sexo en busqueda de sensaciones desde la perspectiva del dif, seria conveniente contrastar que ambos grupos en funcion de sexo son equivalentes en estas variables, ya que podria suceder que los resultados encontrados en el presente estudio se deban en realidad a estas variables sociodemograficas que no han sido controladas. Por esta razon, futuros estudios se deberian dirigir a contrastar si se reproduce este patron de resultados (i) incrementando sustancialmente el N, (ii) controlando la equivalencia de hombres y mujeres en estas variables sociodemograficas anteriormente mencionadas y (iii) empleando otras medidas del constructo de busqueda de sensaciones.

Doi: http://dx.doi.Org/ 10.12804/revistas.urosario.edu.co/apl/a.3753

Referencias

Abad, F. J., Olea, J., Ponsoda, V., & Garcia. C. (2011). Medicion en Ciencias Sociales y de la Salud. Madrid: Sintesis.

Ackerman, T. A. (1992). A didactic explanation of item bias, item impact, and item validity from a multidimensional perspective. Journal of Educational Measurement, 29, 67-91.

Aluja, A. (1991). Personalidad desinhibida, agresividad y conducta antisocial. Barcelona: PPU.

Aluja, A., Garcia, O., & Garcia, L. F. (2004). Exploring the structure of Zuckerman's sensation seeking scale, Form V in a Spanish sample. Psychological Reports, 95, 338-344.

Andersen, E. B. (1973). A goodness of fit test for the Rash model. Psychometrika, 38, 123-140.

Arend, I., Botella, J., Contreras, M. J., Hernandez, J. M., & Santacreu, J. (2003). A betting dice test to study the interactive style of risk-taking behavior. Psychological Records, 53, 217-230.

Ball, I. L., Farnill, D., & Wangemen, J. F. (1984). Sex and age differences in sensation seeking: Some national comparisons. British Journal of Personality, 75, 257-265.

Beauducel, A. Strobel, A. & Brocke B. (2003). Psychometrische Eigenschaften und Normen einer deutschsprachigen Fassung der Sensation Seeking Skalen, Form V [Psychometric properties and norms of a German version of the Sensation Seeking Scales, Form V.], Diagnostica 49, 61-72.

Borsboom, D., Mellenbergh, G., & Van Heerden, J. (2002). Different kinds of dif: A distinction between absolute and relative forms of measurement invariance and bias. Applied Psychological Measurement, 26, 433-450.

Chico, E. (2000). Busqueda de Sensaciones [Sensation Seeking]. Psicothema, 12, 229-235.

Clauser, B. E., & Mazor, K. M. (1998). Using statistical procedures to identify differentially functioning test items. Educational Measurement: Issues & Practice, 17, 31-44.

Collins, W., Raju, N., & Edwards, J. (2000). Assessing differential functioning in a Satisfaction scale. Journal of Applied Psychology, 85, 451-461.

Colom, R., & Jayme, Z. M. J. (2004). La psicologia de las diferencias de sexo. Madrid: Biblioteca Nueva.

Corr, P. J., & Matthews, G. (2009). The Cambridge Handbook of Personality Psychology. New York: Cambridge University Press.

Deditius-Island, H. K., & Caruso, J. C. (2002). An examination of the reliability of scores from Zuckerman's Sensation Seeking Scales, Form V. Educational and Psychological Measurement, 62(4), 728-734.

Delgado, C. (1995). Sesgo de genero en la medicion del neuroticismo [Gender bias in neuroticism measurement]. Ciencias Sociales, 69, 51-66.

Dorans, N. J., & Holland, P. W. (1993). dif detection and description: Mantel-Haenszel and standardization. En P. W. Holland & H. Wainer (Eds.), Differential item functioning (pp. 35-66). Hillsdale, NJ: Lawrence Erlbaum.

Ellis, B., & Mead, A. (2000). Assessment of the measurement equivalence of a Spanish translation of the 16PF questionnaire. Educational and Psychological Measurement, 60, 787-807.

Escorial, S. (2008). Proceso de validacion de un instrumento de evaluacion psicologica para la medicion de las dificultades del temperamento segun el modelo de DavidLykken. [Validation of an assessment instrument for measuring temperament difficulties on the model of David Lykken. ] (Tesis de doctorado sin publicar, Facultad de Psicologia, Universidad Autonoma de Madrid, Espana).

Escorial, S., & Navas, M. J. (2006). Analisis de la variable genero en las escalas del edtc mediante tecnicas de funcionamiento diferencial de los items [Analysis of the Gender Variable in the EDTC Scales Using Differential Item Functioning Techniques]. Psicothema, 18(2), 319-325.

Escorial, S., & Navas, M. J. (2007). Analysis of the Gender Variable in the Eysenck Personality Questionnaire Revised Scales Using Differential Item Functioning Techniques. Educational and Psychological Measurement, 67(6), 990-1001.

Fan, X., & Thompson, B. (2001). Confidence intervals about score reliability coefficients, please: An epm guidelines editorial. Educational and Psychological Measurement, 61, 517-531.

Feingold, A. (1994). Gender differences in personality: A meta-analysis. Psychological Bulletin, 116 (3), 429-456.

Ferrando, P. J., & Chico, E. (2001). The construct of sensation seeking as measured by Zuckerman's SSS-V and Arnett's aiss: a structural equation model. Personality and Individual Differences, 31, 1121-1133.

Fidalgo, A. M. (1996). Funcionamiento diferencial de los items [Differential item functioning]. In J. Muniz (Ed.), Psicometria (pp. 371-455). Madrid: Universitas.

Fraser, C., & McDonald, R. P. (1988). noharm: Least squares item factor analysis. Multivariate Behavioral Research, 23, 267-269.

Gelin, M., & Zumbo, B. (2003). Differential item functioning results may change depending on how an item is scored: An illustration with the Center for Epidemiologic Studies Depression Scale. Educational and Psychological Measurement, 63, 65-74.

Goma i Freixanet, M. (1995). Prosocial and antisocial aspects of personality. Personality and Individual Differences, 19, 125-134.

Gray, J. M., & Wilson, M. A. (2007). A detailed analysis of the reliability and validity of the sensation seeking scale in a UK sample. Personality and Individual Differences, 42, 641-651.

Hambleton, R. K., & Swaminathan, H. (1985). Item response theory: Principles and applications. Boston: Kluwer-Nijhoff.

Holland, P. W., & Wainer, H. (Eds.) (1993). Differential item functioning. Hillsdale: Lawrence Erlbaum Associates.

Jensen, A. R. (1998). The g factor. Westport, Connecticut: Praeger.

Jodoin, M. G., & Gierl, M. J. (2001). Evaluating Type I error and power rates using an effect size measure with the logistic regression procedure for dif detection. Applied Measurement in Education, 14, 329-349.

Jorm, A. (1987). Sex differences in neuroticism: A quantitative synthesis of published research. Australian and New Zealand Journal of Psychiatry, 21, 501-506.

Lange, R. Irwin, H. J. & Houran, J. (2000). Top-down purification of Tobacyk's Revised Paranormal Belief Scale. Personality and Individual Differences 29, 131-156.

Leo, J. A., Van Dam, N. T., Hobkirk, A. L., & Earleywine, M (2011). Examining bias in the impulsive sensation seeking (ImpSS) Scale using Differential Item Functioning (dif) - An item response analysis. Personality and Individual Differences 50, 570-576.

Lord, F. M. (1980). Applications of item response theory to practical testing problems. Hillsdale, N. J.: Erlbaum.

Lumsden, J. (1976). Test theory. En M. R. Rosenzweig & L.W. Porter (Eds.) Annual Review of Psychology. Palo Alto, CA: Annual Reviews Inc.

Lykken, D. (1995). The antisocial personalities. New Jersey: Lawrence Erlbaum Associates, Inc.

McDonald, R. P. & Mok, M. C. (1995). Goodness of fit in item response models. Multivariate Behavioral Research, 30, 23-40.

Perez, J., & Torrubia, R. (1986). Fiabilidad y validez de la version espanola de la escala de busqueda de sensaciones (Forma V) [Reliability and validity of the Spanish adaptation of the SSS-V]. Revista Latinoamericana de Psicologia, 18, 7-22.

Raju, N., van der Linden, W., & Fleer, P. (1995). irtbased internal measures of differential functioning of items and tests. Applied Psychological Measurement, 19, 353-368.

Reckase, M. D. (1979). Unifactor latent trait models applied to multifactor test: results and implications. Journal of Educational Statistics, 4, 207-230.

Reise, S., Smith, L., & Furr, M. (2001). Invariance on the neo pi-r Neuroticism scale. Multivariate Behavioral Research, 36, 83-110.

Roberti, J. W. (2004). A review of behavioral and biological correlates of sensation seeking. Journal of Research in Personality, 38, 256-279.

Roth, M. & Hammelstein, P. (2003). Sensation seeking --Konzeption, Diagnostik und Anwendung [Sensation Seeking-Conception, Measurement and Application], Hogrefe: Gottingen.

Roussos, L. A., & Stout, W. F. (1996). Simulation studies of the effects of small sample size and studied item parameters on SIBTEST and Mantel Hanzel Type I error performance. Journal of EducationalMeasurement, 32, 215-230.

Shealy, R. T., & Stout, W. F. (1993). An item response theory model for test bias and differential test functioning. In P. Holland & H. Wainer (Eds.), Differential item functioning (pp. 197-240). Hillsdale, NJ: Lawrence Erlbaum.

Smith, L. (2002). On the usefulness of item bias analysis to personality psychology. Personality and Social Psychology Bulletin, 28, 754-763.

Stark, S., Chernyshenko, O. S., & Drasgow, F. (2004). Examining the effects of differential item/test functioning (dif/dtf) on selection decisions: When are statistically significant effects practically important? Journal of Applied Psychology, 89, 497-508.

Stout, W., & Roussos, L. (1999). Dimensionality-based DIF/DBF package [Computer software]. Urbana-Champaign: William Stout Institute for Measurement, University of Illinois.

Swaminathan, H., & Rogers, H. J. (1990). Detecting differential item functioning using logistic regression procedures. Journal of Educational Measurement, 27(4), 361-370.

Tanaka, J. S. & Huba, G. J. (1985). A fit index for covariance structure models under arbitrary GLS estimation. British Journal of Mathematical and Statistical Psychology, 38, 197-201.

Thissen, D. (1991). multilog: Multiple, categorical item analysis and tests scoring using item response theory. Chicago: Scientific Software.

Trimpop, R. M., Kerr, J. H., & Kirkcaldy, B. (1999). Comparing personality constructs of risk- taking behavior. Personality and Individual Differences, 26, 237-254.

Waller, N. (1998). linkdif: Linking item parameters and calculating IRT measures of differential item functioning of items and tests. Applied Psychological Measurement, 22, 392.

Zuckerman, M. (1979). Sensation seeking: beyond the optimal level of arousal. Hillsdale: Erlburn.

Zuckerman, M. (1984). Sensation Seeking: A comparative approach to a human trait. Behavioral andBrain Sciences, 7, 413-471.

Zuckerman, M. (1990). The psychophysiology of sensation seeking. Journal of Personality, 58, 313-345.

Zuckerman, M. (1994). Behavioral expressions and biosocial bases of sensation seeking. New York: Cambridge University Press.

Zuckerman, M. (2005). Psychobiology of personality (Second edition, revised and updated). New York: Cambridge University Press.

Zuckerman, M. (2007a). Sensation seeking and risky behavior. Washington, D.C. : American Psychological Association.

Zuckerman, M. (2007b). The sensation seeking scale V (SSS-V): Still reliable and valid. Personality and Individual Differences, 43, 1305-1307.

Zuckerman, M., Eysenck, S.B.G., & Eysenck, H. J. (1978). Sensation seeking in England and America: Cross-cultural, age, and sex comparisons. Journal of Consulting and Clinical Psychology, 46, 139-149.

Zuckerman, M., & Neeb, M. (1980). Demographic influences in sensation seeking and expressions of sensation seeking in religion, smoking and driving habits. Personality and Individual Differences, 1, 197-206.

Zumbo, B. D., & Thomas , D. R. (1997). A measure of effect size for a model-based approach for studying DIF. Working Paper of the Edgeworth Laboratory for Quantitative Behavioral Science, University of Northern British Columbia: Prince George, B. C.

* Items que mostraron diferencias de sexo significativas segun la informacion presentada en la tabla 3. En negrita los valores estadisticamente significativos.

Recibido: 21 de septiembre de 2015

Aprobado: 11 de mayo de 2016

Sergio Escorial Martin *

Universidad Complutense de Madrid

* Departamento de Metodologia de las Ciencias del Comportamiento, Facultad de Psicologia, Universidad Complutense de Madrid. Correspondencia: Departamento de Metodologia de las Ciencias del Comportamiento, Facultad de Psicologia, Universidad Complutense de Madrid. Campus de Somosaguas. Pozuelo de Alarcon (28223) Telefono: 91 394 3080. Correo electronico: sergio.escorial@psi.ucm.es

Caption: Figura. 1 CCI de los items detectados con dif para ambos sexos
Tabla 1
Estimaciones de la fiabilidad para la escala sss-v de Zuckerman

                SSS             TAS             ES

            h       M       h       M       h       M

[alpha]   0,87    0,84    0,86    0,86    0,65    0,57
95% IC    0,85-   0,82-   0,84-   0,84-   0,60-   0,52-
          0,88    0,86    0,87    0,88    0,69    0,62

                DES             BS

            h       M       h       M

[alpha]   0,76    0,72    0,53    0,51
95% IC    0,73-   0,69-   0,47-   0,45-
          0,79    0,76    0,59    0,57
Nota: IC = intervalo de confianza

Tabla 2
Comparacion de modelos TRI en el SSS-V

         Modelos                  Comparacion de modelos

n      [G.sup.2]      gl     c       dif      gl      p      mod
                                  [g.sup.2]

28   1PLM: 19266,2   1162   1-2     877,2     28   < 0,001
     2PLM: 18389,0   1134   1-3     876,9     56   < 0,001   2PLM
     3PLM: 18388,7   1106   2-3      0,3      28    0,999

Tabla 3
Estadisticos descriptivos y diferencias de sexo para la escala y los
items

                          Hombres        Mujeres           t(p)

N                           582            609
Alfa                        0,89           0,87
Media escala (DT)       13,62 (6,45)   11,62 (6,08)   5,485 (<0,001)
Asimetria escala (ET)   -0,07 (0,10)   -0,03 (0,10)
Curtosis escala (ET)    -0,89 (0,20)   -0,86 (0,20)
Media items (DT)          Hombres        Mujeres       [c.sup.2] (p)
Item 1                  0,32 (0,468)   0,20 (0,398)   24,634 (<0,001)
Item 2                  0,39 (0,487)   0,42 (0,494)    1,409 (0,235)
Item 3                  0,47 (0,500)   0,44 (0,496)    1,683 (0,195)
Item 5                  0,66 (0,475)   0,60 (0,491)    4,891 (0,027)
Item 6                  0,73 (0,445)   0,58 (0,494)   28,483 (<0,001)
Item 7                  0,20 (0,402)   0,08 (0,277)   34,614 (<0,001)
Item 9                  0,61 (0,487)   0,54 (0,499)    6,817 (0,009)
Item 10                 0,42 (0,493)   0,37 (0,484)    2,312 (0,128)
Item 11                 0,14 (0,348)   0,11 (0,307)    3,547 (0,060)
Item 13                 0,57 (0,496)   0,49 (0,500)    7,205 (0,007)
Item 14                 0,21 (0,410)   0,15 (0,360)    7,274 (0,007)
Item 15                 0,35 (0,479)   0,24 (0,429)   17,532 (<0,001)
Item 17                 0,69 (0,464)   0,48 (0,500)   54,415 (<0,001)
Item 19                 0,81 (0,393)   0,66 (0,473)   32,497 (<0,001)
Item 21                 0,64 (0,481)   0,52 (0,500)   17,141 (<0,001)
Item 22                 0,74 (0,441)   0,71 (0,454)    1,144 (0,285)
Item 23                 0,24 (0,430)   0,15 (0,362)   15,048 (<0,001)
Item 24                 0,39 (0,487)   0,31 (0,461)    8,678 (0,003)
Item 25                 0,56 (0,497)   0,46 (0,499)   11,976 (0,001)
Item 26                 0,40 (0,489)   0,45 (0,498)    3,652 (0,056)
Item 27                 0,62 (0,485)   0,56 (0,497)    5,008 (0,025)
Item 29                 0,37 (0,484)   0,26 (0,440)   16,189 (<0,001)
Item 30                 0,40 (0,489)   0,63 (0,482)   67,870 (<0,001)
Item 31                 0,28 (0,448)   0,22 (0,418)    4,236 (0,040)
Item 33                 0,56 (0,497)   0,48 (0,500)    6,533 (0,011)
Item 35                 0,81 (0,390)   0,65 (0,476)   38,378 (<0,001)
Item 37                 0,59 (0,492)   0,51 (0,500)    7,135 (0,008)
Item 39                 0,46 (0,498)   0,34 (0,474)   17,060 (<0,001)

                           d

N
Alfa
Media escala (DT)       -0,3193
Asimetria escala (ET)
Curtosis escala (ET)
Media items (DT)           d
Item 1                  -0,2767
Item 2                  0,0612
Item 3                  -0,0602
Item 5                  -0,1242
Item 6                  -0,3187
Item 7                  -0,3490
Item 9                  -0,1419
Item 10                 -0,1024
Item 11                 -0,0916
Item 13                 -0,1606
Item 14                 -0,1557
Item 15                 -0,2422
Item 17                 -0,435
Item 19                 -0,3442
Item 21                 -0,2445
Item 22                 -0,0670
Item 23                 -0,2269
Item 24                 -0,1488
Item 25                 -0,2008
Item 26                 0,1013
Item 27                 -0,1222
Item 29                 -0,2381
Item 30                 0,4738
Item 31                 -0,1386
Item 33                 -0,1605
Item 35                 -0,3669
Item 37                 -0,1613
Item 39                 -0,2470

Tabla 4
Items con posible dif detectados por diferentes procedimientos

         TRI hombres   TRI mujeres

Item

        a       b      a       b

1 *    1,12   0,88    1;50   0,94

2      0,58   0,90    0,66   0,23

3      2,18   0,15    1,90   -0;07

5      1,66   -0,54   1,95   -0,58

6 *    0,80   -1,37   0,76   -0,77

7 *    1,38   1,38    1,47   1,74

9 *    2,01   -0,33   2,55   -0,38

10     1,64   0,36    1,48   0,19

11     1,74   1,57    1,12   1,92

13 *   1,93   -0,17   2,74   -0,23

14 *   2,10   1,08    1,23   1,39

15 *   2,64   0,51    2,08   0,56

17 *   1,23   -0,79   2,13   -0,20

19 *   1,46   -1,33   1,62   -0,87

21 *   1,90   -0,43   2,19   -0,33

22     0,99   -1,22   0,93   -1,39

23 *   0,82   1,62    0,56   2,87

24 *   0,55   0,95    0,51   1,39

25 *   2,34   -0.12   2,87   -0,15

26     0,70   0,72    0,70   0,02

27     0,95   -0,59   0,87   -0,61

29 *   1,64   0,53    1,91   0,52

30 *   0,82   0,64    1,23   -0,85

31     0,63   1,70    0,62   1,81

33     0,84   -0,28   0,94   -0,21

35 *   1,19   -1,53   1,27   -0,92

37 *   2,27   -0,23   2,20   -0,31

39 *   1,01   0,26    0,95   0,52

       Tecnica de deteccion de dif

Item

                         rl                         SIBTEST *
                                                    ([beta])

1 *     [DELTA][[chi square].sub.(2)] = 6,84      0,060 (0,018)
           (0,033); [DELTA][R.sup.2]: .006

2       [DELTA][[chi square].sub.(2)] = 10,18    -0,097 (0,001)
          (0,006); [DELTA][R.sup.2]: 0,010

3       [DELTA][[chi square].sub.(2)] = 8,65     -0,082 (0,002)
          (0,013); [DELTA][R.sup.2]: 0,006

5       [DELTA][[chi square].sub.(2)] = 2,16     -0,036 (0,160)
          (0,340); [DELTA][R.sup.2]: 0,001

6 *     [DELTA][[chi square].sub.(2)] = 14,66     0,094 (0,001)
         (< 0,001); [DELTA][R.sup.2]: 0,015

7 *     [DELTA][[chi square].sub.(2)] = 12,70     0,064 (0,001)
          (0,002); [DELTA][R.sup.2]: 0,015

9 *     [DELTA][[chi square].sub.(2)] = 0,64     -0,016 (0,549)
          (0,726); [DELTA][R.sup.2]: 0,000

10      [DELTA][[chi square].sub.(2)] = 3,26     -0,064 (0,016)
          (0,196); [DELTA][R.sup.2]: 0,002

11      [DELTA][[chi square].sub.(2)] = 6,39     -0,021 (0,267)
          (0,041); [DELTA][R.sup.2]: 0,009

13 *    [DELTA][[chi square].sub.(2)] = 2,15     -0,025 (0,350)
          (0,341); [DELTA][R.sup.2]: 0,001

14 *    [DELTA][[chi square].sub.(2)] = 4,96     -0,025 (0,255)
          (0,084); [DELTA][R.sup.2]: 0,005

15 *    [DELTA][[chi square].sub.(2)] = 0,39      0,007 (0,756)
          (0,823); [DELTA][R.sup.2]: 0,000

17 *    [DELTA][[chi square].sub.(2)] = 39,08    0,148 (< 0,001)
          (<0,001); [DELTA][R.sup.2]: 0,030

19 *    [DELTA][[chi square].sub.(2)] = 16,16    0,087 (< 0,001)
          (<0,001); [DELTA][R.sup.2]: 0,014

21 *    [DELTA][[chi square].sub.(2)] = 2,65      0,030 (0,268)
          (0,266); [DELTA][R.sup.2]: 0,002

22      [DELTA][[chi square].sub.(2)] = 1,90     -0,033 (0,203)
          (0,387); [DELTA][R.sup.2]: 0,002

23 *    [DELTA][[chi square].sub.(2)] = 5,13      0,042 (0,081)
          (0,077); [DELTA][R.sup.2]: 0,006

24 *    [DELTA][[chi square].sub.(2)] = 2,08      0,027 (0,345)
          (0,353); [DELTA][R.sup.2]: 0,002

25 *    [DELTA][[chi square].sub.(2)] = 1,00      0,002 (0,935)
          (0,607); [DELTA][R.sup.2]: 0,001

26      [DELTA][[chi square].sub.(2)] = 17,97    -0,127(<0,001)
         (< 0,001); [DELTA][R.sup.2]: 0,018

27      [DELTA][[chi square].sub.(2)] = 1,97      0,001 (0,962)
          (0,373); [DELTA][R.sup.2]: 0,002

29 *    [DELTA][[chi square].sub.(2)] = 1,42      0,020 (0,432)
          (0,492); [DELTA][R.sup.2]: 0,001

30 *   [DELTA][[chi square].sub.(2)] = 142,60    -0,336 (<0,001)
          (<0,001); [DELTA][R.sup.2]: 0,131

31      [DELTA][[chi square].sub.(2)] = 0,16      0,004 (0,894)
          (0,923); [DELTA][R.sup.2]: 0,000

33      [DELTA][[chi square].sub.(2)] = 0,17      0,014 (0,626)
          (0,919); [DELTA][R.sup.2]: 0,000

35 *   [DELTA][[chi square].sub.(2)] = 21,23     0,110 (<0,001)
          (<0,001); [DELTA][R.sup.2]: 0,019

37 *    [DELTA][[chi square].sub.(2)] = 1,13     -0,015 (0,558)
           (0,568); [DELTA][R.sup.2]: .001

39 *    [DELTA][[chi square].sub.(2)] = 3,95      0,033 (0,250)
          (0,139); [DELTA][R.sup.2]: 0,003

       Tecnica de deteccion de dif

Item                                        DIF

       [c.sup.2] Lord         ncdif

1 *     6,10 (0,047)      .0017 (<.001)     No dif

2      25,35 (<0,001)    0,0145 (< 0,001)   dif uniforme
                                            moderado-M

3      30,69 (<0,001)    0,0193 (< 0,001)   dif uniforme
                                            moderado-M

5       7,29 (0,026)      0,0026 (0,028)    No dif

6 *    26,70 (<0,001)    0,0298 (< 0,001)   dif uniforme
                                            moderado-H

7 *     3,80 (0,150)     0,0004 (< 0,001)   dif uniforme
                                            pequeno-H

9 *     11,49 (0,003)     0,0042 (0,005)    No dif

10     17,91 (<0,001)    0,0100 (< 0,001)   No dif

11      3,50 (0,174)     0,0002 (< 0,001)   No dif

13 *   18,63 (< 0,001)    0,0069 (0,020)    No dif

14 *    6,72 (0,035)     0,0008 (< 0,001)   No dif

15 *    3,66 (0,160)     0,0015 (< 0,001)   No dif

17 *   86,82 (<0,001)    0,0786 (< 0,001)   dif uniforme
                                            moderado-H

19 *   40,09 (<0,001)    0,0407 (< 0,001)   dif uniforme
                                            pequeno-H

21 *    8,04 (0,018)     0,0043 (<0,001)    No dif

22      1,37 (0,505)     0,0007 (< 0,001)   No dif

23 *    1,01 (0,603)     0,0008 (< 0,001)   No dif

24 *    3,08 (0,214)     0,0019 (< 0,001)   No dif

25 *    9,05 (0,011)      0,0032 (0,044)    No dif

26     43,74 (<0,001)    0,0267 (< 0,001)   dif uniforme
                                            moderado-M

27       0,11 (.949)      0,0001 (0,226)    No dif

29 *    4,54 (0,104)      0,0013 (0,448)    No dif

30 *   241,43 (<0,001)   0,1999 (< 0,001)   dif uniforme
                                            severo-M

31      0,24 (0,885)     0,0001 (< 0,001)   No dif

33      3,79 (0,151)     0,0020 (< 0,001)   No dif

35 *   42,32 (<0,001)    0,0485 (< 0,001)   dif uniforme
                                            moderado-H

37 *    5,21 (0,074)     0,0034 (<0,001)    No dif

39 *    3,87 (0,144)     0,0025 (< 0,001)   No dif

Tabla 5
Resultados obtenidos mediante el procedimiento sibtest

                                          dif uniforme
                                           a favor de

No. de items    Items en el subtest       h          m       Dtf
en el subtest      bajo sospecha                             (P)
valido

19                  2, 3, 6, 7,       6, 7, 17,    2, 3,    .196
                17, 19, 26, 30, 35     19 y 35    26 y 30
COPYRIGHT 2017 Universidad del Rosario
No portion of this article can be reproduced without the express written permission from the copyright holder.
Copyright 2017 Gale, Cengage Learning. All rights reserved.

 
Article Details
Printer friendly Cite/link Email Feedback
Author:Martin, Sergio Escorial
Publication:Avances en Psicologia Latinoamericana
Date:Jul 1, 2017
Words:9985
Previous Article:The perception of meaning of life in vital cycle: a time perspective/La percepcion de sentido de la vida en el ciclo vital: una perspectiua...
Next Article:Psychometric properties of the intergroup-intrasexual competition scale in Costa Rica/Propiedades psicometricas de la escala de competencia...
Topics:

Terms of use | Privacy policy | Copyright © 2018 Farlex, Inc. | Feedback | For webmasters