Validación y reducción de cuestionarios de calidad de vida relacionada con la salud: aplicación de diferentes metodologías

BILBAO GONZALEZ, AMAIA

Validación y reducción de cuestionarios de calidad de vida relacionada con la saludaplicación de diferentes metodologías

BILBAO GONZALEZ, AMAIA

Dirigée par:

Inmaculada Arostegui Madariaga Directrice
José María Quintana López Directeur

Université de défendre: Universidad del País Vasco - Euskal Herriko Unibertsitatea

Fecha de defensa: 01 mars 2016

Jury:

Fernando García Benavides President
Arantza Urkaregi Etxepare Secrétaire
Xavier Castells Rapporteur

Type: Thèses

Teseo: 120707 DIALNET ADDI editor

Résumé

1ResumenEn las últimas décadas, la medición de la calidad de vida relacionada con la salud(CVRS) ha ido convirtiéndose en una disciplina autónoma y formal, de granutilidad dentro del ámbito sanitario, y más concretamente dentro de lasenfermedades crónicas. La manera de medir la CVRS es a través de cuestionarios ypara establecer la aceptabilidad de un cuestionario es necesario que cumpla conciertos atributos, entre los que se encuentran las propiedades psicométricas, talescomo la fiabilidad, la validez y la sensibilidad al cambio. De entre las diferentespropiedades psicométricas, la validez de constructo, que consiste en proporcionarevidencia de que la forma de interpretar las puntuaciones del instrumento escorrecta según la teoría y los constructos que se miden, es el aspecto mássusceptible de exploración mediante el análisis numérico y estadístico. Este, a suvez, se divide en la validez convergente y discriminante, la validez de gruposconocidos y la validez de estructura, siendo esta última la que juega un papel másimportante, y siendo también el tema con mayor controversia. Existen diferentesperspectivas y teorías de enfoque, desde la teoría clásica del test (TCT) hasta lateoría de la respuesta al ítem (TRI), e incluso dentro de cada una de las teorías,existen diferentes métodos. Sin embargo no hay un consenso sobre que2 Resumenmetodología utilizar para evaluar la validez de estructura. Por otro lado, aunqueexisten cuestionarios de CVRS con buenas propiedades psicométricas, a menudo sulongitud limita en gran medida su aplicación, por lo que disponer de una versiónreducida que mantenga las mismas buenas propiedades psicométricas que suversión larga, es de gran utilidad tanto en la practica clínica como en investigación.Al igual que ocurre en el proceso de validación de instrumentos de CVRS, en elproceso de reducción de cuestionarios los métodos más utilizados han sidométodos de la TCT. Sin embargo, la literatura más actual también propone para lareducción de cuestionarios la utilización de procedimientos más modernosbasados en la TRI. Así, los objetivos generales de esta tesis son: 1) validar y/oreducir cuestionarios de CVRS mediante la combinación de métodos estadísticosde la TCT y de la TRI para evaluar así la complementariedad de dichos métodos; y2) proporcionar herramientas de medición de la CVRS científicamente validadas ycon buenas propiedades psicométricas en castellano para diferentes ámbitos de lasalud.Para llevar a cabo este trabajo, hemos seleccionado tres cuestionarios de CVRSpara tres enfermedades crónicas diferentes: obesidad mórbida, artrosis de caderay trastorno de la conducta de la alimentación (TCA). Los cuestionarios empleadosfueron el cuestionario Obesity-related Problems scale (OP) diseñado para medir elimpacto de la obesidad mórbida en el funcionamiento psicosocial, que consta deocho preguntas cubriendo un único dominio; una versión reducida delcuestionario Western Ontario and McMaster Universities Osteoarthritis Index(WOMAC), empleado para la medición de sintomatología y función en pacientescon artrosis de extremidad inferior, que consta de 11 ítems que se conforman endos factores, dolor y función; y el cuestionario Health Related Quality of Life forEating Disorders version 2 (HeRQoLEDv2), empleado para medir el impacto delTCA sobre aspectos físicos, mentales y sociales, que consta de 55 preguntas que seconforman en nueve factores.Para evaluar la fiabilidad se estudió la consistencia interna de los diferentesinstrumentos, que hace referencia a la homogeneidad de los ítems que componenResumen 3una escala. El estudio de la validez convergente y discriminante de las escalas sellevó a cabo mediante la correlación de las escalas del instrumento con las escalasde otros instrumentos, estableciendo hipótesis previas en relación a que escalasdel instrumento a validar deberían correlacionar alto o bajo con que escalas deotros instrumentos (validez convergente y discriminante, respectivamente). Elestudio de validez de grupos conocidos se llevó a cabo comparando laspuntuaciones de las escalas entre grupos de pacientes en los que se anticipaba quehubiera diferencias. La validez de estructura, que trata de realizar un análisisinterno del instrumento para comprobar que la estructura hipotética subyacentedel instrumento es correcta y adecuada, se llevó a cabo mediante métodos de laTCT y de la TRI. Los métodos de la TCT son modelos factoriales, que proporcionancombinaciones lineales de los ítems con los factores latentes que han de serestimados mediante sumas ponderadas que reflejen la importancia de cada ítem enel constructo. Las técnicas que hemos empleado son el Análisis FactorialExploratorio (AFE), el Análisis Factorial Confirmatorio (AFC), los Modelos deEcuaciones Estructurales (MEE), así como el caso específico de estos modelos paradatos categóricos. Aunque los tres casos, AFE, AFC, MEE, sirven para evaluar ladimensionalidad (número de factores) que es necesaria para representar lavariabilidad que hay en los datos, el AFC y MEE permiten además contrastar estospatrones para confirmar la validez de los constructos hipotetizados, mediantediferentes índices de bondad de ajuste. Los métodos de la TRI son modelosprobabilísticos que se basan en que un individuo con un nivel concreto de calidadde vida tendrá una cierta probabilidad de responder de forma positiva a unapregunta. Por tanto, la hipótesis subyacente en la TRI es que la respuesta a un ítemde un cuestionario depende del nivel de dificultad que el ítem presente y el nivel dehabilidad respecto al constructo del individuo que responde. Estos modelosincluyen un conjunto de asunciones entre las que se encuentra launidimensionalidad, ya que asume que los ítems de la escala son de una únicadimensión o constructo. Entre los modelos de la TRI, hemos utilizado métodospara ítems de respuesta politómica, y más concretamente el Rating Scale Model yGraded Response Model. El primero se clasifica dentro de los modelos de 1¿parámetro, ya que el único parámetro que caracteriza al ítem es su nivel de4 Resumendificultad. Y el segundo se clasifica dentro de los modelos de 2¿parámetros, ya queademás de la dificultad, también tienen en cuenta la discriminación del ítem. Porúltimo, para evaluar la sensibilidad al cambio se compararon las puntuacionesbasales y las de seguimiento, además de utilizar los tamaños del efecto para medirla magnitud del cambio.En relación a los pacientes con obesidad mórbida, se reclutaron 123 pacientes quese encontraban en lista de espera para ser intervenidos de cirugía bariátrica, y serealizó la traducción, adaptación y validación del cuestionario OP al español,estudiando su fiabilidad y validez mediante la aplicación de diferentes métodos dela TCT. Los resultados demostraron la fiabilidad, la validez convergente y la validezde grupos conocidos. La validez de estructura se analizó mediante el AFE y el AFC,obteniendo resultados muy similares, además de índices de bondad de ajuste delAFC que confirmaron la estructura subyacente del cuestionario.En la evaluación de las propiedades psicométricas del WOMAC, se seleccionarondos cohortes independientes de pacientes (788 y 445 pacientes, respectivamente)con artrosis de cadera que estaban en lista de espera para ser intervenidos deartroplastia total de cadera, a los que además se les hizo un seguimiento a los seismeses después de la intervención. Se realizó la validación de la versión reducidapropuesta del cuestionario WOMAC, estudiando la fiabilidad, validez y sensibilidadal cambio, combinando métodos de la TCT así como de la TRI en ambas cohortes depacientes. Los resultados apoyaron la fiabilidad del instrumento, la validezconvergente y la validez de grupos conocidos. Para el estudio de la validez deestructura se utilizó el AFC, que confirmó la existencia de dos factores en elcuestionario, dolor y función. Además, se aplicó el Rating Scale Model de la TRI acada una de las dos escalas, concluyendo que ambas escalas se ajustaban al modeloRasch, confirmando así la unidimensionalidad. Los resultados del AFC y del RatingScale Model fueron muy similares en ambas cohortes de pacientes, demostrandoasí la estabilidad de los resultados. Por último, los parámetros de sensibilidad alcambio demostraron grandes cambios a los seis meses de la intervención.Resumen 5En relación a los pacientes con un TCA, en primer lugar se reclutó una muestra de324 pacientes, a través de la cual se confirmó la existencia de una estructurainterna de segundo orden con dos medidas resumen en el cuestionarioHeRQoLEDv2, para así posteriormente reducir dicho cuestionario. Se hipotetizóque 40 de los ítems del cuestionario que se conformaban en siete factoresdenominados factores de primer orden, a su vez se resumían en dos factores desegundo orden. Se empleó un MEE, cuyos resultados confirmaron lamultidimensionalidad de dicho cuestionario, garantizando la existencia de dichaestructura de segundo orden con dos medidas resumen denominadas¿Adaptabilidad social¿ y ¿Salud Mental y rendimiento¿. Se aplicó el Rating ScaleModel a cada una de las escalas de forma separada para reducir cada una de las dosmedidas resumen, garantizando la unidimensionalidad, dando lugar a la versiónreducida de 20 ítems, denominada Health Related Quality of Life for EatingDisorders Questionnaire-Short Version (HeRQoLED-S). Posteriormente, se reclutóotra muestra de 377 pacientes con un TCA, a la que se realizó un seguimiento deun año, a través de la cual se realizó la validación de la versión reducidaHeRQoLED-S, combinando métodos de la TCT así como de la TRI. Por un lado, seutilizó los MEE para datos categóricos, cuyos resultados confirmaron la estructurade segundo orden del cuestionario HeRQoLED-S. Por otro lado, se aplicó el GradedResponse Model a cada una de las dos medidas resumen, cuyos resultadosdemostraron la unidimensionalidad de cada escala y la correcta capacidad dediscriminación de todos los ítems de la escala con respecto a su correspondienteconstructo latente. La validez convergente, la validez de grupos conocidos, lafiabilidad y la sensibilidad al cambio del instrumento reducido también quedarondemostradas.En vista a los resultados obtenidos podemos concluir, en primer lugar, que losmétodos basados en la TCT y los basados en la TRI son complementarios entre sí.Mientras que los primeros nos proporcionan información sobre ladimensionalidad del cuestionario, los segundos se centran en launidimensionalidad. Así, cada uno de los métodos proporciona diferente tipo desoporte en el proceso de validación y/o reducción de cuestionarios de CVRS, de6 Resumenforma que la combinación de los diferentes métodos proporciona mayor evidenciade la validez de cuestionarios de CVRS. En segundo lugar, podemos concluir que lautilización combinada de estas técnicas estadísticas ha proporcionado versionescientíficamente validadas en castellano de tres cuestionarios de CVRS, paradiferentes ámbitos de la salud, que pueden ser utilizados en la práctica clínica, asícomo entre investigadores y decisores sanitarios. Concretamente, la versiónespañola del cuestionario OP posee buenas propiedades psicométricas de validez yfiabilidad, y puede utilizarse para medir el impacto de la obesidad mórbida en elfuncionamiento psicosocial en estudios transversales. La versión reducidapropuesta del cuestionario WOMAC es fiable, valida y sensible al cambio, y puedeser utilizada para medir dolor y función en pacientes con artrosis de cadera. Laversión reducida HeRQoLED-S, posee dos medidas resumen, y es fiable, valida ysensible al cambio, proporcionando así una herramienta simple, corta y de fácilaplicación para medir la CVRS en pacientes con un TCA. // 1ResumenEn las últimas décadas, la medición de la calidad de vida relacionada con la salud(CVRS) ha ido convirtiéndose en una disciplina autónoma y formal, de granutilidad dentro del ámbito sanitario, y más concretamente dentro de lasenfermedades crónicas. La manera de medir la CVRS es a través de cuestionarios ypara establecer la aceptabilidad de un cuestionario es necesario que cumpla conciertos atributos, entre los que se encuentran las propiedades psicométricas, talescomo la fiabilidad, la validez y la sensibilidad al cambio. De entre las diferentespropiedades psicométricas, la validez de constructo, que consiste en proporcionarevidencia de que la forma de interpretar las puntuaciones del instrumento escorrecta según la teoría y los constructos que se miden, es el aspecto mássusceptible de exploración mediante el análisis numérico y estadístico. Este, a suvez, se divide en la validez convergente y discriminante, la validez de gruposconocidos y la validez de estructura, siendo esta última la que juega un papel másimportante, y siendo también el tema con mayor controversia. Existen diferentesperspectivas y teorías de enfoque, desde la teoría clásica del test (TCT) hasta lateoría de la respuesta al ítem (TRI), e incluso dentro de cada una de las teorías,existen diferentes métodos. Sin embargo no hay un consenso sobre que2 Resumenmetodología utilizar para evaluar la validez de estructura. Por otro lado, aunqueexisten cuestionarios de CVRS con buenas propiedades psicométricas, a menudo sulongitud limita en gran medida su aplicación, por lo que disponer de una versiónreducida que mantenga las mismas buenas propiedades psicométricas que suversión larga, es de gran utilidad tanto en la practica clínica como en investigación.Al igual que ocurre en el proceso de validación de instrumentos de CVRS, en elproceso de reducción de cuestionarios los métodos más utilizados han sidométodos de la TCT. Sin embargo, la literatura más actual también propone para lareducción de cuestionarios la utilización de procedimientos más modernosbasados en la TRI. Así, los objetivos generales de esta tesis son: 1) validar y/oreducir cuestionarios de CVRS mediante la combinación de métodos estadísticosde la TCT y de la TRI para evaluar así la complementariedad de dichos métodos; y2) proporcionar herramientas de medición de la CVRS científicamente validadas ycon buenas propiedades psicométricas en castellano para diferentes ámbitos de lasalud.Para llevar a cabo este trabajo, hemos seleccionado tres cuestionarios de CVRSpara tres enfermedades crónicas diferentes: obesidad mórbida, artrosis de caderay trastorno de la conducta de la alimentación (TCA). Los cuestionarios empleadosfueron el cuestionario Obesity-related Problems scale (OP) diseñado para medir elimpacto de la obesidad mórbida en el funcionamiento psicosocial, que consta deocho preguntas cubriendo un único dominio; una versión reducida delcuestionario Western Ontario and McMaster Universities Osteoarthritis Index(WOMAC), empleado para la medición de sintomatología y función en pacientescon artrosis de extremidad inferior, que consta de 11 ítems que se conforman endos factores, dolor y función; y el cuestionario Health Related Quality of Life forEating Disorders version 2 (HeRQoLEDv2), empleado para medir el impacto delTCA sobre aspectos físicos, mentales y sociales, que consta de 55 preguntas que seconforman en nueve factores.Para evaluar la fiabilidad se estudió la consistencia interna de los diferentesinstrumentos, que hace referencia a la homogeneidad de los ítems que componenResumen 3una escala. El estudio de la validez convergente y discriminante de las escalas sellevó a cabo mediante la correlación de las escalas del instrumento con las escalasde otros instrumentos, estableciendo hipótesis previas en relación a que escalasdel instrumento a validar deberían correlacionar alto o bajo con que escalas deotros instrumentos (validez convergente y discriminante, respectivamente). Elestudio de validez de grupos conocidos se llevó a cabo comparando laspuntuaciones de las escalas entre grupos de pacientes en los que se anticipaba quehubiera diferencias. La validez de estructura, que trata de realizar un análisisinterno del instrumento para comprobar que la estructura hipotética subyacentedel instrumento es correcta y adecuada, se llevó a cabo mediante métodos de laTCT y de la TRI. Los métodos de la TCT son modelos factoriales, que proporcionancombinaciones lineales de los ítems con los factores latentes que han de serestimados mediante sumas ponderadas que reflejen la importancia de cada ítem enel constructo. Las técnicas que hemos empleado son el Análisis FactorialExploratorio (AFE), el Análisis Factorial Confirmatorio (AFC), los Modelos deEcuaciones Estructurales (MEE), así como el caso específico de estos modelos paradatos categóricos. Aunque los tres casos, AFE, AFC, MEE, sirven para evaluar ladimensionalidad (número de factores) que es necesaria para representar lavariabilidad que hay en los datos, el AFC y MEE permiten además contrastar estospatrones para confirmar la validez de los constructos hipotetizados, mediantediferentes índices de bondad de ajuste. Los métodos de la TRI son modelosprobabilísticos que se basan en que un individuo con un nivel concreto de calidadde vida tendrá una cierta probabilidad de responder de forma positiva a unapregunta. Por tanto, la hipótesis subyacente en la TRI es que la respuesta a un ítemde un cuestionario depende del nivel de dificultad que el ítem presente y el nivel dehabilidad respecto al constructo del individuo que responde. Estos modelosincluyen un conjunto de asunciones entre las que se encuentra launidimensionalidad, ya que asume que los ítems de la escala son de una únicadimensión o constructo. Entre los modelos de la TRI, hemos utilizado métodospara ítems de respuesta politómica, y más concretamente el Rating Scale Model yGraded Response Model. El primero se clasifica dentro de los modelos de 1¿parámetro, ya que el único parámetro que caracteriza al ítem es su nivel de4 Resumendificultad. Y el segundo se clasifica dentro de los modelos de 2¿parámetros, ya queademás de la dificultad, también tienen en cuenta la discriminación del ítem. Porúltimo, para evaluar la sensibilidad al cambio se compararon las puntuacionesbasales y las de seguimiento, además de utilizar los tamaños del efecto para medirla magnitud del cambio.En relación a los pacientes con obesidad mórbida, se reclutaron 123 pacientes quese encontraban en lista de espera para ser intervenidos de cirugía bariátrica, y serealizó la traducción, adaptación y validación del cuestionario OP al español,estudiando su fiabilidad y validez mediante la aplicación de diferentes métodos dela TCT. Los resultados demostraron la fiabilidad, la validez convergente y la validezde grupos conocidos. La validez de estructura se analizó mediante el AFE y el AFC,obteniendo resultados muy similares, además de índices de bondad de ajuste delAFC que confirmaron la estructura subyacente del cuestionario.En la evaluación de las propiedades psicométricas del WOMAC, se seleccionarondos cohortes independientes de pacientes (788 y 445 pacientes, respectivamente)con artrosis de cadera que estaban en lista de espera para ser intervenidos deartroplastia total de cadera, a los que además se les hizo un seguimiento a los seismeses después de la intervención. Se realizó la validación de la versión reducidapropuesta del cuestionario WOMAC, estudiando la fiabilidad, validez y sensibilidadal cambio, combinando métodos de la TCT así como de la TRI en ambas cohortes depacientes. Los resultados apoyaron la fiabilidad del instrumento, la validezconvergente y la validez de grupos conocidos. Para el estudio de la validez deestructura se utilizó el AFC, que confirmó la existencia de dos factores en elcuestionario, dolor y función. Además, se aplicó el Rating Scale Model de la TRI acada una de las dos escalas, concluyendo que ambas escalas se ajustaban al modeloRasch, confirmando así la unidimensionalidad. Los resultados del AFC y del RatingScale Model fueron muy similares en ambas cohortes de pacientes, demostrandoasí la estabilidad de los resultados. Por último, los parámetros de sensibilidad alcambio demostraron grandes cambios a los seis meses de la intervención.Resumen 5En relación a los pacientes con un TCA, en primer lugar se reclutó una muestra de324 pacientes, a través de la cual se confirmó la existencia de una estructurainterna de segundo orden con dos medidas resumen en el cuestionarioHeRQoLEDv2, para así posteriormente reducir dicho cuestionario. Se hipotetizóque 40 de los ítems del cuestionario que se conformaban en siete factoresdenominados factores de primer orden, a su vez se resumían en dos factores desegundo orden. Se empleó un MEE, cuyos resultados confirmaron lamultidimensionalidad de dicho cuestionario, garantizando la existencia de dichaestructura de segundo orden con dos medidas resumen denominadas¿Adaptabilidad social¿ y ¿Salud Mental y rendimiento¿. Se aplicó el Rating ScaleModel a cada una de las escalas de forma separada para reducir cada una de las dosmedidas resumen, garantizando la unidimensionalidad, dando lugar a la versiónreducida de 20 ítems, denominada Health Related Quality of Life for EatingDisorders Questionnaire-Short Version (HeRQoLED-S). Posteriormente, se reclutóotra muestra de 377 pacientes con un TCA, a la que se realizó un seguimiento deun año, a través de la cual se realizó la validación de la versión reducidaHeRQoLED-S, combinando métodos de la TCT así como de la TRI. Por un lado, seutilizó los MEE para datos categóricos, cuyos resultados confirmaron la estructurade segundo orden del cuestionario HeRQoLED-S. Por otro lado, se aplicó el GradedResponse Model a cada una de las dos medidas resumen, cuyos resultadosdemostraron la unidimensionalidad de cada escala y la correcta capacidad dediscriminación de todos los ítems de la escala con respecto a su correspondienteconstructo latente. La validez convergente, la validez de grupos conocidos, lafiabilidad y la sensibilidad al cambio del instrumento reducido también quedarondemostradas.En vista a los resultados obtenidos podemos concluir, en primer lugar, que losmétodos basados en la TCT y los basados en la TRI son complementarios entre sí.Mientras que los primeros nos proporcionan información sobre ladimensionalidad del cuestionario, los segundos se centran en launidimensionalidad. Así, cada uno de los métodos proporciona diferente tipo desoporte en el proceso de validación y/o reducción de cuestionarios de CVRS, de6 Resumenforma que la combinación de los diferentes métodos proporciona mayor evidenciade la validez de cuestionarios de CVRS. En segundo lugar, podemos concluir que lautilización combinada de estas técnicas estadísticas ha proporcionado versionescientíficamente validadas en castellano de tres cuestionarios de CVRS, paradiferentes ámbitos de la salud, que pueden ser utilizados en la práctica clínica, asícomo entre investigadores y decisores sanitarios. Concretamente, la versiónespañola del cuestionario OP posee buenas propiedades psicométricas de validez yfiabilidad, y puede utilizarse para medir el impacto de la obesidad mórbida en elfuncionamiento psicosocial en estudios transversales. La versión reducidapropuesta del cuestionario WOMAC es fiable, valida y sensible al cambio, y puedeser utilizada para medir dolor y función en pacientes con artrosis de cadera. Laversión reducida HeRQoLED-S, posee dos medidas resumen, y es fiable, valida ysensible al cambio, proporcionando así una herramienta simple, corta y de fácilaplicación para medir la CVRS en pacientes con un TCA.