INTRODUCCION AL SPSS

 

hipertensión.sav

1) Se pide calcular para el total de pacientes:

  (a) Cuántos fueron atendidos en cada villa?

  (b) El porcentaje de hombres y de mujeres?

  (c) Que edad tenían los tres pacientes más jóvenes, y los tres de mayor edad?

 

2) Calcular para todos los pacientes:

  (a) La media y el desvío, de la edad de los pacientes?

  (b) La media y el desvío, de la presión sistólica de los pacientes?

  (c) La media y el desvío, de la presión diastólica de los pacientes?

  (d) Por último hacer tres histogramas, uno para la edad, otro para la presión sistólica, y otro para la presión diastólica. Según la forma de estos histogramas, se puede concluír que estas variables se distribuyen aproximadamente según una curva normal?

 

3) Estudiar la composición según sexo, de los pacientes atendidos en cada villa. Concretamente, averiguar el porcentaje de mujeres atendidas en cada villa?.

 

4) En la pregunta 2) se concluyó que la edad media de los pacientes es de 47.97 años,

con un desvío de 15.11 años. Ahora se pide averiguar la media y el desvío de la edad, pero no para el total de pacientes, sinó para:

 (a) las mujeres y

 (b) los varones?

 

5) Ahora interesa recodificar la variable edad en tres grupos etáreos: JOVENES (hasta 40 años), MADUROS (de 41 a 60 años), y MAYORES (61 o más años).

Averiguar el porcentaje de pacientes en cada categoría?

 

6) Se afirma que la presión sistólica aumenta con la edad del paciente.

 (a) Comprobar esta afirmación, averiguando la presión sistólica media en cada uno de los grupos etéreos de la pregunta anterior.

 (b) Analizar esto mismo para la presión diastólica?

 

7) Otra forma de analizar la relación entre edad y presión sistólica es con un gráfico de dispersión y el coeficiente de correlación.

 (a) Obtener el gráfico de dispersión y el coeficiente de correlación entre edad y presión sistólica? Como interpreta este número?

 (b) Idem para la relación entre edad y presión diastólica?

 (c) En donde es más fuerte la relación, en (a) o en (b)?

 

8) Analice ahora la relación entre presión sistólica y diastólica, y compare este resultado con los de la pregunta anterior. En que caso es más fuerte la relación?

 

titanic.sav

9) Se pide averiguar:

 (a) Que porcentaje viajaban en 1ra, 2da y 3ra clase?

 (b) En total cuántos se murieron?

 (c) Cuántos pasajeros tenían menos de un año, y cuántos no tienen informada la edad?

 (d) Calcular el número de muertos en cada clase?

 (e) Calcular el porcentaje de muertos según el sexo?

 (f) Calcular la edad media de los pasajeros en cada clase?

 (g) Si consideramos pasajeros JOVENES los de 20 o menos años, MADUROS los de más de 20 años pero menores o iguales a 40 años, y finalmente MAYORES los que tienen más de 40 años, se pide calcular el % de muertos en cada categoría?

 

10) Obtenga el histograma de la edad, y de la tarifa pagada por pasajero.

 (a) Calcule también la media y la mediana, tanto de la edad como de la tarifa.

 (b) Como indicador del “centro” de las edades de los pasajeros, que usaría la media o la mediana?

 (c) Como indicador del “centro” de las tarifas pagadas por los pasajeros, que usaría la media o la mediana?

 

 

MEDIDAS DE ASOCIACION DE LA RELACION

EXPOSICION---àENFERMEDAD

 

titanic.sav

11) Se quiere estudiar el sexo como agente causal respecto del evento “muerte” en el titanic. Concretamente considere las variables sexo (1=masculino, 0=femenino), y

estado (1=muerto,0=vivo), y la posible asociación sexo -à estado. Se pide:

 (a) Calcular el RR  del sexo masculino?

 (b) Idem el OR del sexo masculino?

 (c) Puede ser que sean tan distintos?

 (d) Cuál de ellos preferiría en un informe?

 

12) Ahora se quiere investigar la posible asociación entre la clase en que viajaba el pasajero y el evento “muerte” en el titanic. Como hay tres clases, tome  la 1ra clase como grupo de comparación, y calcule:

 (a) El RR de viajar en 2da clase? Interprete.

 (b) El RR de viajar en 3ra clase? Interprete.

 

cafe.sav

13) Se quiere estudiar la relación entre consumo de café y cáncer de boca. Como la variable café esta en pocillos diarios(0, 1, 2, y 3 o más), recodifiquela así: caf = 0, si no toma café, y caf= 1 si toma café. Se pide:

 (a) Calcular el RR de tomar café respecto de contraer cáncer de boca?

 (b) Calcule el AR?

 (c) Este último dio 0.49. Le parece razonable la propuesta de prohibir la importación de café (sugerida por un importador de té), para, de esta manera, reducir en un 49% el cáncer de boca en la población?

 

us1991.sav

14) En un estudio poblacional realizado en EEUU se analizó el total de nacimientos en el año 1991. Para cada uno de ellos, al momento del nacimiento se registró , el estado civil de la madre (soltera o no), y  si el niño nació con bajo peso( o sea menor a 2500 gr),  Además, se registró el estado del niño un año después (muerto o vivo).

Se quiere evaluar la posible asociación entre la situación de soltera de la madre, y el estado del niño un año después ; y también la asociación entre bajo peso al nacer y su estado un año después.

O sea estudiar el efecto de dos posibles agentes causales (madre soltera y bajo peso) sobre el estado del niño al año de nacer.

Se pide calcular:

 (a) El RR para los posibles agentes causales madre soltera y bajo peso, e interprete.

 (b) Idem pero los OR, e interprete.

 (c) A que se deberá que los RR son tan parecidos a los OR?

 (d) Calcule los ER, e interprete.

 (e) Calcule los AR, e interprete.

 (f) Será ser madre soltera un agente causal?. Lo será el bajo peso?

 

15) Se esta investigando el efecto de un posible agente causal E, sobre dos enfermedades D1y D2. Suponga que se dispone de la siguiente información:

 

 

D1

 

 

 

 

D2

 

 

E

  5

995

  1000

 

E

300

700

1000

Ē

1

999

  1000

 

Ē

200

800

1000

 

6

1994

2000

 

 

500

1500

2000

 

Se pide:

 (a) Calcular RR en los dos casos. Cuál de las dos enfermedades D1 o D2, esta más

asociada con la exposición al agente E?

 (b) Suponiendo que E es realmente un agente causal, desde el punto de vista de las políticas de salud pública, sobre cuál de las enfermedades D1 o D2, tiene mayor impacto el agente E?

 

16) Ahora se esta investigando el efecto de tres posibles agentes causales E1, E2 y E3, sobre una misma enfermedad D. Para ello se tomó una muestra de 1000 individuos de la población, y luego se elaboraron las siguientes tablas de 2x2:

 

 

D

 

 

 

 

D

 

 

 

 

D

 

 

E1

  50

  50

  100

 

E2

120

380

 500

 

E3

 190

710

  900

Ē1

150

750

  900

 

Ē2

  80

420

 500

 

Ē3

   10

  90

  100

 

200

800

1000

 

 

200

800

1000

 

 

 200

800

1000

 

 (a) Calcular RR en los tres casos. Cuál de los tres posibles agentes causales E1 ,E2 o E3 esta más asociado con la enfermedad D?

 (b) Procediendo como en el problema anterior, y suponiendo que las exposiciones E1, E2 y E3 sean realmente agentes causales sobre D, desde el punto de vista de las políticas de salud pública,  cual de los agentes causales le parece de mayor impacto?

 

SIGNIFICACION E INTERVALOS DE CONFIANZA

 

wcgs.sav

17) En este estudio poblacional la intención fué estudiar varios factores de riesgo y su posible relación con la enfermedad coronaria. Para ello se registró al principio del estudio información sobre varias variables, entre ellas tipo de comportamiento (comport), binaria ,con   tipo A: agresivo y competitivo, y tipo B: relajado y no competitivo. Luego de un seguimiento de 10 años se registro la presencia o no, de enfermedad coronaria (chd).

 (a) Calcular el RR del comportamiento  agresivo y competitivo respecto de la presencia de enfermedad coronaria.

 (b) Evaluar la significación de este RR.

 (c) Hallar un intervalo de confianza al 95%, para el RR?

 (d) Estimar y hallar un intervalo de confianza al 95% para AR.

 

pancreas.sav  (casos y controles)

18) Se quiere investigar el consumo de café como factor de riesgo respecto del cáncer de páncreas. Como en el archivo el consumo de café está registrado en forma ordinal (0, 1-2, 3-4, y más de 5 pocillos diarios), cree una variable nueva, caf, que valga 1 si la persona consume café diariamente, y 0 en caso contrario. Se pide:

 (a) Calcular el OR de el consumo de café, como factor de riesgo respecto del cáncer de páncreas.

 (b) Evaluar la significación de este OR.

 (c) Hallar un intervalo de confianza al 95%, para el OR?

 (d) Si es posible, estimar AR y hallar un intervalo de confianza (aproximado) al 95% para AR.

 

esofago.sav (casos y controles)

19) Esta es una investigación de casos y controles realizado por Tuyns (1977), para estudiar factores de riesgo sobre el cáncer de esófago. Uno de los factores de riesgo investigados es el consumo diario de alcohol (en gr/día). Esta variable está grabada en 4 categorías: 0-39, 40-79, 80-119, y 120 o más, sin embargo, recodifíquela en dos, según el consumo diario de alcohol sea alto: 80 o más, o, bajo: menor que 80 gr/día.

(a) Calcular el OR de alto consumo de café, como factor de riesgo respecto del cáncer de esófago.

 (b) Evaluar la significación de este OR.

 (c) Hallar un intervalo de confianza al 95%, para el OR?

 

CONTROL DE FACTORES EXTRAÑOS

 

20) Se quiere estudiar el sexo como factor de riesgo respecto de cierto tipo de cáncer. Para ello se tomó una muestra al azar de 700 individuos de entre 65 y 85 años, de cierta localidad, registrando información respecto del sexo, y del tipo de cáncer investigado.  Se confeccionó la siguiente tabla de 2x2:

 

 

Cáncer

----

 

Hombre

60

 140

200

mujer

    45

 455

500

 

  105

 595

700

 

(a) Calcular el RR del sexo masculino, respecto del cáncer investigado.

Se sospecha que la edad puede ser una variable que “confunda” la asociación hallada, entre sexo y cáncer. Para analizar este tema, se clasifican los individuos según edad, en jóvenes (65 a 75 años) y mayores (75 a 85 años) y se construyen las tablas:

 

JOV

Cáncer

----

 

 

 

MAY

Cáncer

----

 

Hombre

    50

   50

100

 

 

Hombre

    10

   90

100

mujer

    25

   75

100

 

 

mujer

    20

 380

400

 

    75

 125

200

 

 

 

    30

 470

500

 

(b) Calcular ahora los RR en cada estrato. En este caso son iguales.

      Aplicando el test de homogeneidad de Wolf, que nivel de significación da?

(c) Calcule el RR en pool de Mantel y Haenszel.

(d) Cuál RR utilizaría? Y halle un intervalo de confianza al 95%.

 

21) Se quiere estudiar la residencia rural como factor de riesgo respecto del Bocio endémico en la provincia de Neuquén. Para ello se tomó una muestra de 335 pacientes con Bocio y 850 controles, registrando información respecto de residencia(rural o urbana), y otras variables como clase socioeconómica, edad, sexo etc. Se confeccionó la siguiente tabla de 2x2:

 

 

BOC

control

 

RURAL

 170

298

 468

urbana

 165

550

 715

 

 335

850

1183

 

(a) Calcular el OR de la la residencia rural, respecto del bocio endémico.

Se sospecha que la clase socioeconómica del encuestado puede ser una variable que altere la asociación hallada, entre residencia y bocio. Para analizar este tema, se clasifican los individuos según clase socioeconómica, en alta y baja, y se construyen las tablas:

 

ALTA

BOC

control

 

 

 

BAJA

BOC

control

 

RURAL

  90

180

270

 

 

RURAL

  80

  118

198

urbana

150

450

600

 

 

urbana

  15

  100

115

 

240

630

870

 

 

 

  95

   218

313

 

(b) Calcular ahora los OR en cada estrato. Serán iguales los OR, en las poblaciones

     de estos estratos? Con que nivel de significación?

(c) Calcule el OR en pool de Mantel y Haenszel . Tiene sentido?

(d) Cuál OR utilizaría? y calcule los correspondientes intervalos de confianza al 95%.

 

pancreas.sav  (casos y controles)

22) Se quiere investigar el consumo de café como factor de riesgo respecto del cáncer de páncreas. Como en el archivo el consumo de café está registrado en forma ordinal (0, 1-2, 3-4, y más de 5 pocillos diarios), cree una variable nueva, caf, que valga 1 si la persona consume café diariamente, y 0 en caso contrario.

Se piensa que el sexo puede ser un “confounding” de la relación entre el consumo de café y el cáncer de páncreas. Y esto debido a que:

        ♦ Existe una asociación entre sexo y cáncer de páncreas, ya que esta enfermedad es

           más frecuente en los hombres.

        ♦ Podría también existir una asociación entre sexo y consumo de café

Se pide:

(a) Calcular el OR global de la asociación entre café y cáncer de páncreas. Es significativa esta asociación?

(b) Estratificar según sexo, y calcular los OR en cada estrato.

(c) Le parece que el sexo interactúa con la relación café --à cáncer de páncreas?

   Es significativa esta interacción?

(d) Ahora bien, aceptando que no hay interacción ¿Cuánto vale el OR en pool de Mantel & Haenszel?

(e) Le parece importante la “confusión” aportada por el sexo?

(f) Cuál OR utilizaría el global o el de Mantel y Haenszel?

 

esofago.sav (casos y controles)

23) Esta es una investigación de casos y controles realizado por Tuyns (1977), para estudiar factores de riesgo sobre el cáncer de esófago. Uno de los factores de riesgo investigados es el consumo diario de alcohol (en gr/día). Esta variable está grabada en 4 categorías: 0-39, 40-79, 80-119, y 120 o más, sin embargo, recodifíquela en dos, según el consumo diario de alcohol sea alto: 80 o más, o, bajo: menor que 80 gr/día.

(a) Calcular el OR de alto consumo de alcohol, como factor de riesgo respecto del cáncer de esófago.

Ahora, en este problema se quiere analizar que efecto tiene sobre la asociación alcohol-cáncer de esófago, la variable edad.  Para ello, primero recodifique edad en dos categorías: Jóvenes (hasta 54 años), y Mayores (desde 55 años).

(b) Calcule los riesgos en cada estrato de edad. Le parece que la edad interactua con la relación entre alcohol-cáncer de esófago? (averigüe el valor de p).

 (c) Ahora bien, suponiendo que no hay interacción ¿Cuánto vale el OR en pool de Mantel & Haenszel?   

(d) Le parece importante la “confusión” aportada por la edad? 

(e) Cuál OR utilizaría el global o el de Mantel y Haenszel? 

 

titanic.sav

24) Se quiere estudiar el sexo como posible agente causal respecto del evento “muerte” en el titanic. Concretamente considere las variables sexo (1=masculino, 0=femenino), y

estado (1=muerto,0=vivo), y la posible asociación sexo -à estado. Se pide:

 (a) Calcular el RR  del sexo masculino? 

Ahora, en este problema se quiere analizar que efecto tiene sobre la relación entre sexo-fallecimiento, la variable clase en que viajaba el pasajero.

 (b) Calcule los riesgos en cada estrato de clase. Le parece que la clase interactua con la relación entre sexo-fallecimiento? (averigüe el valor de p).

(c) Conviene utilizar el RR de Mantel y Haenszel?  

(d) Que riesgos y que intervalos de confianza informaría?

(e) Viendo los resultados obtenidos, si Ud es hombre y planea hacer su viaje de bodas en el Titanic, en que clase le conviene viajar?

 

 

 

RESULTADOS

1) (a) 32,41,64,59,53,40,57,35

    (b) 67.7% hombres y 32.3% mujeres

    (c) 15,17,17 y 95,100,100

 

2) (a) 47.97 y 15.11

    (b) 132.99 y 25.716

    (c)  84.23 y 14.354

    (d)  solo aproximadamente

 

3)  59.4%, 73.2%, 60.9%, ……., 57.1%

 

4) (a) 45.05 y 14.595 años

    (b) 54.09 y  14.38 años

 

5) 35.7%, 44.1%, 20.2%

 

6) (a) 123.52,  136.29,  142.53

    (b)  80.4,  86.23,  86.62

 

7) (a) r = 0.302

    (b) r = 0.196

    (c) en (a)

 

8) r = 0.785

 

9) (a) 24.7%,  21.2% y  54.2%

    (b) 809

    (c) 12 y 263

    (d)  23, 158 y 528

    (e)  para F 27.3%, para M  80.9%

    (f)  39.1599, 29.5067 y  24.8164

    (g) en jóvenes 54%, en maduros 60.9% y en mayores  60.4%

 

10)  (a) para edad, media = 29.88  mediana = 28

            para tarifa, media = 33.29  mediana = 14.45 

       (b) la media

       (c) la mediana

 

11) (a) RR = 2.968

      (b) OR = 11.30

      (c) La condición para que sean “parecidos” es que

            Riesgo en los Expuestos + Riesgo en los No Expuestos < 0.1

            y aquí es:

            Riesgo en los Expuestos =         682/843 = 0.809

            Riesgo en los No Expuestos =   127/466 = 0.273

            O sea, no estamos en el caso de una “enfermedad rara”, y por lo tanto

            el RR y el OR, pueden diferir mucho como en este caso.    

       (d) El diseño de el Titanic, es claramente transversal. Entonces se podría

             utilizar tanto el RR como el OR. Sin embargo, ya que su interpretación

             es más simple, conviene el RR.

 

12) (a) RR = 1.497 (el riesgo de muerte en 2da clase es 1.5 veces el de 1ra clase)

      (b) RR = 1.955 (el riesgo de muerte en 3ra clase es 2 veces el de 1ra clase)

 

13) (a) RR = 2.077

      (b) AR = 0.49

            Notar que en este estudio tenemos en total 1010 personas.

            Pero algunos toman café y otros no.

            En los que toman café, el 38.5% tiene cáncer.

            En los que no toman café, solo el 18.5% tiene cáncer.

            Si pudiésemos lograr que nadie tome café,  el 18.5% del total tendría cáncer,

            o  sea, 18.5% de 1010 =  187 personas.

            Pero  como hay 367 personas con cáncer, esto quiere decir que tenemos un

            plus de 180 (367 – 187 =  180) personas con cáncer, debido al consumo

            de café, o sea 180/367 = 0.49, el AR.

        (c) El problema está en lo subrayado. Supongamos que el verdadero agente causal

              sea la cafeína, y eliminamos la venta de café. Posiblemente los consumidores

              de café resuelvan reemplazarlo por té, que tiene igualmente cafeína, y entonces

              el % de cánceres no se reduciría al 18.5%.

 

14) (a) RRms = 2.123   RRbp = 19.04

      (b) ORms = 2.139   ORbp = 20.44

      (c) En el caso de la posible asociación msà estado, RRms y ORms son parecidos

            ya que  P(muerto/soltera) + P(muerto/casada) = 0.014 + 0.006  < 0.1.

            En el caso de la posible asociación bpà estado, RRbp y ORbp son parecidos

            ya que  P(muerto/bp) + P(muerto/NO bp) = 0.072 + 0.004  < 0.1.

      (d) ERms = 0.00728  ERbp = 0.0682

      (e) ARms = 0.249  ARbp = 0.561

      (f) Ser madre soltera no parece ser agente causal. Quizás sí, el bajo peso al nacer.

 

15) (a) RR1 = 0.005/0.001 = 5, RR2= 0.30/0.20 = 1.5

            La asociación es mayor con D1.

      (b) Suponiendo que ambas enfermedades son similares en gravedad y

            consecuencias, el mayor impacto es sobre D2. Ya que:

            AR1=0.666  AR2=0.200, pero AR1*6=4 y AR2*500=100

 

16) (a) RR1 = 3,  RR2 = 1.5,  RR3 = 2.11.

            La mayor asociación es con E1.

      (b) Una política de salud pública, actuando sobre E3, logrará más efectividad.

            Esto se comprueba con los riesgos atribuibles:

            AR1 = 0.16   AR2 = 0.20   AR3 = 0.50.

 

17) (a) RR = 2.219

      (b) p = 0.000 (significativo)

      (c) [1.718 ; 2.865] al 95%

      (d) AR = 0.38,   [0.26 ; 0.48] al 95%

 

18) (a) OR = 2.75

      (b) p = 0.000 (significativo)

      (c) [1.662 ; 4.552] al 95%

      (d) Siendo un diseño de Casos y Controles, no es posible estimar AR en forma 

            aproximada, ya que no se cumple el requisito de enfermedad poco frecuente

            (P(D/E) + P(D/noE) < 0.1).

 

19) (a) OR = 5.64

      (b) p = 0.000

      (c) [4; 7.95] al 95%

 

20) (a) RR = 3.33

      (b) RRj = 2 ,  RRm = 2 , p = 1

      (c) RRmh = 2

      (d) Usaria el de Mantel y Haenszel,

           con intervalo de confianza [1.416 ; 2.824] al 95%

 

21) (a) OR = 1.90

      (b) ORa = 1.5 ,  ORb = 4.519. No son iguales con p = 0.001.

      (c) ORmh = 1.965 pero no tiene sentido.

      (d) ORa = 1.5      con [1.096 ; 2.051] al 95%

           ORb = 4.519  con [2.449 ; 8.338] al 95%

 

22) (a) OR = 2.75 , la asociación es significativa (p = 0.000)

      (b) ORf = 2.545 , ORm = 2.676

      (c) No interactúa ya que p = 0.928 > 0.2

      (d) ORmh = 2.601

      (e) no es muy importante, ya que sin corregir OR = 2.75, y corrigiendo 2.601.

      (f)  si se presta atención a los intervalos de confianza de los OR sin corregir,

            y el corregido, se notará que son de amplitud similar (esto no siempre es

            así). Por lo tanto es conveniente usar el corregido, o sea ORmh.

 

23) (a) OR = 5.64

      (b) ORjov = 7.355 , ORmay = 4.851 , no interactua con p = 0.27

      (c) ORmh = 5.568

      (d) no es importante

      (e) son muy parecidos, podría usar el de Mantel y Haenszel.

 

24) (a) RR = 2.968

      (b) RR1° = 18.98 , RR2° = 7.54 , RR3° = 1.66 , sí interactúa (p = 0.000)

      (c) decididamente no

      (d) los de (b) con intervalos [7.97;45.2]  [4.41;12.89]  [1.45;1.907] al 95%

      (e) en 1ra, salvo que se deje confundir por los “engaños” de la estadística.