4. Determinación de tamaños muestrales
diapo87
threshold es un valor de tasa a partir del cual tenemos una Se y Sp.
un IC suponiendo que tenemos una cantidad suficiente de datos como para asignar métodos asintóticos. En casos de enfermos y sanos no siempre tenemos esta situación.
la salida da tanto el AUC como su IC. y para ese pto de corte la sensi, etc. todas las propiedades de una pd.
ese pto de youden nos dice que tal pero, ¿cómo de buena o mala es esta prueba?
en el 68.% de los individuos de esa prueba, tendrían el valor positivo de la prueba. en otros estudios se podrian tener estimaciones e esa proporcion que varían entre un 58.5 % y un 77.8 %. y añadiriamos palabrería de si es válido o no
la sensi y la especi solo sirven cuando sabemos los resultados reales. pero lo interesante para la persona que tiene que hacer el diagnóstico es cuando nos sabemos el valor real de enfermo o sano, es decir, los valores predictivos.
diapo91
el comportamiento de esa pd en H y M no tienen una distribución similar. si bscamos a ojo un punto de discriminacion en ambas graficas, en mujeres parece que podríamos encontrar algo pero en hombres no.
sin distinguir individuos nosotros asignamos un resutlado positivo cuando el valor de la prueba (tasa de algo) era igual o superior a 37. empezamos un anaisis por separado.
comenzamos mirando la estimacion de la curva roc. una es una estimacion hecha con 37 individuos y otra hecha con 81, existe diferencia entre los tamños delas muestas.
si cogiese una muestra de dos valores en las mujeres (sin saber cual de cual) y digo que el mas alto es la anferma acertaría en un 81.82 % de las veces <- este es el comportamiendo de la muestra puntual, la cual siempre pero aun más en una estimacion con tan poca muestra, en ineficiente.
todas las conclusiones cogidas con pinza y sería necesario una muestra más alta. lo que nos lleva a pensar el tamaño muestral apropiado.
a parte de estimar deberíamos calcular el tamaño n necesario y valorar si estamos muy lejos o no de ese tamaño.
la sensi muejres no puede descartar que asociando al azar entre enfermas o sanas diera un resultado distinto, ya que el 0.5 está dentro del IC.
en especi en mujeres ha mejorado, ya que la estimacion puntual es más alta.
en hombres el pto de corte es similar al anterior (lo cual tiene logica ya que la muestra conjunta era casi todo hombres)
la sensi es similar en mujeres, hombre y conjutna. el auc es mas baja que en la conjunta puntual,ente. aunque el ic no es tan amplia como en mueres tb es amplio. aparentemente hay mucha variabilidad intrinseca en los hombres pq el tamaño muestral es mayor pero la amplitud es similar
el objetivo no es trabajar con estas 141 personas. sino con la infor de estas 141 poder aplicar lsa conclusiones a otras personas o estudios, por lo que las conclusiones deben de estar fuertemente respaldadas.
si cambiamos el método: la curva roc obviamente es la misma, solo cambia el pto de corte optimo seleccionado.
los ic tocan al 0.5, algo mas que el azar hay en esta prueba (literal que esa ha sido su explicacion)
de la sensi dudabamos antes de tener una sensi que se alacnzase por zar. las dos prob de clasificacion podriamos admiitir que tanto una como la otra conseguimos esos resultados si hicieramos la clasificacion al azar.
elegir entre los dos puntos de corte: elegir un método u otro es antes de tomar resultados. no tomar uno u otro al azar en funcion de los resuktados
uno quiere que la se y sp sean iguales y grandes
4. Determinación de tamaños muestrales
antes era fijando la anchura de un IC. tb podríamos hacerlo ahora, pero nos interesa una metodlogia que consiste en hacer un contraste de hipotesis y tener un tamaño muestra para cierta potencia dada.
en estudios clinicos se pone en h1 la que a uno le gustaría. así cuando rechaces h0 dices “estabas protegida y mira, te he conseguido descartar”, “tengo una significatividad suficientemente grande para rechazarte”
a parte de esa confianza, los h tiene una potencia: prob de rechazar H0 cuando es falsa. queremos que sea máxima.
Obuchowski (1998) Li and Fine (2004) revisan la metodología bajo diferentes supuestos
cualquier tipo de pd que no sea binaria, lo que hacemos con un pto de corte es hacerla binaria.
diapo95
tamaños muestrales pra casos y orta para controles que garanticen niveles mínimos para la sensi y especi de la pd.
\(\hat{Se} \ge TPF_0 \quad \text{(1 - fraccion de falsos negativos)}\) \(\hat{Sp} \ge 1 - FPF_0 \quad \text{(1 - fraccion de falsos positivos)}\)
valor minimo que estoy dispuesto asumir para la sensi
“busco unos tamaños muestrales pata que la sensi de la prueba sea eta y la especi de la prueba sea esta”
si la especi quiero cmoom minimo este valor, entonces 1 - Sp quiero que como mucho sea 1-ese valor. cambiamos el valor minimo por una cota máxima.
\[H1: Se < TFP_0 \quad \cup \quad 1 - Sp > FPF_0\] \[H1: Se \ge TFP_0 \quad \cap \quad 1 - Sp \le FPF_0\]
diapo95
Región crítica: {\(\text{RegCrít}_{\alpha} = \left\{ FPF_{U}^{\alpha^*} < FPF_0, \, TPF_{L}^{\alpha^*} > TPF_0 \right\}\)}
rc cuadrada y queremos una confianza de aplha, tendríamos confianza de alpha^2. de ahí sale el alpha estrella.
deciamos que todos los estimadores (no se cuaes) se comportaban como una binomial. vamos a trabajar con esa idea
numeor de enfermos y sanos se refieren a las pruebas que vamos a hacer: \(n_D, n_{\over{D}}\)
el comportamiento de estas variables se aproxima sintoticamente a una distribucion normal
- para conseguir casos y controles, fijados niveles minimos de se y sp tengo unos valores inciales
- compruebo si esos valores iniciales me conducen a una potencia mayor o igual a la que quiero.
una condicion sobre la potencia de un contraste donde se supone que el valor de beta es un valor fijado por nosotros.
mediante simulacion reproduzco marcando los valoers minimos de sensi y speci con los n_D y n_overD que he marcado antes.
creo dist binomial y cuento cuantas veces tengo una etimacion para esos FPF_apha
dos valores que son los que tomamos asumiendo que la h0 es falsa. tomo dos valores dentro de la RC: \((FPF_1, TPF_1) \rightarrow\) generamos muestras de tamaños \(n_D\) y \(n_{\over{D}}\)
suponemos que partimos de un valor de la sensi y la especi y ahora simulamos con ese valor.
simulo falsos positivos con una binomial de n=casos y prob= falso positivo
si estoy en RC es 1, sino 0.
así para un n de muestras grande
para estimar la potencia cuento cuántas muestras me han llevado a estimaciones dentro de la rc partiendo de una H0 falsa,
si esa potencia está por encima del requisito esos tamaños muestrales nos sirven.
si no, aumentamos los tamaños muestrales y volvemos a calcular.
Ejemplo 2.11.
lo que yo quiero es: tener sensi de 0.9 y especi de 0.95
un valor dentro de la RC. y dos valores que coforman los limites de esa RC.
\(H0: Se < 0.75 \cup 1 - Sp > 0.2\) \(H0: Se \ge 0.75 \cap 1 - Sp \le 0.2\)
\(\hat{Se} \ge TPF_0 = 0.75 -> TPF_1 = 0.9\) \(\hat{Sp} \ge 1 - FPF_0 = 0.2 -> FPF_1 = 0.05\)
Región crítica: {\(\text{RegCrít}_{\alpha} = \left\{ FPF_{U}^{\alpha^*} < 0.2, \, TPF_{L}^{\alpha^*} > 0.75 \right\}\)}
determino asitntoticamente los valores indiales para n_D y para n_overD
hacemos al calculo de esa normal asintotica y esos valores, y los tamaños de las meustras son 64 y 46.
generamos muestras de tamañaos 64 para los enfermos y 46 para los sanos.
hacemos la matriz correspondiente y determinamos las expresiones de la diapo95 (donde sale el dibujito de la RC)
calculamos beta:´´voy sumando en cuántas de esas muestras los valores estumados de fL y fU está dentro de la RC
0.87 – hay que repetir e ir incrementando. al llegar a 50 casos y x controles consigue la potencia
70 y 50 le daban
muestra mas grande con misma proporcion de FP y FN.
el primer paso es usar la dist asintotica normal para tener tañaos de partida
puede haber más de una solucion, ya que matematicamente podemos ir aumentando de uno en uno tanto los sanos como los controles, pero tb (si estamos cerca de la potencia deseada, claro*) podemos aumentar de dos en dos sanos y de uno en uno enfermo: a criterio de cada uno, tb dependiendo de si es muy difícil encontrar sanos o enfermos, etc.
- si estamos cerca de la potencia mínima deseada seguramente valga con aumentar pocas personas. si estamos muy lejos seguramente necesitemos mucha más muestra y quedaría raro si aumentamos mucho unos y muy pocos otros.