Page 129 - 76_01
P. 129
VOL. 76 (1), 45-57, 2010 APLICACIÓN DE LA TOPOLOGÍA MOLECULAR...
inferior a la varianza de la ecuación seleccionada (R2 = 0.8762) y
muy por encima del valor mínimo exigido (Q2 > 0.5000).
Los valores de pCE50 predichos en la crosvalidación para cada
compuesto aparecen en la columna 8 de la Tabla 1. Los resultados
son similares a los mostrados en la columna 7.
En una segunda etapa se realizó una validación interna dividien-
do el grupo de compuestos estudiado en cinco subgrupos (A-E) con-
teniendo cada subgrupo aproximadamente el 20% de los compuestos
analizados: serie A (1d, 1l, 2a, 2f, 2k, 3h); serie B (1e, 1k, 2b, 2g, 2l,
3i); serie C (1c, 1h, 1n, 2e, 2j, 2o); serie D (1b, 1g, 1m, 2d, 2i, 2n) y
serie E (1a, 1f, 1l, 2c, 2h, 2m). Cuatro de los cinco subgrupos (A, B,
C y D), (A, B, C y E), (A, B, D y E), (A, C, D y E) y (B, C, D y E) se
utilizarán como grupo de entrenamiento, mientras que el subgrupo
restante hará de grupo test. La ecuación de regresión obtenida con
cada grupo de entrenamiento, usando los mismos descriptores, se
utiliza para predecir la actividad de los compuestos del correspon-
diente grupo test.
La Tabla 3 muestra los valores de R2 y R2 para cada grupo de
pred
R2 R2
entrenamiento y test analizado. La variabilidad de y pred es
pequeña para cada análisis y el valor promedio obtenido tanto para
R2 como para R2 (R2 = 0.8813 y R2 = 0.8676) es similar al de la
pred pred
función seleccionada, R2 = 0.8762.
En una tercera etapa se realizó un análisis de aleatoriedad de la
función topológica seleccionada. En este caso es aconsejable hacer-
Tabla 3. Resultados del estudio de validación interna realizado al modelo de
predicción seleccionado.
Series entrenamiento Serie test R2 (entrenamiento) R2 (test)
pred
A, B, C, D y E — 0,8762
B, C, D y E A 0,8770 —
A, C, D y E B 0,8740 0,9386
A, B, D y E C 0,8739 0,8814
A, B, C, y E D 0,9016 0,8569
A, B, C, y D E 0,8853 0,8892
Promedio 0,8813 0,7720
0,8676
53