Page 129 - 76_01
P. 129

VOL. 76 (1), 45-57, 2010                         APLICACIÓN DE LA TOPOLOGÍA MOLECULAR...

inferior a la varianza de la ecuación seleccionada (R2 = 0.8762) y
muy por encima del valor mínimo exigido (Q2 > 0.5000).

    Los valores de pCE50 predichos en la crosvalidación para cada
compuesto aparecen en la columna 8 de la Tabla 1. Los resultados
son similares a los mostrados en la columna 7.

    En una segunda etapa se realizó una validación interna dividien-
do el grupo de compuestos estudiado en cinco subgrupos (A-E) con-
teniendo cada subgrupo aproximadamente el 20% de los compuestos
analizados: serie A (1d, 1l, 2a, 2f, 2k, 3h); serie B (1e, 1k, 2b, 2g, 2l,
3i); serie C (1c, 1h, 1n, 2e, 2j, 2o); serie D (1b, 1g, 1m, 2d, 2i, 2n) y
serie E (1a, 1f, 1l, 2c, 2h, 2m). Cuatro de los cinco subgrupos (A, B,
C y D), (A, B, C y E), (A, B, D y E), (A, C, D y E) y (B, C, D y E) se
utilizarán como grupo de entrenamiento, mientras que el subgrupo
restante hará de grupo test. La ecuación de regresión obtenida con
cada grupo de entrenamiento, usando los mismos descriptores, se
utiliza para predecir la actividad de los compuestos del correspon-
diente grupo test.

    La  Tabla  3  muestra         los  valores   de  R2     y  R2         para  cada   grupo        de
                                                                    pred
                                                                                R2     R2
entrenamiento     y  test    analizado.          La  variabilidad         de        y       pred    es

pequeña para cada análisis y el valor promedio obtenido tanto para

R2  como  para    R2         (R2  =  0.8813   y  R2         =  0.8676)    es    similar  al     de  la
                       pred                           pred
función seleccionada, R2 = 0.8762.

    En una tercera etapa se realizó un análisis de aleatoriedad de la
función topológica seleccionada. En este caso es aconsejable hacer-

Tabla 3. Resultados del estudio de validación interna realizado al modelo de
predicción seleccionado.

Series entrenamiento              Serie test     R2 (entrenamiento)                 R2          (test)
                                                                                          pred
     A, B, C, D y E                    —                   0,8762
        B, C, D y E                     A                  0,8770                         —
        A, C, D y E                     B                  0,8740                      0,9386
        A, B, D y E                     C                  0,8739                      0,8814
       A, B, C, y E                     D                  0,9016                      0,8569
       A, B, C, y D                     E                  0,8853                      0,8892
         Promedio                                          0,8813                      0,7720
                                                                                       0,8676

                                                                                                    53
   124   125   126   127   128   129   130   131   132   133   134