Page 74 - 78_04
P. 74

QYANETSY	
  MACHADO	
  TUGORES	
  &	
  col	
  

	
  
núcleos	
   bases	
   nuevos,	
   pero	
   sí	
   garantiza	
   que	
   aquellos	
   que	
   pasen	
   estos	
   filtros	
  
estarán	
  en	
  el	
  dominio	
  de	
  aplicabilidad	
  de	
  los	
  modelos	
  utilizados	
  para	
  la	
  predicción.	
  

	
  

                  100,00

                   95,00

                   90,00

                   85,00

                   80,00

                   75,00

                   70,00
                                 12 345 67
                                                                  Grupos
                                                           SE SP (15%)

Figura	
  2.-­-	
  Resultados	
  de	
  la	
  VC	
  del	
  modelo	
  37	
  dejando	
  el	
  15%	
  fuera	
  de	
  la	
  SE.	
  

	
  

        Existen	
   modelos	
   publicados	
   por	
   nuestro	
   grupo	
   para	
   la	
   selección	
   de	
  
antimaláricos,	
  pero	
  estos	
  carecen	
  de	
  un	
  adecuado	
  dominio	
  de	
  aplicación	
  (10)	
  y	
  no	
  
han	
   sido	
   obtenidos	
   con	
   la	
   mezcla	
   de	
   todos	
   los	
   índices	
   (lineales,	
   bilineales	
   y	
  
cuadráticos).	
   Nosotros,	
   incluimos	
   en	
   la	
   SE	
   sólo	
   moléculas	
   con	
   IC50<20	
   µM	
   como	
  
activas,	
   permitiendo	
   con	
   este	
   punto	
   de	
   corte,	
   identificar	
   sustancias	
   con	
   una	
  
potencia	
   adecuada.	
   Por	
   primera	
   vez,	
   se	
   fusionaron	
   los	
   modelos	
   individuales	
  
mejorando	
  los	
  parámetros	
  estadísticos	
  de	
  los	
  mismos.	
  	
  

        En	
   el	
   problema	
   de	
   la	
   modelación	
   molecular,	
   es	
   típico	
   que	
   exista	
   gran	
  
cantidad	
   de	
   casos	
   parecidos	
   con	
   clases	
   diferentes,	
   que	
   hace	
   difícil	
   encontrar	
   los	
  
patrones	
  que	
  caracterizan	
  cada	
  una	
  de	
  las	
  clases	
  del	
  problema.	
  	
  

        Por	
   esto,	
   surge	
   la	
   idea	
   de	
   usar	
   un	
   sistema	
   que	
   combine	
   varios	
   modelos	
   de	
  
clasificadores	
   en	
   un	
   SMC	
   (44).	
   _ENREF_248.	
   Una	
   de	
   las	
   condiciones	
   para	
   obtener	
  
buenos	
   clasificadores	
   de	
   base	
   es	
   lograr	
   la	
   diversidad	
   de	
   los	
   mismos	
   (35),	
   por	
   ello	
  
se	
  realizó	
  un	
  estudio	
  de	
  diversidad	
  con	
  los	
  37	
  modelos	
  obtenidos	
  que	
  nos	
  permitió	
  
obtener	
   un	
   menor	
   número	
   de	
   clasificadores	
   a	
   combinar,	
   no	
   tomando	
   en	
  
consideración	
   aquellos	
   que	
   coincidieran	
   en	
   la	
   información	
   brindada.	
   En	
   este	
  
análisis	
   de	
   diversidad	
   se	
   seleccionaron	
   los	
   12	
   modelos	
   que	
   maximizaron	
   el	
   valor	
  
promedio	
   del	
   D	
   y	
   minimizaron	
   el	
   valor	
   promedio	
   del	
   DF	
   como	
   medidas	
   de	
  
diversidad.	
  	
  

        Una	
   vez	
   que	
   se	
   seleccionaron	
   los	
   modelos	
   con	
   mayor	
   diversidad	
   se	
   realizó	
  
el	
   análisis	
   del	
   voto	
   no	
   ponderado.	
   Los	
   12	
   modelos	
   más	
   diversos	
   se	
   combinaron	
  	
  

470	
  

	
  
   69   70   71   72   73   74   75   76   77   78   79