Page 28 - 79_04
P. 28

Perspectiva	
  general	
  sobre	
  el	
  proceso	
  de	
  desarrollo	
  de	
  fármacos…	
  

	
  
cognitivo	
  acerca	
  de	
  cuales	
  de	
  ellos	
  son	
  mejores,	
  no	
  importa	
  cuales	
  dos	
  objetos	
  uno	
  
compare,	
   todo	
   resultará	
   igualmente	
   similar	
   (disimilar)	
   (80).	
   En	
   este	
   sentido,	
  
algunos	
  investigadores	
  de	
  la	
  química	
  medicinal	
  han	
  planteado	
  que	
  no	
  tiene	
  sentido	
  
hablar	
  de	
  diversidad	
  sin	
  un	
  sistema	
  de	
  referencia,	
  que	
  está	
  dado	
  en	
  este	
  caso	
  por	
  el	
  
ensayo	
  biológico	
  (81).	
  Una	
  estrategia	
  para	
  solucionar	
  esta	
  dificultad	
  es	
  seleccionar	
  
un	
   conjunto	
   de	
   descriptores	
   en	
   particular	
   para	
   los	
   cuales	
   se	
   demostró	
   que	
  
funcionan	
  bien	
  en	
  un	
  cierto	
  problema.	
  Otra	
  estrategia	
  es	
  calcular	
  primero	
  un	
  gran	
  
número	
   de	
   descriptores	
   y	
   luego	
   eliminar	
   aquellos	
   descriptores	
   del	
   conjunto	
   que	
  
muestran	
   un	
   coeficiente	
   de	
   correlación	
   por	
   encima	
   de	
   cierto	
   valor.	
   Un	
   enfoque	
  
diferente	
   es	
   dejar	
   que	
   la	
   computadora	
   escoja	
   la	
   combinación	
   óptima	
   de	
  
descriptores	
  para	
  el	
  problema	
  en	
  cuestión	
  (82).	
  

        Numerosos	
   métodos	
   automáticos	
   han	
   sido	
   propuestos	
   en	
  
quimioinformática	
  para	
  la	
  selección	
  de	
  rasgos,	
  por	
  ejemplo,	
  la	
  técnica	
  paso	
  a	
  paso	
  
de	
  los	
  procesos	
  de	
  integración	
  hacia	
  adelante	
  o	
  eliminación	
  hacia	
  atrás	
  y	
  el	
  análisis	
  
de	
   componentes	
   principales	
   (83);	
   también	
   ha	
   sido	
   propuesto	
   el	
   uso	
   de	
   los	
   k-­-
vecinos	
   más	
   cercanos	
   (84).	
   Otros	
   métodos	
   de	
   selección	
   más	
   usados	
   en	
   la	
  
modelación	
   REA	
   se	
   encuentran	
   la	
   selección	
   secuencial	
   hacia	
   delante	
   (Sequential	
  
Feature	
   Forward	
   Selection),	
   la	
   eliminación	
   secuencial	
   hacia	
   atrás	
   (Sequential	
  
Feature	
   Backward	
   Elimination),	
   el	
   recocido	
   simulado	
   (Simulated	
   Annaeling)	
   y	
   la	
  
selección	
   basada	
   en	
   algoritmos	
   genéticos,	
   siendo	
   esta	
   última	
   una	
   de	
   las	
   más	
  
eficientes	
  en	
  el	
  campo	
  de	
  modelación	
  REA	
  (85).	
  

        En	
   el	
  pasado,	
  algunos	
  enfoques	
  estaban	
  directamente	
  relacionados	
  con	
  las	
  
Redes	
  Neuronales	
  Artificiales,	
  como	
  son:	
  división	
  de	
  los	
  pesos	
  (86),	
  correlación	
  en	
  
cascada	
   (87),	
   mapas	
   de	
   Kohonen	
   (88),	
   determinación	
   de	
   la	
   relevancia	
   automática	
  
(89),	
  etc.	
  También	
  han	
  sido	
  presentados	
  en	
  la	
  literatura	
  especializada	
  los	
  Sistemas	
  
Artificiales	
   de	
   Colonias	
   de	
   Hormigas	
   y	
   Enjambres	
   (90).	
   También	
   ha	
   sido	
   evaluada	
  
la	
  eficiencia	
  de	
  algunos	
  algoritmos	
  de	
  poda	
  (91).	
  	
  

        En	
   resumen,	
   existe	
   una	
   amplia	
   variedad	
   de	
   descriptores	
   moleculares	
   y	
  
métricas	
   usadas	
   en	
   los	
   métodos	
   de	
   similitud	
   molecular;	
   parece	
   ser,	
   sin	
   embargo,	
  
que	
   el	
   mejor	
   rendimiento	
   se	
   logra	
   adaptando	
   dicha	
   combinación	
   al	
   problema	
  
estudiado	
  (92).	
  	
  

        Una	
   fuente	
   excelente	
   que	
   aborda	
   el	
   tema	
   de	
   la	
   selección	
   de	
   rasgos	
   en	
   el	
  
contexto	
  del	
  Aprendizaje	
  Automático	
  lo	
  constituye	
  la	
  revisión	
  de	
  Guyon	
  y	
  Elisseeff	
  
(93).	
  Un	
  buen	
  número	
  de	
  estas	
  técnicas	
  aparecen	
  implementadas	
  en	
  el	
  software	
  de	
  
aprendizaje	
   automático	
   y	
   minería	
   de	
   datos	
   Weka	
   (94),	
   que	
   también	
   puede	
   usarse	
  
para	
   la	
   modelización	
   QSAR.	
   Este	
   producto	
   es	
   uno	
   de	
   los	
   más	
   populares	
   en	
   el	
   área	
  
del	
   Aprendizaje	
   Automático,	
   es	
   de	
   código	
   abierto	
   y	
   se	
   encuentra	
   disponible	
  
gratuitamente	
  (95).	
  

        	
  

                                                                                                                            	
  545	
  

	
  
   23   24   25   26   27   28   29   30   31   32   33