Page 28 - 79_04
P. 28
Perspectiva
general
sobre
el
proceso
de
desarrollo
de
fármacos…
cognitivo
acerca
de
cuales
de
ellos
son
mejores,
no
importa
cuales
dos
objetos
uno
compare,
todo
resultará
igualmente
similar
(disimilar)
(80).
En
este
sentido,
algunos
investigadores
de
la
química
medicinal
han
planteado
que
no
tiene
sentido
hablar
de
diversidad
sin
un
sistema
de
referencia,
que
está
dado
en
este
caso
por
el
ensayo
biológico
(81).
Una
estrategia
para
solucionar
esta
dificultad
es
seleccionar
un
conjunto
de
descriptores
en
particular
para
los
cuales
se
demostró
que
funcionan
bien
en
un
cierto
problema.
Otra
estrategia
es
calcular
primero
un
gran
número
de
descriptores
y
luego
eliminar
aquellos
descriptores
del
conjunto
que
muestran
un
coeficiente
de
correlación
por
encima
de
cierto
valor.
Un
enfoque
diferente
es
dejar
que
la
computadora
escoja
la
combinación
óptima
de
descriptores
para
el
problema
en
cuestión
(82).
Numerosos
métodos
automáticos
han
sido
propuestos
en
quimioinformática
para
la
selección
de
rasgos,
por
ejemplo,
la
técnica
paso
a
paso
de
los
procesos
de
integración
hacia
adelante
o
eliminación
hacia
atrás
y
el
análisis
de
componentes
principales
(83);
también
ha
sido
propuesto
el
uso
de
los
k--
vecinos
más
cercanos
(84).
Otros
métodos
de
selección
más
usados
en
la
modelación
REA
se
encuentran
la
selección
secuencial
hacia
delante
(Sequential
Feature
Forward
Selection),
la
eliminación
secuencial
hacia
atrás
(Sequential
Feature
Backward
Elimination),
el
recocido
simulado
(Simulated
Annaeling)
y
la
selección
basada
en
algoritmos
genéticos,
siendo
esta
última
una
de
las
más
eficientes
en
el
campo
de
modelación
REA
(85).
En
el
pasado,
algunos
enfoques
estaban
directamente
relacionados
con
las
Redes
Neuronales
Artificiales,
como
son:
división
de
los
pesos
(86),
correlación
en
cascada
(87),
mapas
de
Kohonen
(88),
determinación
de
la
relevancia
automática
(89),
etc.
También
han
sido
presentados
en
la
literatura
especializada
los
Sistemas
Artificiales
de
Colonias
de
Hormigas
y
Enjambres
(90).
También
ha
sido
evaluada
la
eficiencia
de
algunos
algoritmos
de
poda
(91).
En
resumen,
existe
una
amplia
variedad
de
descriptores
moleculares
y
métricas
usadas
en
los
métodos
de
similitud
molecular;
parece
ser,
sin
embargo,
que
el
mejor
rendimiento
se
logra
adaptando
dicha
combinación
al
problema
estudiado
(92).
Una
fuente
excelente
que
aborda
el
tema
de
la
selección
de
rasgos
en
el
contexto
del
Aprendizaje
Automático
lo
constituye
la
revisión
de
Guyon
y
Elisseeff
(93).
Un
buen
número
de
estas
técnicas
aparecen
implementadas
en
el
software
de
aprendizaje
automático
y
minería
de
datos
Weka
(94),
que
también
puede
usarse
para
la
modelización
QSAR.
Este
producto
es
uno
de
los
más
populares
en
el
área
del
Aprendizaje
Automático,
es
de
código
abierto
y
se
encuentra
disponible
gratuitamente
(95).
545