Page 29 - 79_04
P. 29
Óscar
Miguel
Rivera
Borroto
&
col.
3.2.4.
Medidas
de
similitud
El
concepto
de
similitud
es
fundamental
para
varios
aspectos
del
razonamiento
y
análisis
químicos,
de
hecho,
es
tal
vez
la
premisa
fundamental
de
la
química
médica,
y
cae
bajo
la
rúbrica
general
de
análisis
de
similitud
molecular.
La
determinación
de
la
similitud
de
un
"objeto
molecular"
con
otro
es
básicamente
un
ejercicio
de
comparación
de
patrones
químicos.
El
resultado
de
este
ejercicio
es
un
valor,
la
medida
de
similitud,
que
caracteriza
el
grado
de
concordancia,
de
asociación,
proximidad,
semejanza,
alineamiento,
porcentaje
de
identidad
o
similitud
entre
pares
de
moléculas
manifestada
por
sus
“patrones
moleculares”,
que
se
componen
de
conjuntos
de
rasgos.
La
terminología
de
“proximidad”
a
veces
se
utiliza
en
un
sentido
más
general
para
referirse
a
la
similitud,
disimilitud,
o
la
distancia
entre
los
pares
de
moléculas.
Las
medidas
de
similitud
son
funciones
que
hacen
corresponder
pares
de
representaciones
moleculares
de
la
misma
forma
matemática
con
números
reales
que
usualmente,
pero
no
siempre,
yacen
en
el
intervalo
unitario
[0,1]
(61).
La
similitud
es
generalmente
considerada
como
una
propiedad
simétrica,
es
decir,
“A”
es
tan
similar
a
“B”
como
“B”
a
“A”,
y
la
mayoría
de
los
estudios
se
basan
en
esta
propiedad.
Tversky
(96),
sin
embargo,
ha
argumentado
persuasivamente
que
ciertas
similitudes
son
inherentemente
asimétricas.
Aunque
su
trabajo
se
orientó
hacia
la
psicología,
este
tiene
aplicabilidad
además
en
los
estudios
de
similitud
molecular
(97).
Por
otra
parte,
cuando
se
aplican
los
conceptos
de
similitud
y
diversidad
en
química,
es
necesario
definir
similitudes
globales
y
locales;
las
similitudes
locales
se
centran
en
parte
en
un
objeto
(átomo,
grupo
funcional,
las
cadenas
de
proteínas,
cadena
de
ADN,
etc.),
mientras
que
las
similitudes
globales
la
semejanza
se
mide
entre
dos
objetos
enteros
(moléculas,
proteínas,
etc.)
(98).
Consideremos
dos
objetos
químicos
arbitrarios
A
y
B
descritos
mediante
vectores
X
e
Y,
respectivamente,
de
n
atributos,
de
modo
que
?? =
(??!, ??!, ??!, … , ??!).e
?? = (??!, ??!, ??!, … , ??!).
En
la
Tabla
2
se
muestra
un
grupo
de
medidas
de
(di)similitud
de
amplio
uso
en
quimioinformática
extraídas
de
la
revisión
de
Ellis
et
al
(99).
Otro
trabajo
de
revisión
excelente
sobre
medidas
de
similitud
puede
encontrarse
en
(100).
546