Page 30 - 79_04
P. 30
Perspectiva
general
sobre
el
proceso
de
desarrollo
de
fármacos…
Tabla
2.--
Algunas
de
las
medidas
de
proximidad
más
usadas
en
la
búsqueda
de
similitud
Medida
Fórmulaa
Tipob
Manhattan
Media
????!" = ! ??! - ??!
D
!!! ??
Euclidiana
Media
????!" = ! ??! - ??! ! D
Bray/Curtis
!!! ??
D
????!" = ! ??! - ??!
!!!
! ??! + ??!
!!!
Tan
??!" = ! ??! ??!
A
!!!
! ??!! + ! ??!! - ! ??! ??!
!!! !!! !!!
Dice
??!" = 2 ! ??! ??! ??!!
A
!!!
!
! ??!! + !!!
!!!
Sokal/Sneath(1)
????1!" = 2 ! ??! ??!
A
!!!
! ??!! + 2 ! ??!! - 3 ! ??! ??!
!!! !!! !!!
??????!" = ! ??! ??!
!!!
Cosine/Ochiai
! ??!! ! ??!! A
!!! !!!
Pearson
??!" = ! ??! - ?? ??! - ??
C
!!!
! ??! - ?? ! ! ??! - ?? !
!!! !!!
axj
(yj)
representa
el
valor
del
descriptor
del
vector
X
(A)
e
Y
(B)
en
el
atributo
j;
bClasificación
de
las
medidas
de
proximidad
acorde
a
su
naturaleza
de
definición.
D,
coeficientes
de
distancia:
están
basados
en
la
suma
de
diferencias,
sus
valores
varían
en
proporción
inversa
con
el
grado
de
similitud;
A,
coeficientes
de
asociación:
se
basan
en
el
producto
interno,
y
sus
valores
varían
en
proporción
directa
con
el
grado
de
similitud,
por
lo
que
una
mayor
similitud
se
indica
por
el
aumento
de
los
valores;
C,
coeficientes
de
correlación:
Los
coeficientes
de
correlación
se
basan
en
una
tercera
función
más
compleja:
la
suma
de
los
productos
de
la
diferencias
entre
cada
valor--
atributo
y
la
media
de
todos
los
valores
de
los
atributos
de
cada
uno
de
los
dos
vectores.
Los
valores
de
estos
por
lo
general
varían
de
1
(lo
que
indica
que
cualquier
cambio
en
los
atributos
de
un
objeto
sería
acompañado
por
un
cambio
idéntico
en
los
atributos
del
otro)
a
--1
(que
indica
que
un
cambio
en
uno
y
sería
acompañado
por
un
cambio
igual
y
opuesto
en
el
otro).
547