Page 29 - 79_04
P. 29

Óscar	
  Miguel	
  Rivera	
  Borroto	
  &	
  col.	
  

	
  
3.2.4.	
  Medidas	
  de	
  similitud	
  

        El	
   concepto	
   de	
   similitud	
   es	
   fundamental	
   para	
   varios	
   aspectos	
   del	
  
razonamiento	
  y	
  análisis	
  químicos,	
  de	
  hecho,	
  es	
  tal	
  vez	
  la	
  premisa	
  fundamental	
  de	
  la	
  
química	
  médica,	
  y	
  cae	
  bajo	
  la	
  rúbrica	
  general	
  de	
  análisis	
  de	
  similitud	
  molecular.	
  La	
  
determinación	
  de	
  la	
  similitud	
  de	
  un	
  "objeto	
  molecular"	
  con	
  otro	
  es	
  básicamente	
  un	
  
ejercicio	
  de	
  comparación	
  de	
  patrones	
  químicos.	
  	
  

        El	
   resultado	
   de	
   este	
   ejercicio	
   es	
   un	
   valor,	
   la	
   medida	
   de	
   similitud,	
   que	
  
caracteriza	
   el	
   grado	
   de	
   concordancia,	
   de	
   asociación,	
   proximidad,	
   semejanza,	
  
alineamiento,	
   porcentaje	
   de	
   identidad	
   o	
   similitud	
   entre	
   pares	
   de	
   moléculas	
  
manifestada	
   por	
   sus	
   “patrones	
   moleculares”,	
   que	
   se	
   componen	
   de	
   conjuntos	
   de	
  
rasgos.	
  	
  

        La	
   terminología	
   de	
   “proximidad”	
   a	
   veces	
   se	
   utiliza	
   en	
   un	
   sentido	
   más	
  
general	
   para	
   referirse	
   a	
   la	
   similitud,	
   disimilitud,	
   o	
   la	
   distancia	
   entre	
   los	
   pares	
   de	
  
moléculas.	
   Las	
   medidas	
   de	
   similitud	
   son	
   funciones	
   que	
   hacen	
   corresponder	
   pares	
  
de	
   representaciones	
   moleculares	
   de	
   la	
   misma	
   forma	
   matemática	
   con	
   números	
  
reales	
   que	
   usualmente,	
   pero	
   no	
   siempre,	
   yacen	
   en	
   el	
   intervalo	
   unitario	
   [0,1]	
   (61).	
  
La	
  similitud	
  es	
  generalmente	
  considerada	
  como	
  una	
  propiedad	
  simétrica,	
  es	
  decir,	
  
“A”	
  es	
  tan	
  similar	
  a	
  “B”	
  como	
  “B”	
  a	
  “A”,	
  y	
  la	
  mayoría	
  de	
  los	
  estudios	
  se	
  basan	
  en	
  esta	
  
propiedad.	
   Tversky	
   (96),	
   sin	
   embargo,	
   ha	
   argumentado	
   persuasivamente	
   que	
  
ciertas	
  similitudes	
  son	
  inherentemente	
  asimétricas.	
  	
  

        Aunque	
   su	
   trabajo	
   se	
   orientó	
   hacia	
   la	
   psicología,	
   este	
   tiene	
   aplicabilidad	
  
además	
   en	
   los	
   estudios	
   de	
   similitud	
   molecular	
   (97).	
   Por	
   otra	
   parte,	
   cuando	
   se	
  
aplican	
   los	
   conceptos	
   de	
   similitud	
   y	
   diversidad	
   en	
   química,	
   es	
   necesario	
   definir	
  
similitudes	
   globales	
   y	
   locales;	
   las	
   similitudes	
   locales	
   se	
   centran	
   en	
   parte	
   en	
   un	
  
objeto	
   (átomo,	
   grupo	
   funcional,	
   las	
   cadenas	
   de	
   proteínas,	
   cadena	
   de	
   ADN,	
   etc.),	
  
mientras	
   que	
   las	
   similitudes	
   globales	
   la	
   semejanza	
   se	
   mide	
   entre	
   dos	
   objetos	
  
enteros	
  (moléculas,	
  proteínas,	
  etc.)	
  (98).	
  

        Consideremos	
   dos	
   objetos	
   químicos	
   arbitrarios	
   A	
   y	
   B	
   descritos	
   mediante	
  
vectores	
   X	
   e	
   Y,	
   respectivamente,	
   de	
   n	
   atributos,	
   de	
   modo	
   que	
   ?? =
(??!, ??!, ??!, … , ??!).e	
   ?? = (??!, ??!, ??!, … , ??!).	
   En	
   la	
   Tabla	
   2	
   se	
   muestra	
   un	
   grupo	
   de	
  
medidas	
   de	
   (di)similitud	
   de	
   amplio	
   uso	
   en	
   quimioinformática	
   extraídas	
   de	
   la	
  
revisión	
   de	
   Ellis	
   et	
   al	
   (99).	
   Otro	
   trabajo	
   de	
   revisión	
   excelente	
   sobre	
   medidas	
   de	
  
similitud	
  puede	
  encontrarse	
  en	
  (100).	
  

	
  

	
   	
  

546	
  

	
  
   24   25   26   27   28   29   30   31   32   33   34