Page 69 - 78_04
P. 69

DESCUBRIMIENTO	
  DE	
  NUEVOS	
  ANTIMALÁRICOS	
  …	
  	
  

	
  
determinada	
   característica	
   en	
   una	
   estructura	
   química,	
   denominados	
   huellas	
  
digitales	
   o	
   “fingerprints”	
   y	
   el	
   coeficiente	
   de	
   Tanimoto	
   (Tc)	
   fue	
   utilizado	
   para	
  
establecer	
   las	
   métricas	
   de	
   comparación	
   intermolecular	
   (una	
   de	
   referencia	
   vs.	
   una	
  
de	
  la	
  base	
  de	
  datos)	
  (14).	
  	
  

        Se	
   emplearon	
   como	
   referencia	
   30	
   compuestos	
   antimaláricos	
   (querys)	
   con	
  
diferentes	
   mecanismos	
   de	
   acción	
   y	
   estructuralmente	
   diversos	
   (Material	
  
suplementario	
   1).	
   De	
   esta	
   manera,	
   cada	
   molécula	
   del	
   Spectrum	
   collection	
   fue	
  
ordenada	
   en	
   una	
   posición	
   (ranking)	
   según	
   el	
   coeficiente	
   de	
   similitud	
   respecto	
   a	
  
cada	
   una	
   de	
   las	
   estructuras	
   de	
   referencia	
   (14,	
   15).	
   Los	
   compuestos	
   retenidos	
   son	
  
los	
  que	
  se	
  encuentran	
  en	
  la	
  parte	
  superior	
  de	
  la	
  lista	
  con	
  un	
  Tc	
  =	
  66%.	
  

2.1.3.	
  Estudios	
  de	
  Relación	
  Cuantitativa	
  Estructura-­-Actividad	
  (QSAR)	
  

        Los	
   estudios	
   QSAR	
   constituyen	
   enfoques	
   cuantitativos	
   orientados	
   a	
  
encontrar	
   relaciones	
   entre	
   la	
   estructura	
   molecular	
   y	
   las	
   actividades	
   moleculares	
  
medidas	
  o	
  calculadas	
  (21).	
  Actualmente,	
  quizás	
  sea	
  el	
  enfoque	
  más	
  utilizado	
  en	
  el	
  
diseño	
   de	
   fármacos,	
   constando	
   con	
   principios	
   regulatorios	
   de	
   la	
   OECD	
   	
   para	
   la	
  
validación	
  de	
  modelos	
  QSAR	
  (22).	
  

        Para	
   la	
   obtención	
   de	
   los	
   modelos	
   QSAR	
   en	
   la	
   predicción	
   de	
   actividad	
  
antimalárica	
   se	
   confeccionó	
   una	
   base	
   de	
   datos	
   de	
   2.314	
   compuestos	
   que	
   se	
  
dividieron	
  en	
  851	
  y	
  1.463	
  activos	
  e	
  inactivos,	
  respectivamente.	
  	
  

        Utilizando	
   un	
   análisis	
   de	
   clúster	
   de	
   k-­-NNCA,	
   implementado	
   en	
   el	
   paquete	
  
estadístico	
   STATISTICA	
   6.0.	
   (23,	
   24),	
   se	
   dividen	
   estos	
   grupos	
   en	
   dos	
   subconjuntos	
  
separados,	
   la	
   serie	
   de	
   entrenamiento	
   o	
   calibración	
   (SE)	
   y	
   la	
   serie	
   de	
   predicción	
   o	
  
validación	
   (SP).	
   Según	
   muchos	
   autores	
   la	
   “única”	
   condición	
   necesaria	
   y	
   suficiente	
  
para	
   poder	
   estimar	
   el	
   valor	
   predictivo	
   de	
   un	
   modelo	
   es	
   comparar	
   los	
   valores	
  
predichos	
  y	
  observados	
  de	
  una	
  extensa	
  SP	
  externa.	
  	
  

        Se	
   calcularon	
   	
   descriptores	
   moleculares	
   (DMs)	
   implementados	
   en	
   el	
  
programa	
   TOMOCOMD-­-CARDD	
   _ENREF_390(25),	
   de	
   forma	
   que	
   se	
   logra	
   codificar	
  
la	
   estructura	
   molecular	
   a	
   través	
   de	
   aplicaciones	
   matemáticas	
   como	
   los	
   índices	
  
cuadráticos	
  (IQ)_ENREF_391	
  (26)	
  lineales	
  (IL)	
  (27)	
  y	
  bilineales	
  (IB)	
  (28,	
  29).	
  	
  

        A	
   partir	
   de	
   los	
   DMs	
   se	
   obtuvieron	
   los	
   modelos	
   o	
   ecuaciones	
   para	
   la	
  
identificación	
   de	
   compuestos	
   antimaláricos	
   a	
   través	
   de	
   un	
   análisis	
   discriminante	
  
lineal	
   (ADL).	
   Nuestro	
   grupo	
   de	
   investigación	
   ha	
   obtenido	
   modelos	
   usando	
   esta	
  
técnica	
   de	
   clasificación	
   para	
   predecir	
   actividad	
   de	
   compuestos	
   con	
   amplios	
   usos	
  
farmacológicos,	
   sin	
   embargo	
   las	
   datas	
   utilizadas	
   nunca	
   fueron	
   de	
   esta	
   magnitud	
  
(26-­-30).	
  	
  

        Se	
   empleó	
   como	
   criterio	
   de	
   clasificación	
   los	
   valores	
   de	
   diferencia	
   de	
  
probabilidades	
   ?P	
   %	
   (probabilidad	
   con	
   que	
   el	
   modelo	
   clasifica	
   un	
   compuesto	
  
como	
  activo	
  menos	
  la	
  probabilidad	
  de	
  clasificar	
  este	
  compuesto	
  como	
  inactivo),	
  de	
  

                                                                                                                            465	
  

	
  
   64   65   66   67   68   69   70   71   72   73   74