Introducción

Las enzimas son catalizadores de los sistemas biológicos y dentro de sus características se encuentra su poder catalítico y su gran especificidad. Tienen la capacidad de catalizar una gran diversidad de reacciones químicas, producto de su capacidad de unirse a gran número de moléculas. Las enzimas aceleran las reacciones químicas aumentado su velocidad en varios órdenes de magnitud, lo que hace que sean de mucha utilidad para procesos químicos aplicados a la industria.

En la actualidad las enzimas son utilizadas por diversas áreas de la industrial como son la alimenticia, textil, del papel, cosmética, química entre otras. En donde se destaca el uso de enzimas como amilasas, lipasas, celulasas, oxidoreductasas, pectinasas, glucosa isomerasas, xilasas, proteasas, entre otras.

La mayoría de las enzimas utilizadas por la industrial, 200 aproximadamente, son obtenidas de microorganismos y de estas 20 se producen a escala industrial por tres grandes compañías (Novozymes, DuPont y Roche), el resto es producido por pequeñas compañías a baja escala. El mercado chileno ha presentado un aumento en la demanda por esta tecnología en donde la escala de importación de estos productos ha crecido de USD$11 millones en el año 2006 a USD$27 millones en el 2013. Por lo que, existe un mercado nacional e internacional que demanda la utilización de estas tecnologías.

SISTEMA BIOINFORMÁTICO

Las enzimas, son proteínas que permiten catalizar diversas funciones biológicas.

Cada una de estas macromoléculas está formada por una secuencia de aminoácidos, su unidad básica, que le otorga diversas características, composiciones, estructuras, entre otros. Es por esto, que la secuencia de cada enzima determina su función y desempeño, siendo de gran interés para el estudio y análisis de cada una.

Esta secuencia aminoacídica además de otorgar propiedades específicas también proporciona una estructura a cada proteína, donde dicho plegamiento tiene directa relación con la funcionalidad e interacción de la enzima.

Nombre grafico SanKey

Con la finalidad de obtener un sistema que permita clasificar toda la información disponible de cada proteína, es que se creó una herramienta bioinformática que caracteriza mediante diversos descriptores moleculares todas las secuencias que contenía la base de datos de UNIPROT al año 2019, o sea, 560.000 secuencias de aminoácidos. Dichos descriptores corresponden a características fisicoquímicas, moleculares, de función y estructura de cada proteína, los que fueron obtenidos desde lenguajes de programación como R o Python, bases de datos, literatura y otros. Siendo un total de 31 descriptores moleculares que definen a cada secuencia, por lo tanto, la base de datos local desarrollada contiene 17.360.000 datos aproximadamente. Con esta información, el sistema permite obtener un ranking de las proteínas que según su caracterización de secuencia y estructura tienen una función putativa.

Uno de los objetivos fundamentales del análisis de secuencias es la deducción asociada al conocimiento relativo a la estructura y función de estas mediante la comparación de sus secuencias primarias. Cuando un conjunto de proteínas presenta secuencias similares se puede hipotetizar que poseen la misma función o el mismo sustrato, así también, se pueden clasificar familias de proteínas de acuerdo con su estructura terciaria, considerando más relevante la exposición de residuos que dicho plegamiento presente, siendo estos los que le otorguen una actividad enzimática específica. Los análisis de minería de datos llevados a cabo en secuencias de proteínas y en su estructura permiten revelar patrones comunes que se encuentran asociados a una determinada función biológica (Chen et al., 2004). Es por esto, que caracterizar dichos motivos conservados es primordial para determinar el desempeño de cada enzima.

A nivel evolutivo, la estructura de una molécula tiende a conservar en mayor nivel su forma ancestral que a nivel de secuencia, ya que esta última es más factible de sufrir cambios y mutaciones en el tiempo (Thilakaraj et al., 2007). La mayoría de las proteínas han evolucionado para realizar funciones específicas que dependen de la estructura tridimensional que adoptan mediante patrones definidos de residuos conservados en secuencias de aminoácidos que se caracterizan por ser divergentes. Esta necesidad surge de mantener estructuras terciarias con el requisito de conservar los residuos implicados en la función (Núñez, 2004).