Protocolo bioinformático para la búsqueda de miARNs como biomarcadores en enfermedades neuropsiquiátricas
UNIVERSAL IDENTIFIER: http://hdl.handle.net/11093/5425
DOCUMENT TYPE: doctoralThesis
ABSTRACT
El objetivo principal de la tesis es el desarrollo de un protocolo bioinformático (pipeline) que automatice el proceso de búsqueda de biomarcadores miARNs en enfermedades neuropsiquiátricas y los análisis adicionales necesarios para identificar patrones de expresión asociados, por ejemplo, a la enfermedad o a la eficacia terapéutica de los tratamientos.
Por un lado, el desarrollo de un pipeline automatizado responde a la necesidad de integrar la gran cantidad de programas existentes que solo cubren ciertos pasos del proceso de búsqueda de biomarcadores en datos de miARN (p. ej.: control de calidad, alineamiento, cuantificación, normalización…). A día de hoy existen pocas herramientas que realicen este proceso de manera integral y que sean altamente configurables y extensibles.
Tomando como principal entrada el miARNoma de casos y controles, el pipeline a desarrollar integrará los principales programas usados actualmente en el campo (evaluando en cada proceso la mejor alternativa). De manera automática, realizará los análisis estadísticos pertinentes, con el objetivo final de generar un listado de biomarcadores potenciales. En dicho proceso, se prevé la realización de dos tipos de análisis de expresión diferencial:
a) Casos (ej.: esquizofrenia) vs. controles sanos.
b) Casos antes vs. casos después del tratamiento farmacológico.
Por otro lado, una vez obtenido el pipeline básico, se pretenderá implementar funciones específicas para el diagnóstico clínico en psiquiatría, ya que no están presentes en las pocas herramientas que existen. Inicialmente, se consideran las siguientes funciones:
- Identificación de patrones de expresión asociados con la enfermedad de estudio.
- Predicción del pronóstico y eficacia terapéutica del tratamiento.
- Búsqueda de relaciones entre la enfermedad y otros factores (p. ej.: edad, sexo, medicación, etc.).
- Soporte para el análisis de otros tipos de ARN no codificantes como lncRNA o piRNAS.
Finalmente, este pipeline se usaría para analizar y extraer conclusiones analizando un conjunto de datos relativos a pacientes con una enfermedad neuropsiquiátrica (ej.: esquizofrenia y depresión). O obxetivo principal da tesis é o desenvolvemento dun protocolo bioinformático (pipeline) que automatice o proceso de búsqueda de biomarcadores miARNs en enfermedades neuropsiquiátricas e os análisis adicionais necesarios para identificar patróns de expresión asociados, por exemplo, á enfermedad ou á eficacia terapéutica dos tratamentos.
Por un lado, o desenvolvemento dun pipeline automatizado responde á necesidade de integrar a gran cantidade de programas existentes que soamente cubren certos pasos do proceso de búsqueda de biomarcadores en datos de miARN (p. ex.: control de calidade, alineamiento, cuantificación, normalización…). A día de hoxe existen pocas ferramentas que realicen este proceso de manera integral e que sexan altamente configurables e extensibles.
Tomando como principal entrada o miARNoma de casos e controis, o pipeline a desenvolver integrará os principais programas usados actualmente no campo (evaluando en cada proceso a mellor alternativa). De manera automática, realizará os análisis estadísticos pertinentes, co obxetivo final de xenerar un listado de biomarcadores potenciales. En dito proceso, se prevé a realización de dous tipos de análisis de expresión diferencial:
a) Casos (ex.: esquizofrenia) vs. controles sanos.
b) Casos antes vs. casos despois do tratamento farmacolóxico.
Por outro lado, unha vez obtido o pipeline básico, se pretenderá implementar funcions específicas para o diagnóstico clínico en psiquiatría, xa que non están presentes nas pocas ferramientas que existen. Inicialmente, se consideran as seguintes funcions:
- Identificación de patróns de expresión asociados coa enfermidade de estudo.
- Predición do pronóstico e eficacia terapéutica do tratamento.
- Búsqueda de relacións entre a enfermidade e outros factores (p. ex.: idade, sexo, medicación, etc.).
- Soporte para a análise de outros tipos de ARN non codificantes coma lncRNA ou piRNAS.
Finalmente, este pipeline usaríase para analizar e extraer conclusións analizando un conxunto de datos relativos a pacientes cunha enfermidade neuropsiquiátrica (ej.: esquizofrenia e depresión). The main objective of the thesis is the development of a bioinformatic protocol (pipeline) that automates the process of searching for miRNA biomarkers in neuropsychiatric diseases and the additional analyses necessary to identify expression patterns associated, for example, with the disease or the therapeutic efficacy of the treatments.
On the one hand, the development of an automated pipeline responds to the need to integrate the large number of existing programs that only cover certain steps of the biomarker search process in miRNA data (i.e. quality control, alignment, quantification, normalization ...). Today there are few highly configurable and extensible tools that perform this process.
Taking as a main entry the miRNA of cases and controls, the pipeline will integrate the most used programs in the field (evaluating the best alternative in each process). Automatically, it will carry out the relevant statistical analyses, with the final objective of generating a list of potential biomarkers. In this process, two types of differential expression analysis are planned:
a) Cases (i.e. schizophrenia) vs. healthy controls
b) Cases before vs. cases after drug treatment.
On the other hand, once the basic pipeline is obtained, it will be tried to implement specific functions for the clinical diagnosis in psychiatry, since they are not present in the few tools that exist. Initially, the following functions are considered:
- Identification of expression patterns associated with the study disease.
- Prediction of the prognosis and therapeutic efficacy of the treatment.
- Search for relationships between the disease and other factors (i.e. age, sex, medication, etc.).
- Support for the analysis of other types of non-coding RNAs such as lncRNA or piRNAS.
Finally, this pipeline would be used to analyse and draw conclusions by analysing a set of data related to patients with a neuropsychiatric disease (i.e. schizophrenia and depression).