Navegar por los elementos (1 total)

  • Resumen es exacto "El ensamblado de-novo del transcriptoma de especies sin genoma de referencia es un tema de preocupación para muchos investigadores a partir del acceso a las tecnologías de secuenciación masiva de los laboratorios de ciencias biológicas. Existe una brecha de investigación sobre que metologías aplicar en cada ensayo, para la obtención de un ensamblado de-novo de calidad. Tampoco hay consenso en cuanto a métricas de calidad adecuadas para evaluar de manera individual o comparativa los ensamblados conseguidos. Ante este panorama, este trabajo aborda el análisis del desempeño de las herramientas bioinformáticas y métricas de calidad más comúnmente utilizadas para la reconstrucción denovo y evaluación de transcriptomas ensamblados a partir de lecturas cortas (RNA-Seq) y propone una estrategia de optimización sobre los resultados. Durante el desarrollo de la Tesis se simularon conjuntos de datos de lecturas de secuenciación transcriptómica, con diferentes grados de complejidad y basados en datos reales de alta calidad. Se ensayó el funcionamiento de programas de ensamblado de acceso público y diferentes estrategias de mejora sobre los resultados primarios. Para clasificar y comparar los ensamblados obtenidos bajo distintas condiciones se utilizaron un grupo de métricas dependientes e independientes de referencia. Estas métricas se analizaron en forma individual y en conjunto a través de análisis multivariados. A partir de los resultados obtenidos se identificaron las variables nivel de splicing alternativo seguido por el tamaño de fragmento de las lecturas pareadas (PE) como las de mayor incidencia sobre la calidad de los ensamblados. Analizando los ensamblados obtenidos a partir de diferentes valores de las variables tamaño de lectura (SE) y tamaño de fragmento (PE) se detectaron problemas de muestreo asociados a la distribución de tamaños de transcriptos, al tamaño y cantidad de exones y a los niveles de splicing alternativo. Se implementaron diferentes estrategias de agrupamiento de ensamblados, las que no produjeron mejoras en los resultados finales, aumentando los niveles de error y redundancia. Se trabajó en la caracterización y modelado de los diferentes tipos de errores producidos en los ensamblados como base para una estrategia de filtrado de contigs erróneos y se entrenaron clasificadores para predecir la probabilidad de que un contig se encuentre correctamente ensamblado. Los resultados obtenidos realzan la importancia de obtener ensamblados con una mayor cantidad de genes representados, en lugar de intentar resolver todas las isoformas de splicing implementando estrategias de agrupamiento que aumentan las tasas de error.


    "

Título: Desarrollo de estratégias bioinformáticas para el análisis genómico funcional de datos provenientes de secuenciación masiva

Formatos de Salida

atom, csv, dc-rdf, dcmes-xml, json, omeka-xml, rss2