Panorama de los transcriptomas de cannabis sativa por medio de métodos bioinformáticos
Fecha
Fecha
2017-08-02
Autores
Director
Colaboradores
Título de la revista
ISSN de la revista
Título del volumen
Editor
Altmetric
Descripción
La Cannabis sativa ha sido utilizada como fuente de fibra, aceite y es obteniendo una gran importancia médica para tratamiento de algunas enfermedades y síntomas como nauseas, ansiedad, analgésico, anorexia, trastornos gastrointestinales, convulsiones, Parkinson, migraña etc. Estos compuestos se encuentran en los cannabinoides como el THC y el CBD. El estudio de datos genómicos del cannabis ha sido entorpecido por leyes federales de los Estados Unidos con la Marihuana Tax Act del año 1937 criminalizando la posesión o transferencia de cannabis. En 1953 Francis Crick y James Watson realizaron un gran avance para la biología molecular, El descubrimiento de la doble hélice del ADN. Esto genero estudios sobre la caracterización y función de los genes en tejidos y expresión de proteínas como también en estudios filogenéticos e historia evolutiva de un organismo. La Cannabis sativa es una de las plantas domesticas con menores estudios y desarrollos genómicos a comparación del arroz, el trigo y la soya. Por el interés en sus propiedades psicoactivas. El cultivo selectivo de esta ha producido plantas de cannabis para usos específicos, incluyendo cepas de marihuana y cultivos de cáñamo de alta potencia para la producción de semillas y fibras. Se realizó una minería de data sets para descargar el genoma de referencia de la Cannabis sativa, acudiendo a las bases de datos públicas del FTP de NCBI para el genoma de referencia de cannabis. Para los genomas de cannabis como Cannatonic, LA Confidential, Chemdawg 91, Purple Kush, Pineaple Banana Buba Kush se recurrió al SRA de NCBI y para la variedad de Finola se recurrió a la base de datos The Cannabis Genome Browser del grupo the Open Cannabis Proyect. Se realizo un control de calidad del genoma de referencia de Cannabis sativa y luego se realizó un filtrado de las lecturas, para eliminar posibles, adaptadores que se generan en la secuenciacion de las lecturas, El mapeo que se realizó de estos genomas con la secuenciación de referencia, mostro que la variedad Chemdawg91 presenta un porcentaje mayor de mapeo comparado con los otros genomas. Definiendo así nuestro genoma de referencia. Luego se realizó un ensamble de los transcritos de cada muestra contra el genoma de Chemdawg91 con cufflinks del cual saldrán transcriptomas finales en un archivo merged.gft los cuales fueron cuantificados para poder calcular la expresión de cada transcrito construido. Se identificaron los RNAs codificantes y lncRNAs, en el transcriptoma, el cual evidencio una menos dispersión de lncRNAs en los cuales se puede realizar un énfasis para realizar estudios sobre ellos. Se realizó una identificación de la co-expresión de RNAs codificantes y lncRNAs mostrando una relación con genes involucrados en la ruta de la Biosíntesis de Cannabinoides. Este trabajo de investigación permite el estudio y análisis funcional del genoma de Cannabis sativa y poder realizar posteriores avances investigativos en el área terapéutica y medicinal, ya que la expresión relativa, debido a las distintas funciones metabólicas, la síntesis de las rutas metabólicas en los transcritos de Cannabis sativa es diferente. Debido a la diferenciación celular de tejidos
Resumen
Cannabis sativa has been used as a source of fiber, oil and is obtaining great medical importance for treatment of some diseases and symptoms such as nausea, anxiety, analgesic, anorexia, gastrointestinal disorders, seizures, Parkinson's, migraine etc. These compounds are found in cannabinoids like THC and CBD. The study of genomic data of cannabis has been hampered by US federal laws with the Marijuana Tax Act of 1937 criminalizing the possession or transfer of cannabis. In 1953 Francis Crick and James Watson made a breakthrough for molecular biology, The Discovery of the Double Helix of DNA. This generated studies on the characterization and function of genes in tissues and expression of proteins as well as in phylogenetic studies and evolutionary history of an organism. Cannabis sativa is one of the domestic plants with less studies and genomic developments compared to rice, wheat and soy. Because of the interest in their psychoactive properties. Selective cultivation of this plant has produced cannabis plants for specific uses, including marijuana strains and high potency cannabis crops for the production of seeds and fibers. The data of the reference genome of Cannabis sativa was loading ofthe NCBI public FTP databases for the cannabis reference genome. For cannabis genomes, such as Cannatonic, LA Confidential, Chemdawg 91, Purple Kush, Pineaple Banana Buba Kush, was used the NCBI SRA and for the Finola variety was used the Cannabis Genome Browser database of the Open Cannabis Project. We performed a quality control of the reference genome of Cannabis sativa and then it performed a filtering of the readings, to eliminate possible, adapters that are generated in the sequencing of the readings, the mapping that was performed of these genomes with the sequencing of reference, showed that the variety Chemdawg91 presents a higher percentage of mapping compared to the other genomes, defining our reference genome. The transcripts were assemble from each sample against the Chemdawg91 genome with cufflinks from which final transcriptomes will emerge in a merged.gff file, which were quantified to be able to calculate the expression of each constructed transcript. The coding RNAs and long codings RNAs (lncRNAs) were identified in the transcriptome, which showed a less dispersion of lncRNAs in which an emphasis can be made to carry out studies on them. We performed an identification of the co-expression of coding RNAs and lncRNAs showing a relationship with genes involved in the pathway of Cannabinoid Biosynthesis. This research work allows the study and functional analysis of the genome of Cannabis sativa and to be able to carry out further investigations in the therapeutic and medicinal area, since the relative expression, due to the different metabolic functions, the synthesis of the metabolic routes in the transcripts Of Cannabis sativa is different. Due to cell differentiation of tissues
Palabras clave
Transcriptomas, RNA no codificante, Cannabis, Datasets