R专题:使用R读取&处理GTF格式的文件
前言:小白快问快答
Q1:GTF是个啥?
见下表和以前的推文: NGS数据格式之gff/gtf
Q2: 为什么要在R里面倒腾GTF? 为了生信小白对此类数据格式的快速入门+R的学习!
More …Q1:GTF是个啥?
见下表和以前的推文: NGS数据格式之gff/gtf
Q2: 为什么要在R里面倒腾GTF? 为了生信小白对此类数据格式的快速入门+R的学习!
More …Pembrolizumab是人源化单克隆抗体,首个被批准的阻断PD-1的靶向治疗药物。 PD-1全名是程序性死亡分子1,英文名叫programmeddeath-1(PD-1),是近年来发现的一种负性共刺激分子。PD-L1是PD-1的配体,各种肿瘤细胞组织中都有PD-L1的表达。 PD-1与PD-L1结合后可提供抑制性信号,诱导T细胞凋亡,抑制T细胞的活化和增殖,进而降低了免疫系统对抗肿瘤细胞的能力。
More …经过前段时间对基础知识的介绍,小菜鸟已经可以根据一个pipeline 从测序原始数据获得那些量化数据,比如峰值、表达值和甲基化值等等,这些值就被用来做后续分析。但每每当我跑完了原始数据再回看pipeline,发现有很多原来不太明白却因为时间限制而草草掠过的地方还是有很多可以改进的(特别是当老板拿着一些明显的致命错误来问我的时候TnT)。
正所谓“温故而知新”,看似忙碌实则却因各种错误而降低了课题效率,实在是得不偿失于是决定开始在升级这些pipeline的同时系统回顾曾经所学,年初就在菜鸟团里收了这本书:
Bioinformatics Data Skills, by Vince Buffalo
作者在博客中也指明阅读对象,心内暗喜:
More …Bioinformatics Data Skills is an intermediate-level book, aimed at readers with some experience with a scripting language like Python, and very basic Unix (e.g. the Unix filesystem hierarchy, cd, ls, etc.). Bioinformatics Data Skills gives readers a solid Unix foundation in chapters 3 (“Remedial Unix Shell”), 7 (“Unix Data Tools”), and 12 (“Bioinformatics Shell Scripting”, “Writing Pipelines”, and “Parallelizing Tasks”). Readers are also introduced to the R language through learning exploratory data analysis (chapter 8).
转录(Transcription) 是遗传信息由DNA转换到RNA的过程,即信使RNA(mRNA)以及非编码RNA(tRNA、rRNA等)的合成步骤。在NGS的促进下,研究转录和转录调控的技术有了极大的扩展,以空前的速度发展。
More …主要讲三个问题:测序深度和测序覆盖度怎么理解?怎么根据试验要求确定二者数值?一般用什么软件计算?
More …