00:00 / 01:26
连播
清屏
智能
倍速
点赞29
00:00 / 01:21
连播
清屏
智能
倍速
点赞383
曾大江2周前
基因翻译为蛋白质的过程 编码蛋白质的基因由启动子、外显子、内含子、终止子构成,其中外显子和内含子是交替排列的。RNA聚合酶与启动子结合并启动转录。RNA聚合酶识别到终止子时停止转录。转录过程中合成信使核糖核酸mRNA。RNA由A(腺嘌呤)、G(鸟嘌呤)、C(胞嘧啶)、U(尿嘧啶)四种碱基构成,即U(尿嘧啶)取代了DNA中的T(胸腺嘧啶)。最初的转录本mRNA既含有内含子又含有外显子,即最初的mRNA会复刻从启动子到终止子之间的所有DNA信息。随后会发生一个RNA剪接过程,舍弃内含子,并把外显子融合在一起形成一条含有所有外显子的mRNA。但是,在一些情况下,特定的外显子也会被舍弃,形成一条含有部分外显子的mRNA。也就是说,一个基因并不只能编码一种蛋白质,而是可以编码几种蛋白质。一个基因通过外显子的排列组合可以形成一条含有所有外显子的mRNA和几条含有部分外显子的mRNA,从而编码几种蛋白质。显然,这几种蛋白质的大部分结构片段是相同的。DNA长链通过折叠卷缩在细胞核内,进行了信息载体的空间压缩。一个基因编码几种结构相近的蛋白质实现了碱基对的复用,即外显子的复用,提高了信息存储密度。这是一种生物细胞的优化过程。如果把细胞看成原子自动机,那么原子自动机可以有上亿种构型。上亿种原子自动机构型在自身的演化和与外界的作用中,只有完成这种优化过程的构型才能成为生物细胞,并继续演化为更复杂的生物。
00:00 / 06:52
连播
清屏
智能
倍速
点赞1
00:00 / 00:44
连播
清屏
智能
倍速
点赞0
00:00 / 01:08
连播
清屏
智能
倍速
点赞3
单细胞转录组 单细胞转录组数据分析(核心流程) 单细胞转录组测序(scRNA-seq)通过捕获单个细胞的基因表达信息,揭示细胞异质性,核心流程可分为以下5步,操作上依赖Seurat、Scanpy等工具。 1. 数据预处理(质控与过滤) - 原始数据转换:将测序得到的FASTQ文件,通过Cell Ranger等软件比对参考基因组,生成包含细胞-基因表达矩阵的原始数据。 - 质量控制(关键指标): - 过滤低质量细胞:去除检测基因数过少或过多的细胞。 - 过滤低表达基因:剔除在多数细胞中不表达的基因,降低计算量。 - 去除线粒体基因污染:高比例线粒体基因通常代表细胞破损,需过滤。 2. 标准化与归一化 - 核心目的:消除测序深度、细胞大小差异对基因表达量的影响,让不同细胞的表达数据可比。 - 常用方法: - 标准化:按细胞总表达量缩放,使每个细胞的总表达量一致。 - 对数转换:降低高表达基因的影响,让数据更符合正态分布,便于后续分析。 3. 特征选择与降维 - 特征选择:识别“高变基因”,聚焦核心生物学信号,忽略随机噪声。 - 降维:将高维的“细胞-基因”矩阵压缩到低维空间,保留关键信息: - 第一步:主成分分析(PCA),用少量主成分代表主要表达差异。 - 第二步:非线性降维,将PCA结果进一步压缩到2-3维,便于细胞聚类和可视化。 4. 细胞聚类与注释 - 细胞聚类:基于基因表达相似性,将细胞分组,相似表达谱的细胞聚为一类,代表同一细胞类型或状态。 - 细胞注释:明确每类细胞的身份: - 基于“标记基因”:已知细胞类型的特异性基因。 - 工具辅助:通过SingleR等工具,对比公共数据库的参考细胞图谱,自动注释细胞类型。 5. 差异表达分析与功能解读 - 差异表达分析:对比不同细胞群,筛选差异表达基因,揭示组间分子差异。 - 功能解读:对差异表达基因进行功能富集分析,关联生物学功能,最终解释实验现象。 整个流程核心是从“数据降噪”到“生物学解读”,核心价值是打破传统 bulk RNA-seq 的“平均化”局限,精准解析细胞群体的异质性。 #医学期刊 #课题组 #生信分析 #生物信息学 #科研日常
00:00 / 00:09
连播
清屏
智能
倍速
点赞0