大家好,我是本次的分享人糖糖糖,相信大家在进行深析分析中,转录组数据处理的时候总会遇到许多问题,今天我就来和大家分享一下转录组数据处理的方法。 在上一次的分享中,我们给大家分享了转录组数据下载的两种方法,一种是从 t、 c、 j 数据库里面下载我们的一个注册信息, 那么我们下载好的数据该怎么进行处理呢?我们就可以来到 r studio 里面进行一个数据的处理。首先我们先清空环境,设置工作路径,读取我们刚才下好的表达矩阵数据,就是从 t、 c、 g 数据库里面下载的表达矩阵数据, 然后我们可以看见这里有一个 stop, 就是 它正在读取的意思。 读取好了之后,我们可以看见环境变量中出现的这个 exp 这个对象,它是一个由六万多行四百多列的一个表达矩阵,我们可以运行一下 had 这个代码,就可以查看一下数据的前几行。 我们再读取我们从 tcga 数据库里面下载的一个注目信息,读取好了我们也可以打开看一下,这就是我们从 tcga 数据库里面下载好的注目文件。 接着我们使用 mer 函数将两个数据进行一个合并,这里会有一个 b y 点 y 等于零和 b y 点 x 等于零,它的意思就是指以两个数据框的行名作为合并的依据,将两个数据进行一个合并, 然后我们再加载我们后续需要用到的两个 r 包, 加载好了,我们再对我们的数据进行一个去重, 之所以我们要对数据进行去重,是因为我们最终的一个标准的表达矩阵是以行名为基因名,列名为样本名,中间为基因名在样本名中的表达量的一个情况, 这样才是我们标准的表达矩阵,所以我们才需要把我们的基因名作为我们的一个行名,行名是不可以重复的,所以我们要进行一个去重,这里会有一个 keep all 等于 t, 它的就进行一个去除。 去虫之后,我们就可以看见我们的数据从原来的六万多行变成了我们的五万九千多行,然后我们可以打开它看一下,因为我们要形成一个标准的表达矩阵,所以我们需要把基因名这一列提到最前面,成为这个数据的一个行名, 我们再运行这一行代码,将它提到最前面来,我们再打开查看一下,运行好了,现在我们可以看见基因名这一列就移动到了最前面,成为了这个数据的一个行名。 然后我们再打开看一下,因为基因表达矩阵是行名为基因名,列名为样本名,中间为基因名在样本名中的一个表达量的一个情况,所以我们需要删去前面的这五行, 运行这一个代码进行一个删除。运行好了我们就可以打开看一下, 这个就是我们使用第一种方法处理好了的一个数据结果了,然后我们再给大家分享一下第二种数据处理的方法。 第二种方法首先我们还是需要清空一下环境,再加载我们后面所需要用到的一个 r 包,这个 r 包如果大家没有下载的话,可以先运行上面这个代码,进行一个 r 包的下载, 接着我们再读取我们之前从 t c, g a 数据库里面下载的表达矩阵的数据。 读取好了之后,我们就可以点击它进行一个查看,我们可以看见它第一列的一个列名是 en symbol id, 而我们需要把它改成基因 id, 同样是因为表达矩阵的行名是基因名, 我们运行这一行代码运行好了,我们也可以打开看一下,这时我们就可以看见它的第一列的列名就变成了基因 id。 我 们再读取我们之前从基因库的数据库里面下载好的我们的注置文件,这个注置文件的话就比较大,我们读取好了就可以使用 save 将 r 环境中的对象保存为本地的 r data 格式文件,就是 r 的 专属数据文件,下次使用的时候就可以直接使用 word 函数进行一个快速的读取,避免重复读取消耗时间。 然后我们再进行一个去重,去重的原因也是我们上述所提到的,去重的原因也是我们上面所提到的,我们需要将基因名设置成我们的一个行名,行名是不可以重复的。 接着我们再运行这个代码,在这个代码中我们就使用 deplorer 这个 r 包中的 select 这个函数,将我们的 anno after 这个对象中的三列就是基因 id, 基因 type 和基因 name 进行一个提取,提取之后我们再将这个结果复制给我们的基因 anno, 我们就可以打开看一下,就对我们的基因 id、 基因 type 和基因 name 进行了一个提取。我们除了这种方法,还有其他的两种表述方法,还有一种就是直接列缩影提取, 我们读起好了也可以打开看一下,这边的话也是同样将我们所需要用到的数据提取出来了。还有第二种方法就是用 subset 函数进行一个列索进。第二种方法就是用我们的 subset 函数进行一个数据的筛选, 也是把我们所需要的三列给它筛选出来了。 接着我们再提取我们的 m r n a 的 表达矩阵,我们这个代码它就像是一个层层递进的关系,就相当于是首先我们先过滤出基因类型为蛋白质 编码的一个信息,将其他的基因类型过滤掉,然后在我们处理好这个的基础上筛选数据列,仅保留基因 id, 然后再提我们再提取我们的 m、 r n a 的 表达取证我们这个代码它就像是一个层层递进的关系,就相当于是首先我们先滤出基因类型为蛋白编码的信息,将其他的基因类型过滤掉, 然后在我们处理好这个的基础上,筛选数据框的列,仅保留基因 id、 基因 type 和基因 name 这三列,让数据更精简。我们再进行最后的一步处理,就是以基因 id 为匹配键,将数字信息与表达矩阵合并,最终得到基因注视加样能表达量的蛋白,编码基因表达矩阵,然后再将这个结果复制给我们的 m、 r、 e、 x、 p, 我 们运行一下 这边的话,就得到了我们的一个 m r x p 的 表达矩阵。我们再整理一下表达矩阵, 还是需要将我们的基因名设置成为行名,设置好了我们打开看一下,这个时候我们的基因名就变成了这个矩阵的一个行名,然而在这个矩阵中,我们第一列和第二列也不满足我们的标准表达矩阵的一个情况,所以我们需要把它进行一个删除,删除好了我们就可以打开看一下, 这个数据就已经是我们处理好了的一个数据了,然后这就是我们第二种数据处理的方法。感谢大家的聆听,我们下期再见。
粉丝661获赞5998

大家好,我是分享人糖糖糖,今天给大家分享一下申请分析转录组装的立马包差异分析。因为我们之前在 t、 c、 g、 a 数据库里面下载好了 f、 p、 k、 m 数据,我们后面进行差异分析的话,就只能使用立马包。 首先我们知道差异分析就是一种通过统计方法比较两组或多组生物样本,比如疾病组和正常组中基因蛋白等分子的表达水平,识别表达量显著变化的方法。 差异分析的筛选标准就是 log f c, 也就是差异倍数要大于一 p 值,也就是差异可能性评分要小于零点零五。 比如说我们现在要研究肿瘤组与正常组,我们想要研究是什么导致肿瘤的一个发生变化,那么我们就必须找到它发生的一个分子变化。 比如一个基因,它在我们肿瘤组中表达为一,正常组表达也是为一,那么我们就认为它没有研究的意义, 因为有差异才有研究的意义。如果他在正常组中表达为一,疾病组表达为十的话,那么我们就可以认为他在疾病组发生的一个异常高表达导致了这个疾病的发生变化。 所以我们通常在研究病理性质或者分子标志物的时候,我们就会去看他在疾病组与正常组之间是否会有这样的一个差异变化,所以我们才会说有差异才有研究的意义。 差异分析一共有三个包,首先是 lima 包和 e d g r 包,还有 disk two 包。 lima 包就适用于芯片数据和测试数据,并且数据分析使用 log 二转化后的 count 数据, d、 c two 包和 edg r 包适用于测序数据,数据类型是没有标准化的 cos 类型的数据。如果这三个包差异,使用这三个包进行差异分析的结果并不完全相同,根据自己的数据类型选择合适的 r 包,也可以选交集, 也可以取交集,选择差异。基因差异分析输入的数据的话就是基因表达,就是基因表达, 就是基因表达矩阵,行名为基因名,列名为样本名,要求数据已经经过标准化和对数转换。设计集证就是 行名为样本名,列名为对应实验相关的变量信息。对比矩阵就是设置实验组和对照组,一 对比矩阵就是设置实验组和对照组,实验组在前,对照组在后。以数值表示,一代表比较组,负一代表被比较组,零代表不参与比较。如果是两组样本的话,就无需对比对照,如果是两组样本的话,就无需对比对照。 然后我们去 r studio 里面进行代码的一个运行,我们先进行 r 包的加载, 如果大家没有安装的话,可以运行上面的这两行代码进行 r 包的一个安装。然后清空环境,设置工作路径,读取我们之前从 t、 c、 g、 a 数据库下载的表达矩阵 之后的对数据,之后对数据的注目信息的提取和并去重提取。表达矩阵都是我们之前分享过的,这边就给大家快速过一遍。 数据处理好了之后,我们就可以来设置我们的一个分组信息。 call names 就是 提取我们 m, r, e、 x、 p 的 一个列名,选择我们的第十四位和第十五位,我们可以来查看一下 它的一个列名的第十四位和十五位,我们可以看到有零一 还有十一, 这样代码的意思就是如果它等于十一的话,它就是我们的一个正常组,否则它就视为我们的一个肿瘤组。 运行好了,我们就设置好了我们的一个分组信息了,然后我们可以看一下我们这边就是正常组有五十个及肿瘤组就有三百七十四个, 然后让表达局正按正常和肿瘤进行一个排序。下面这段代码就是将我们设置好了分组的 normal 和初步,按 normal 在 前,初步在后的顺序进行排序,也就是按正常组在前及病组在后的顺序排序。 运气好了,我们再来看一下我们 m、 r、 e、 x、 p, 我 们就可以看见它的前面都是为我们的一个正常组, 然后我们再构建我们的 grouplist, 将因子水平化, 这就是我们的一个固定操作。因子水平化简单来说就是给分类变量的每一个类别一个明确的身份和顺序。接着构建我们的一个设计矩阵,用 model matrix 来构建, 后面是我们的一个分组信息,将我们的结果复制给我们的设置矩阵,我们来运行一下就可以了。 然后将运行好了之后,我们可以打开看一下这个地方就会出现一些零和一,这边的零和一就是我们之前所讲到的 ppt 中的对比矩阵,一代表比较被比较住,零代表不参与比较。 下面就将我们的设计矩阵因子化,然后设置我们的一个列名,打开看一下我们的,因为刚才我走快了,打开看,哦,就是设置我们的一个列名, 再设置我们的一个行名,打开看一下我们的分组信息,就是 normal 和 tomo 就 成为了我们的一个列名, 然后我们的 m, r, e, x, p 的 列名就作为我们 decim 设计矩阵的一个行名。 接着我们再进行 lima 包的差异分析,这里都是我们固定的操作,就不多讲,大家运行一下就可以了, 这里有个警告信息是没有关系的,只要没有报错就行。预习好了可以打开我们的 r e, s, 这里就可以看见我们的 r e, s 呢行名就是我们的基因名,另名就是我们变化的倍数,就是 log f c, 还有一个 平均表,还有一个平均表达量,还有一个 t 检验,然后就是我们的一个 p 值,还有一个就是矫正后的 p 值。 处理好了之后,我们就可以来设置我们差异显著的一个条件,我们已经得到了差异的结果,那我们那么我们就来筛选一下显著的差异结果, p 值就设置为零点零五, log f c 就是 变化的倍数,就设置为一,我们来运行一下, 然后我们根据调整后的 p 值和差异倍数就设置为一,我们来运行一下,然后我们根据调整后的 p 值和嵌接来判断我们的基因的一个变化, 其中我们使用 if else, 就是 说当我们的 r e, s 里面提取的一个数据,它矫正后的 p 值小于零点零五,同时 log f c 变化倍数大于我们设定的 log f c, 就是 一 的一个倍数师,我们就认为它是一个显著的基因,我们就可以进行我们的下一步判断,我们 log f c 的 一个倍数如果大于就是上挑,如果是小于就是下挑,没有显著变化就是 non。 然后我们来运行一下, 运行好了我们可以打开看一下,可以看见这边 r e s 里面就新增了欠值这一列,里面有我们的 down 和 up, 还有我们的一个 non, 然后我们就可以运行一下 table 这个函数,列出我们 up、 down 和 non 的 基数,可以看见我们下调的有三百七十八个,没有显著变化的有一万八千多个,上调的有一千多个。 最后我们就使用 right 点 table 这个函数来对我们 r e s 这个对象进行一个保存,点击 run 运行一下就好了。 最后我们就可以保存我们一个立马包的一个差异表达结果了,最后我们就可以保存我们的立马包的差异表达结果了。以上就是我今天给大家分享的关于立马包差异分析的结果了,感谢大家的聆听。

在先前的视频当中呢,我们简单的介绍了一下空间转路组,那么今天这一期,我们将从国内和国外公司两个维度来系统的总结空间转路组技术的差异以及各自的优势和应用的场景。目前呢,主流的空间转路组测距技术本质上分了两个路线,测距型和成像型。 中国公司呢,压住侧序型,欧美公司更注重沉像型加侧序型并行。国内的一般侧序生物公司华大制造 stoix 自主研发了 story seek 技术,分辨率是达到了零点二二微米。再一个呢,是百创 s 系列 s 三千的分辨率呢,达到了 三点五微米啊。接着再像其他的一些生物公司,比如说漯河之源, oe 生物呀,啊,生命之源呀,用的是结合其他的一些测序平台提供的一个科研服务。目前国内技术的主要局限是在于它的属局复杂度比较高,国内的测序平台呢,更倾向于预算受限,但是样本量大的项目。

大家好,我是分享人糖糖糖,今天给大家分享一下深情分析转录祖宗的立马包差异分析后的格式化,因为我们之前把我们的数据进行了差异分析,得到了差异分析的结果,今天我就来和大家分享一下差异分析的格式化。 我们先来看一下我们进行差异分析格式化的原因就是可以利用尼玛包完成差异表达分析后,通过火山图展示差异基因的筛选结果,通过热图呈现关键差异基因。在正常组与肿瘤组样本的表达模式,可以直观的对比基因表达组间的 差异与样门具类特征,可以直观对比基因表达的组建差异与样门具类特征,我们就可以来看一下我们的代码部分。第一步还是需要加载我们所需要用到的 r 包, 设置我们的工作路径,这个工作路径里面一定要包含我们差异分析的结果和 mrna 的 表达矩阵,读取我们差异分析的结果, 读记好了,我们可以打开看一下,可以看见这个表达矩阵,它的行名就是我们的基音名,另名就是差异倍数,平均表达量, t, 还有 p 值,还有调整后的 p 值等等。我们就可以用我们的 g g plot 函数来对我们的火山图进行一个绘制, 我们可以先绘制一下。好,我们可以看见我们就已经把这个火山图绘制出来了,我们可以看一下,首先是对这个 date, 也就是我们前面差异分析的一个结果进行一个绘制,然后设置它的一个横坐标, 它的横坐标就是 log f c, 它的重坐标就是我们负的 log 十的 p 值的对数转换, 它的意思就是我们取负值越往上皮质越小,然后我们还设置了我们的 x 轴,它的取值范围就是负二到二,挽折的范围就是零到四,还有一些小点我们设计了它的颜色大小,我们这边还有一个警告信息,如果它没有报错的话是没有关系的。 通过这个图我们就可以得到一些结论,它红色的就代表我们的一个下调,蓝色的就代表一个上调,绿色就是没有显著 没有显著的基因,它大多数都是绿色,说明我们差异显著的基因还是比较少的。这就是我们火山图的配置,但是我们在看文件的时候,它都会把重要的基因标注在上面,我们就需要运行下面的代码,把显著的上下调的基因给它处理出来。 我们这边就提取的是最显著的前二十个,然后我们排列选择二十个提取出来,提取它们的行名就是机名。提取出来了之后,我们再进行一个格式 编辑好了,我们就可以看到是这样的一个图,我们还是来看一下代码,它就是把这个图复制给了我们 p 这个对象, 然后把已得到的二十个显著基因提取它数据的一个结果,把这二十个基因前面的名称直接给他写了出来,然后得到了这张图。如果我们只想标注一个基因名的话,我们就可以运行这一个代码, 它跑出来之后就只呈现了一个基因和标注的信息,这就是火山图绘制的全部部分 颜色,这些是可以自己定义的,我们想要绘制的一个也是可以自己决定的,然后我们来进行热图的绘制,绘制之前我们还是要需要整理一下数据,其实你绘制 图只有一个代码,但是你前面整理的步骤是非常多的,我们这边就整理一个上调前二十个和下调前二十个,把它单独提取出来, 然后我们把基因通过 rolams 提取,就是提取它的一个基因名,这里就需要把我们昨天的 mrna 表达矩阵提取出来,然后我们把我们上面的一个基因和 mrna 放到 mrna 矩阵里面,得到了最后的一个 e、 x、 p。 接着我们再按之前和大家分享的方法处理我们的一个数据,把它进行一个分组,分成正常组和肿瘤组,再进行一个排序,构建 grouplist, 行名设置为列名,设置为行名。 处理好这些数据之后,我们就来加载我们绘制热图所需要用到的一个 r 包,如果没有下载的话,大家可以运行上面的这行代码进行我们 r 包的一个下载,加载好了我们就可以进行我们热图的一个绘制了, 这边就可以看见我们已经绘制出来了一个热图,我们还是来看一下这个代码的意思, 首先它对我们处理的 e、 x、 b 进行一个绘制,然后我们不对行列句类,因为它们的样本比较多,我们全部列出来就不好看了,但是我们要对列进行一个注示,然后不展示行名, 但是要对列进行一个标准化,因为我们要表达出他在两个组装的差异的话,就必须要标准化,这样才足够清晰更好看。接着就是颜色,这张图展现的信息行就是他的一个基因 列,就是他的一个样本,颜色越偏红就是越高表达,越偏蓝就是越低表达,颜色的深浅就是表达量的一个高低。 上面的就是我们的一个分组,蓝色的是正常正常组,橘色的就是肿瘤组。有部分基因在肿瘤组中上调,反之在正常组中下调, 这些就是导致疾病的关键所在。像这个热图展示的就是差异基因在正常组合肿瘤组的一个样本模式,比较直观的就可以去区分两组样本之间的表达差异,比较直观的就可以去区分两组样本之间的差异,这就是热图绘制的意义, 辅助我们后续的研究和佐证我们的结论。本次的分享就到这里结束,感谢大家的聆听。

很多学医的小邓告诉我,转路子 bug 二 s 可已经玩不出新高度,发不出好文件了,那是你不会玩。今天我来给大家介绍几个高级的玩法。趋势分析加 w g c n a 上期我们说到了怎么把常规的两三组比较做出高级感,本期继续高能。当你的样本是梯度设计或者是样本量足够大时,你必须掌握这两种降维打击的武器。 接着上期第三点,梯度处理样本,比如说时间序列浓度梯度趋势分析,别再一个时间点一个时间点做差异分析了,累死还不讨好。你要看的是经随着时间和浓度变化的整体趋势。 比如这篇文章细菌感染小鼠肺部的 r n six 时间序列趋势的分析,作者对感染后的不同时间点的 r n six 数据进行了区类趋势分析, 使用了 mfast 对 基因表达随时间的动态变化进行了软句类,得到九个不同的趋势促,这些趋势促反映出了不同的基因在感染的过程当中的表达变化模式。作者随后对这些趋势促进行了功能赋级分析,揭晓了每种动态模式背后 对应的生物学过程,比如说免疫反应、代谢调节、细胞修复等。从整体时间趋势上构建出疾病发生、发展的分子响应的动态框架。传统做法是逐时点做差异分析,对比看不到趋势坐标整体的行为特征。 趋势区内能回答哪些基因是最早做出反应,哪些是延迟响应,哪些基因表达是暂时高峰 vs 持续升高或降低。 这种趋势趋利在深信分析当中是属于时间维度的降维打击武器,当样本设计有时间浓度梯度时,是比足时间点差异分析更有效的高阶打法。转入组数据。第四种玩法,样本量多,多组比较用 w、 g、 c、 n a 模块化分析,原理其实很简单,物以类聚, 基因以表达,模块相似而聚类。关键是你怎么从结果当中讲出好故事?咱们看看 circadian 上面这篇文章,作者研究了心肌细胞去分化,取了九个时间点做转入组数据,用 w、 g、 c n a 基因被分成了二十个基因模块。 第一个是来之笔,他发现了先上调后下调,先下调后上调的模块,这说明什么?注意了,敲重点,这说明了他抓住了在去分化过程当中被激活,再分化过程当中又被关闭的动态程序, 这直接证明了体外培养能够诱导细胞状态逆转。说到这里,故事的基石就稳了。第二个是来之笔更绝,他想找一个能标志这个过程的关键枢纽基因,他是怎么找的?他专挑那些 在去分化最核心的模块里面高表达,在其他所有模块里面低表达的基因,这相当于什么因果关系?上一条视频我也提到了,这相当于在核心俱乐部当中找最专一、最忠实的会员。 这一筛就筛出了天中险合生酶 s n s, 后续实验验证,一做一个准。这筛选,这逻辑简直是充满智慧。我当年第一次用 w g c a 的 时候,光跑代码就花了两个礼拜, 出来的模块一堆,完全不知道从哪里下手去讲故事,简直像噩梦。就是缺了这种通过生物学意义反推审视数据结果的科研思维。记住了,科研思维是我们社细胞非常强调的,所以转录组的深度从来不来自于数据本身,而是来自于你分析的思维。 从差异分析到 w g c a, 是 一个从描述现象到挖掘网络和动态规律的跃迁。好了,如果你连 r 语还不熟,我这里有从零到一的保姆级教程,付费的不付费的都有, 甚至有 q 二单细胞复现教程私信我,我发给你。真的希望这两期内容能够帮你打开转录组分析的新世界。最后打个小广告,深信临床麦塔实验需要一对一辅导的后台私信我。

当前空间转换组的一个发展趋势呢?是撤去加成上融合提提升技术。第二就是多组学的空间整合。第三个是从分辨率竞赛转向可解释性,第四个呢是, 呃,降低这个成本和临床可用性。第五个就是 ai 以及大模型驱动去分析空间数据体量是巨大的。那 ai 呢?就可以用于细胞分割啊,空间模式识别,还有一个表情预测。

两分钟带你走进空间转录组。什么是空间转录组?传统的单细胞测序技术可以解释细胞内的经表达,但缺失了细胞在组织中的相对位置。 而并理切片则可保持组织结构,但缺乏了大规模的分子信息。而空间转录组则在组织切片上部署条形码进行原位测序,将基因表达谱和空间坐标精确对应,得到同时含有组织形态和转录信息的分子图谱。空间转录组的应用场景包括, 一、肿瘤微环境可以用来解析癌细胞、免疫细胞机制细胞的空间互作。二、用于神经科学,会指大脑不同的层次核团的基因蓝图,帮助理解发育和退行性疾病。 三、发育和再生,可以用来追踪黑胎器官的形态,建立伤口愈合或再生过程的基因梯度。四、病理性诊断升级,可以将病理性和分子信息进行叠加,实现看得见的分子分型。 举个例子,一项近期发表在 nature 的 研究,利用空间肿瘤组技术生成了乳腺癌危环境的空间图谱。 研究发现,肿瘤尖锐性 t 细胞并不是随机分布,而是沿着血管周围、腹肌形成了免疫热点。 第二,肿瘤相关的成纤维细胞在肿瘤边缘高表达免疫抑制相关基因,如 pdl 一、 tgf 一 可能在局部形成了免疫屏障,这些空间模式与患者的复发风险密切相关。 那么空间肿瘤组则首次实现了在完整的组织背景下同时观测形态和大规模基因表达,正在成为肿瘤学、神经科学和精准医学的重要工具。

空间转录组降维聚类图像乱码看不懂?别急,一分钟手把手教会你看懂!先看横纵坐标,横坐标是降维后第一组成分,纵坐标位降维后第二组成分, 代表了高维基因表达数据经过降维后映射到的二维空间。再看图里的小点,图中的每个小点就是一个 spot, 也就是空间转录的捕获位点,对应组织中的一个微小区域。重点来了,不同颜色代表不同的聚类,由降维表达相似基因表达模式的 spots 可能对应不同的细胞类型或不同的功能状态或不同的空间区域。再看这些图例,每个颜色对应一个具类,如一到一千六百四十四 spots, 其中一是具类编号,一六四,四是该具类中包含的 spot 数量,反映了该区域在样本中的覆盖程度。 这张图只是第一步,后续需要结合差异、基因分析、细胞类型、注视等才能确定每个颜色素的生物学意义。

大家好,上一个视频呢,我们聊了单细胞测序数据的质控的理论部分,然后今天我们就来进行一个实际的操作,看看 通过 r n 语言和 thread 包完成数据质控的一个代码的整体的运行。整个过程主要是包括了从计算质控指标再到格式化的一个筛选, 然后再到我们的这个过滤低质量的细胞。这几个核心的步骤。首先呢我们还是先加载我们之前分析得到的这个 select 的 对象, 然后把它调出来,然后后续我们就开始计算我们的直控指标,这一步是判断 细胞质量的一个关键,我们用这个这个函数来进行分别计算,腺体基因还有这个血红蛋白的基因,还有核糖体的一个基因的占比。腺体基因呢,就是这个以 m t 开头的,这个就是腺体基因结果存在这个 person 的 m t 里面。然后还有就是,嗯,这个以这个开头的,它就是为了去排除这个血红蛋白的假基因,脂酸功能性的一个血红蛋白基因,然后把它存到这个 person h b 里面, 然后最后这个和他们体内基因的占比呢,把它存到这个 percent r, i, b, o 里面,然后这三个指标呢,其实这个 percent m t 是 最关键最核心的,能够直接的反映细胞的凋亡类型状态, 然后后续的筛选也会重点的提到好,然后我们现在筛选,现在就进行一个质控前的一个格式化,然后我们主要是通过这个呃镶嵌图,就是 v l n plot 这个,然后做一个镶嵌图的一个格式化,然后它的绘制呢主要就是包括了这个 future rna, 还有 count rna, 还有 question mt, 这有三个的一个分布,就是三个灯组牌的一列,然后把它的这个 size 设置成零点一,让它不那么让它跟密结不那么重叠,然后再加上这个配色和这个,让整体看起来更美观。 最后再用这个 g g c 进行一个呃保存,我们运行一下第一张图,你看它就是这个分别包含了 nfc, r n a, 还有 count r n a, 还有 percent m t 这三个图的一个整体的一个把它排布在一起, 然后后面就是进行一个相关性的一个分析,然后我们主要是用到的是这个函数 creator 这个函数,然后做了两个散点图, plot 一 和 plot 二两个散点图。第一个是看这个 encounter rna 和这个 person 的 m t 的 关系, 然后去快速地找到高希立体占比的异常细胞。然后第二个是看这个 encounter rna 和 inferent rna 的 相关系, 就是去看它正常细胞的这两个指标应该是成一个正相关的,如果偏离趋势的话,那就是一个低技能的细胞。 然后最后再把这两张图合在一起,对应于我们后续的一个保存还有查看。然后这就是两张一个张图,一个是 percent nt 和 unk 的 rna, 还有 feature rna 和 unk 的 rna 一个相关性的图,然后后面我们就进行一个过滤 d 这样的细胞与质控后验证,然后这里就是开始过滤这个 d 这样的细胞,就要先设置一直去过滤细胞,这里用到的是这个这个函数, 然后去对核心指标做一个筛选,然后我们这设置的域值是 n f 值 r n a 大 于三百,小于七千五,然后 n k 的 r n a 是 从一百到八万之间,然后设置这个 percent m t 是 小于百分之二十。 然后大家注意就是我们设置这些域值的这些呢不是固定的,是需要根据自己的这个置空的图去进行一个调整的,也可以适当的把它放宽, 然后后面就可以通过这个 table 去嗯,查看我们过滤后的各样本的一个细胞数, 就这样,然后这个后面呢就是对我们自控的结果进行一个格式化,可以去对比看我们筛选出来的一个整体的一个效果。 然后也是用我们的这个镶线图,然后它这里它是把这个嗯 size 设置成了零,就是看它整体的一个分布趋势就可以了。然后对比看 前后两个的这个相线图,能够清晰的看到我们的低质量细胞被拆除之后,它的整体就变得更加的集中了, 就说明我们的智控达到了一个预期的效果。以上就是有关我们这个单细胞数据智控的代码的实操的分享, 这一步做好了,后续的标准化和细胞分层才会更有可靠的一个基础。然后核心就是从先从算指标,然后再格式化,最后再预知筛选,好,谢谢大家。

大家好,我们上个视频给大家分享了我们大做 w t 三 a 之前表达量数据的一个处理方法,那么如果我们有表达量数据相关的一个表型数据的话,接下来就给大家分享一下我们表型数据的一个清洗处理。 首先先加载一下我们清洗之后的表达取证,然后下载好我们的一个表情数据,我们这个表情数据是在 u c c 这个数据库里面进行下载的,我们直接读取它, 我们先加载一下需要的一个安装包,加载好之后我们读取一下我们的这个表情数据,可以看到这个表情数据横坐标是我们的个体名称,纵坐标就是我们的一些临床以及表情的一些数据了。 我可以看到这个文件里面一共包含包含着一百多个我们的一个表现数据,其中包含着我们的一个年龄,还有一些族族之类的,还有性别。我们就提取我们主要后面分析所用的到的一些表现数据, 可以看到我提取的表现数据就是我们的个体名称以及它的个体的年龄,个体的 m stage 的 一个阶段,以及它的一个 n 阶段, t 阶段和这个 t n m 阶段。我们把我们的表现数据 简略改成我们的这个名称。提取我们有经营表达信息的样本的一个表型信息,就可以看到我们这个数据。我们既有我们个体的表达矩阵的一个个体,还有我们的一个表型信息, 包括我们刚才提取的年期 m 分 期、 m 分 期、 t 分 期以及我们的 t n m 分 期。我们接下来需要整理我们的一个数据,把我们的数据都改变成一个数值型的数据,我们可以看一下。 首先我们要改一下我们这个 m stage 的 这个表型数据,可以看到它分为 m 零和 m 一, 还有 mx, 这个 mx 就是 它远处转音不清晰的一个个体,所以说我们把它设置为 na。 好, 可以看到我们把它设置为 na 之后, 就我们的数据里面就只包含 m 零和 m 一 了。然后我们查看一下我们的 n stage, 可以 看到我们的 n 分 期,包括 n 零、 n 一、 n 二,还有这个 n x 已经就是我们的淋巴结转移不清晰的一些个体,我们把这个 n x 设置为 na, 设置完之后我们的淋巴结转移不清晰的个体就给它,相当于给它去除掉了。然后我们将我们的 n 一 和 n 二把它设置为 n 加,然后 n 零就表保持不变,给它设置为两个阶段,就是 n 零和 n 加这两个阶段。好,可以看到我们就把我们的 n 阶段的一个表型设置为了 n 加和 n 零。 接下来我们来查询我们的一个 t 阶段的一个表型数据,包含这些指标。 然后我们需要把这个 t 一、 t 一 a、 t 一 b 都统一设置为 t 一 阶段,把 t 二、 t 二 a、 t 二 b 统一设置为 t 二阶段。好,可以看到我们设置完之后就只包含 t 一、 t 二、 t 三、 t 四阶段。那么我们把 t 一 t 二 统一划分为 t 一 到 t 二阶段, t 三 t 四统一划分为 t 三到 t 四阶段。划分完之后我们可以看到我们就持有 t 一 到 t 二阶段,以及我们的 t 三到 t 四阶段。 好,接下来我们设置一下我们的 t n m 分 期,可以看到我们 t n m 分 期指标就非常的多 啊,我们把这个没有报导的指标设置为 n a, 可以 看到我们这个没有报导的指标就相当于给它去除掉了。接下来我们把剩下的所有阶段统一给它划分为 stage 一 到二和 stage 三三到四, 然后可以看到我们这个 t m 分 期,就给它统一划分为 stage 一 到二和 stage 三到四这两个阶段。然后接下来我们把我们的这个数据全部设置为因子型的数据, 因为刚刚是最开始我们把我们的数据全部转换为了数值型的,现在我们用这个 factor 这个函数给它转换为因子型的数据。 好,接下来我们需要保存一下我们的表型数据,用于我们后续的一个 w g c n a 的 一个分析。 好,接下来我们把我们的这个表达矩阵,这个数据和我们的表型数据进行一下格式化, 同样我们对我们的这个表达矩阵给它构建一个树状图。这里爆出是因为我之前没有设置我们的一个工作路径,所以说我们要标明我们具体的一个路径名称,标明在这个地方, 大家可以看到这就是我们所画出来的一个表达矩阵以及它的一个表现信息的一个树状图,可以看到这上面这个矩阵就上面包含着我们每一个个体的一些名称, 下面每一行就是我们刚才所所设计的一个表型数据,可以看到我们第一行是我们的年龄, 第二行是我们的一个嗯 m 分 析, m 分 析以及嗯 t 分 析,还有我们的一个 t、 n、 m 分 析,这个色块的颜色就代表了它是处于哪一个表型信息的一个阶段。 比如说这个 m 分 期的一个重色色块,可能它就是属于 m 零分期,剩下的灰色色块属于其他的一个分期。白色色块就表面它没有这样的一个数据信息, 就是这个个体缺失这样的一个数据信息,就通过这个整个这个图就可以展现出我们这些个体的一些表型的一些整体信息。我们 这个视频给大家分享的内容就到这里了,我们下节就给大家正式分享一下我们 w、 g、 c、 n、 a 的 一些运行步骤,我们下个视频再见。

哈喽,大家好,这视频呢,我们主要来分享一下关于 gsea 的 呃原理以及相关代码的讲解。 首先呢, gsea 它叫做基因级负极分析,然后呢,它是将我们的基因在两个分子之间的差异表达程度,也就是 差异分析结果的 log c 值进行一个排序,那么这一个基因它并不一定是显著差异表达的基因。然后呢,我们来判断 呃来自功能注视基因级的一个基因是否落在了我们排序好的这一个基因列表的顶部或是底部。这里提到的功能注视基因级的话,可以是你 g o 数据库里面的这一些呃功能的基因集,或者是我们 k g g 数据库的一些通路的基因集,或者是说我们这一个数据库它的一个基因集 也可以是你自己自定义的一个呃功能基因集和这一些都可以,然后呢,然后来对它们进行一个分解分析。 呃,在我们传统的方法,也就是之前视频所分享到的 g o 和 k g g 赋值分析,它们是先设定了一个差异倍数和 p 值的一个筛选域值, 从而筛选出差异显著的一个基因列表,再对这一些基因再进行一个功能复制分析。那么像这样的一个分析的话,它会丢失掉大量的基因表达量的连续信息,并且它的节度, 它的一个结果依赖于我们主观的一个阶段值。也就是说你这个差异基因筛选的条件严格一点,它可能复制到的通路 会少一些,然后你差一斤筛选的条件宽松一些,那么它覆盖到的通路就特别的多, 而且我们可能这两次覆盖到的一个结果都会有一些区别,那我们的 gsa 的 话,它就抛弃了我们这个筛选预值的这样一个情况, 那他检验的一个问题就是,呃,来根据与我们表型一般就疾病和正常他的个相关性排序的基因列表中某个预先定义的基因集, 他其中的这一些基因是否倾向于聚集在我们列表的底部或者是底部?那如果是的话,则说明该基因集的一个血统表达与我们的这个疾病是密切相关的, 比如说疾病的一个发生可能就和这个基因级所代表的对应的通路或者是功能,这有一个显著相关。那么接下来看着我们的一个代码, 这边我们需要加载这一些包,需要注意的是我们有一个这一个包, 它是一个别人编码的,我们可以打开看一下, 就别人编码的一个 r 包,里面的话就是有这四个函数,后续我们会讲到怎么来用。 全部加载之后我们需要读取的数据有两个,一个就是差异分析结果的一个 这一个表格啊,这是我们经过 email 报进行差异分析的结果啊,这是它的基因名,这是它差异分析的一些相关信息。 第二个是我们的一个通路基因集或是我们的一个功能基因集,那这个功能或是通路基因集的获取途径。像我们这里提到的这三个, 现在看一下这一个,也就是 gsea 数据库,它这里是专门有一个数据库,输入 gsea 进入这一个网站啊,就是这一个。 好,然后呢我们进去之后点击这一个地方可以看到它这边把呃这一些基因级分成了几个类,上面的是我们人类的,下面的是少数的 人类的话,我们最多使用的是这一个 holmarker 基因集,还有 c 二的基因集和我们 c 五的基因集, 那么 c 二基因可以我们这样点击返回,来到对应的这个界面,它对应的其实就是我们有一些 kgg 相关的一个通路的基因集,那我们往下翻,看到 c 五 c 五对应的其实就是我们 g o 的 一个数据库里面相关的一些基因集,然后 marker 的 话就是这一些呃也是我们比较重点关注的一些常见的一些通路的基因集,一共有五十个,点击这里 在下方可以看到它基因集里面所包含的一个呃功能,或是说通路的具体名称。 数据的下载的话,我们点击基因 symbol 就 可以下载,可以点击看一下,这边就随便填一个邮箱,这边就会下载下来,下载下来之后的话,我们用表格打开, 它就是五十条通路,然后后面就是每一个通路它对应的基因列表, 那么在 r 当中的读取的话,我们用这一个函数来读取,因为它是 g m t 格式的, 读取之后的话它就变成这样的一个呃两列数据,一列是我们对应的通路名称,另一列就是这一个通路,它包含的一个基因列表,可以看这是第一个通路,我们往下翻就是第二个通路的, 这是我们 gsea 它通路基因机的一个获取。那如果说虽然说我们在 gsea 数据 网站的话,是可以看到有呃 kgg 和 ko 相关的一些功能的通路,但是其实后面做分析做多了会发现它 gsea 里面不管是关于 kgg 还是 ko 的, 它有一些通用里面的基因集,其实和对应的 g o 和 k g g 数据库里面的基因集是有区别的, 就它可能里面的基因的数目会有一些区别。都说有时候你可能做 g o 和 k g g 复制分析,你可以显著复制到这些通路,但做 g s e a 的 话可能就哦不行, 所以说的话,你想直接用你呃进行 g o 和 k g g 赋值分析里面的这一些通路的基因集来进行我们的 g s e a 赋值分析,就可以通过我以下的这些代码来提取 g o 数据库和 k g g 数据库当中的这一些 呃通路的基因集,或是说功能的基因集。那先看一下我们 g o 数据库的一个呃功能基因集的提取,这里就需要用到我们刚才 提到的这个别人编码的一个提取,专门提取 g o 通路的荆棘的一个 r 包啊,它其实就是一个编辑的一个啊函数, 我们用这一个函数来给它读取进来就可以了。需要注意的是可以看到我们这里的读取, 要看你提取的是哪一个参考数据的。呃,如果说你研究的是小鼠的,那么你小鼠的这个注视文件就是这里要改成 mm 啊,如果说你是大鼠的,你就要去下载大鼠的对应的这一个包 啊,如果说你是人类的,就是读取这个就可以了,就这些包要提前给它安装好,这样我们才可以调用。然后面这两个参数就不需要管, 这边它会把 g o 数据库里面所有的这个基因集给你读取进来,在这一个这是我们读取进来的一共是有两万多条通路。 先看一下第一列,第一列的话就是它里面所包含的所有的基因,一共有两万多个基因,然后每一个基因它可它是包含在了五十三条通路当中。 第二个的话就是我们通这些通路它的一个分类,这属于 b p 还是 c, c 还是我们的 m、 f, 最重要的就是我们的第三列和第四列这个数据。先看一下第三个 对应的是不是就是通路它里面所包含的基因的名称。比如说第一个通路它包含了三十个基因,然后它对应的基因是哪一些名称。第二个通路它包含的只有三个基因啊,它的基因名称, 这也是我们做附件分析所需要的一个结果。那这边的话可以看到它对应的都是我们 g o 数据库里面的 id 号,所以说我们还需要第四个数据,也是它 id 号所对应的具体的功能名称,或者说它的一些通路名称,就是我们两个 重要的数据,先把我们通路 id 所对应的名称给它提取出来,这边我们给它改一个列名,就是这一个样子。 接下来就是提取我们的基因列表,直接指定到 我们这一个数据里面的这一个槽,就可以把它全部提取出来,提取出来就是这样一个列表格式,那么这个列表格式我们需要给它转换一下,因为最开始我们在读取 gsea 数据库下载的这个数据的时候,读取进来是长这个样子的,只有两列,一列是通路名称,一列是基因列表,那么我们这一个是不是也要转换成对应的格式?一列是通路名称,一列是列表,那我们直接制一个数据框,然后第一列是 通路名称啊,第二列是我们的基因名称,那么通路名称对应的是什么呢?我们就要来重复我们的通路名, 就这里可以看到,比如说我们第一个通路它有三十个基因,那么我们这一个通路名称是不是要重复三十次?然后第二个的话它只有三个基因,那就只只重复三次。所以说我们这边用这个函数,它是一个呃重复的函数, 然后里面的内容就是我们基因列表里面的名称,可以看一下 这运行是不是就是我们这个通路的 id 号,然后这是它重复的次数,重复的次数对应的就是我们的这一个对应的金额数目,大家可以看一下 这里每一个通路它对应的有多少个基因,它就要重复多少次。然后接下来就是我们的基因,直接是把我们基因列表里面的这些基因给它依次列聚下来,就可以这边运行一下,是不是就制成了这样一个列表, 然后的话你就可以把这一个列表和你之前提取的基因名这里进行一个合并。那我一般的话是等它复制结果出来之后,我挑选一些我感兴趣的,然后再把它对应的这个名称给它合并出来, 这是我们 g o 数据库它里面相关的一些功能,基因级的提取。那接下来看一下我们 k e g g 数据库里面一些基因级的提取,这里也是需要加载一个新的 r 包,也就是这个 r 包啊, 加载进来之后的话,这也可以看一下,呃,如果说你是想提取 k e g g 里面所有通路的一个呃列表的话,你就运行这一行代码,那么它就会把 k e g g 里面所有通路的 名称给你列出在这儿,以及包括它的 id 号,通名都是有的。然后呢我们提取这里,注意我们 k g 的 话一般也是提取的它的 id 号,那么刚好它的 id 号是我们的行名,就说我们用行名来 提取,这样我们所有通路就名称就提取在这儿了,那么后面我们为了方便的话,只选择其中几个,这里我们选择了五个 通路,然后把这五个通路的相关数据给它提取出来,就是这里,这是我们对应五个的,点开里面的内容 可以看到这是我们第一个通路的 id 号,然后它这个通路的名称啊,以及这个通路的一些相关描述啊,然后我们需要注意的就是基因,这里就是我们通路的一个基因, 接下来的话我们就需要用到一个循环来分别把我们的这一个列表,可以看它也是一个列表制成一个数据框,而且是只有两列的数据框。接下来看一下我们列表里面进行的一个操作,首先是把我们列表里面 每一个通路先分别提取一下,我们这里先提取,第二个提取出来的话就是这里,然后我们把 基因这一列的数据先给它提取出来,制成一个数据框,这是不是就是它所有的基因?但可以看到它这个基因是什么格式?第一行 是下面这一个基因所对应的 interest id, 然后第二行的话才是它的基因名,就是 symbol 格式的基因名以及它完整的一个基因名称啊,后面还有它对应的一个这个 k g g 里面的一个编号, 然后下面一列的话就就是下一个基因的 intrees id 啊,然后是基因名以及它完整的基因名,是不是我们想要的具体的 symbol 格式的基因名都在偶数行,二四六八是不是都是在这里?所以说的话,我们现在先制一个列表, 就制成我们刚才需要的一列为通路,一列为我们的基因,然后通路的话就是直接是我们这个通路的一个名称,基因的话就是我们刚才这一个 列表里面的所有的偶数行,这也是一个循环,可以看一下啊,这是我们基因列表的一个总的行数,然后从二到它最后一个可以看到它基因这里可以有一百九十行,那么 n 六 这一个是不是就是一百九?那从第二到一百九,然后以二为间隔来依次输出它对应的结果,可以看一下是不是就会输出我们所有的一个偶数。 好,然后把所有的偶数行给它提取一下,做出来就是这样的一个表格,那么接下来我们要对这个表格也是要进行一个处理,首先就是我们要把它的机名 simple 格式的机名提取一下,然后把后面的这一个给它删掉,那我们相当于就直接用这个分号给它们进行一个分割,然后我们取第一个部分就可以了。接着我们对它的一个通路名称,也是 用这个符号给他进行一个风格,我们取第一部分就是他的一个通路名称,后面这个后缀是不需要的。所以说我们这里先对基因与分号风格取第一部分啊,通路也是以这一个小横杠风格取第一部分, 最后我们就得到了这样的一个表格,那可能有一些呃基因,它没有具体的这样一个名称,就用这个代替它,对我们后面的分析其实影响也不大, 这样我们循环来运行,这一个循环结束之后,这里需要注意我们创一个新的列表, 然后再循环来运行,这样我们五条通路它的一个基因列表就制成了对应的表格。以上呢就是我们三种提取对应数据库的一个基因级的方法。


空间转录组学给基因表达提上定位标签你有没有想过,当我们身体的某个器官发病时, 不同区域的细胞在分子水平上究竟有何差异?传统基因检测就像把水果拼盘榨成汁,能知道有哪些成分,却看不出原来的摆盘格局。而空间转录组学正是解决这一难题的利器。它能在 organizations 切片上 精确记录每个基因的住址信息,让科学家第一次看到基因表达的活地图。一、 为什么我们需要空间信息?我们的身体是一个精密的空间社区,大脑皮层的不同区域负责不同功能,肿瘤边缘和核心的细胞行为截然不同, 植物根系在干旱区的应对策略也因地而异。然而,传统转路祖学技术存在一个致命缺陷,他们都会破坏组织原有的空间结构。 批量测序把整个组织磨损混合,得到的是平均信号,掩盖了细胞差异。单细胞测序虽然能区分细胞类型,但在解离过程中丢失了谁在哪里的关键信息。 空间转录祖学的革命性在于,它完整保留了细胞类型、空间位置、功能表层的三维关联,让科学家能够原位解析生命活动的精密调控网络。 二、核心技术给 mrna 打上位置条形码目前主流技术分为两大阵营,分别用不同策略实现空间定位。 一、基于测序的条形码技术想象组织切片上覆盖着一张布满微型二维码的拨片,当组织中的 mrna 分 子穿过这些二维码区域时,会自动被印上对应的位置编码。 经过测序后,通过解码,这些标签就能还原每个基因的表达位置,使 exogenomics 像用两微米建方的网格划分组织,每个格子独立记录基因表达。 华大 stereosec 利用 dna 纳米球阵列实现零点五微米的亚细胞级分辨率,视长可达十三乘十三厘米,能完整扫描整个器官切片。 这类技术的优势是能无偏检测旋转路阻,适合构建组织基因表达图谱,但对低风度基因的检测灵敏度有待提升。二、基于成像的荧光拍照技术这种方法更像是给组织拍分子照片, 通过多轮荧光探针杂交和显微成像,直接在细胞甚至亚细胞层面点亮特定基因。 melfish 采用组合标记和错误校正算法,可同时检测上万个基因。 nano string cosmos max 能同时检测上千种 rna 和上百种蛋白质,实现多模态分析 成像技术的优点是分辨率极高,可观察转录本在细胞内的精确定位,但通常采用把向策略,无法像测序法那样无差别捕获所有基因。 三、从实验室到临床改变游戏规则的应用核心化瘤微环境发现边缘地带的秘密在乳腺癌研究中,空间转录祖学揭示了一个惊人发现, 促进血管生成的基因主要在肿瘤边缘的机制细胞中活跃,而非肿瘤核心区域。这解释了为什么肿瘤边缘更容易形成心血管, 也为靶向肿瘤微环境的治疗提供了新思路。更有研究通过分析小细胞肺癌的免疫微环境,开发出基于 ccl 五 cxcl 九区化因子指数的预后模型,可精准预测患者对免疫治疗的反应 大脑发育位置决定命运小鼠大脑发育研究表明,海马区的神经干细胞因所处位置不同而命运迥异, 靠近脑室的干细胞保持增值活性,而远离脑室的则倾向于分化。这种位置决定功能的规律,为神经再生修复指明了新方向。 植物研究抗旱根系的空间密码在陆道根系研究中,科学家利用 stereosec 技术发现耐旱品种在特定根区高表达、 hmgb 等关键调控基因,这些基因就像抗旱指挥官,协调特定细胞群形成应对干旱的分子防御体系。 研究还揭示,叶片衰老时,养分回收也遵循严格的细胞类型和空间特异性规律。四、数据挑战从海量的分子地图中挖掘故事空间转录组产生的数据极其复杂,需要专门的生物信息学工具。细 胞类型注视低分辨率数据,去借助算法去卷积,像拼图一样推断每个区域的细胞组成 空间巨类分析识别表达模式相似的功能区域。如发现肿瘤内免疫热点, 多组学整合,将转录组数据与蛋白质代谢物信息叠加,构建更完整的分子景观。当前,技术正朝着两大方向融合, 测序与成像的界限日渐模糊,如十 x x c 应用平台兼具两者优势,多模态共检测成为主流,同部分析 rna、 蛋白质和表观修饰。 五、未来展望精准医学的空间导航空间转录祖学正在重塑生命科学研究范式,在临床应用中,他有望实现。三、精准病例诊断通过分析肿瘤微环境的空间抑制行为患者分层提供分子依据。 四、药物靶点发现定位疾病关键调控因子的精确位置,提高药物研发效率。五、再生医学指导 解析器官发育的空间编码规则,指导人工组织构建。尽管仍面临成本标准化和数据分析复杂度等挑战,这项技术的分辨率、通量和易用性正在快速提升。 正如一位研究者所说,我们不再只是读基因的书,而是终于知道这本书在身体的哪个书架上,甚至哪一页。 空间转录组学正带领我们走进一个未知及功能的生物学新纪元。四、空间转录组学技术原理发展与应用前景空间转录组学技术原理发展与应用前景,空间转录组学的原理及应用 解锁植物时空奥秘空间转录组 stereosek 助力您的研究更进一步。 s c i e n c e 点 o r g。 科学教育资源空间转录组学案例与跨学科研究指南。