100笔趣阁

手机浏览器扫描二维码访问

第三十七章 孟德尔随机化(第2页)

差异表达基因就是在疾病状态下与正常状态相比,表现出显著表达差异的基因。

第二步:随机化采样

有了数据之后,陈飞便开始进入实验的核心步骤——随机化设计。

孟德尔的豌豆实验中,随机化是为了消除实验中的人为偏差,每次他从不同的豌豆品种中随机选择个体进行杂交实验,这种方法使得实验结果更具可信度。

孟德尔随机化正是将这个思想引入了现代RNA-seq数据分析。

在他的设计中,他将癌症组和健康对照组的数据进行多次随机化采样。

通过反复随机抽样,他能够确保每次抽取的样本都能代表总体的真实情况。这种方法极大地减少了数据噪音,确保筛选出的差异基因更具生物学意义。

“就像孟德尔反复进行豌豆杂交一样,我也要在这批数据里反复筛选。”陈飞默默念道,手指飞快地在键盘上敲打。采样工作虽然枯燥,但非常关键。

第三步:差异基因分析

随机化采样完成之后,接下来就是关键的差异基因分析步骤了。陈飞使用了R语言中的“DESeq2”包,这是RNA-seq数据分析中非常常用的工具包,专门用来识别差异表达基因。

作为一个苦逼的生物领域搬砖人,陈飞甚至都没有下载过R语言的软件,但是系统君的实验思路写的非常认真,直接让他去参考转码人救星CSDN,

在指导下,陈飞很快安装好了R语言以及RSstudio。

一切准备就绪,可以开大了!

参考着github上一些前人的代码,一顿CtrlC,CtrlV之后,陈飞吭吭哧哧地写完了所有代码。在经历了python界面一次一次error,debug之后,他终于能够让代码运行了。

“看看这数据,”陈飞盯着屏幕上弹出的结果,目光锐利。

经过多次随机化采样和差异基因分析,他成功筛选出了肝细胞癌中显著异常表达的基因。

其中,有几个基因的差异尤为显著,它们在癌症样本中被高度激活,而在健康对照组中几乎没有表达。

这种差异引发了陈飞的浓厚兴趣:“这些基因很可能就是肝细胞癌的核心驱动因素。”

他将这些基因一一标记出来,接下来,他还需要进一步确认这些基因的作用。

第四步:基因调控网络的构建

光有差异表达的基因还不够,陈飞知道,基因之间并不是孤立的,它们通过复杂的调控网络来共同发挥作用。

因此,系统让陈飞构建一个基因调控网络,以便找出那些真正推动肝细胞癌发展的“核心节点”。

基因调控网络可以看作是基因的“社交圈”,某些基因在网络中扮演着关键角色,它们通过调控其他基因的表达,最终影响疾病的发展。

找出这些关键基因,就像抓住了疾病的“领袖”。

“我们要找的就是这些领袖基因。”陈飞说着,将所有筛选出的差异基因输入到网络分析软件中。

热门小说推荐
老兵传奇

老兵传奇

地球老兵在异界的奋斗史。人家修炼斗气魔法用的是冥想,主角用打针!人家讨老婆靠追。主角大老婆靠骗!第二个老婆靠抢!第三个呢?...

极品大教皇

极品大教皇

新时代好青年林克在玩山寨网页游戏的时候意外穿越,成了一个落魄教堂的神父。做神父没什么,问题是穿越时山寨网页游戏的系统也一起穿越了,携带系统的他必须当神棍,否则就会被搞成植物人。无奈,林克只好走上了做职业神棍的道路。简单的说,这就是一个新时代好青年被迫成为神棍然后创造和谐世界,顺便山寨圣斗士魔兽圣骑士刺客信条剑仙军团黑暗军团河蟹世界的故事。本书Q群31147165,验证码教皇...

宋朝大官人

宋朝大官人

第四届咪咕杯铜奖作品,宋穿历史小说中的精品之作,引人入胜,值得细读!...

大宋教书匠

大宋教书匠

大宋教书匠紧急通知现代教书匠纵横大宋王朝捭阖学术之巅。...

每日热搜小说推荐