四川组学实验数据科学服务

时间:2021年07月30日 来源:

    蛋白质主要由碳、氢、氧、氮等化学元素组成,是一类重要的生物大分子。蛋白质的功能由蛋白质的三维结构决定。蛋白质三维结构绘图,可以直观地展示蛋白质三维功能结构,广泛应用于单核苷酸突变功能分析、药物蛋白分子相互作用分析等研究领域。基本原理蛋白质三维结构绘图主要分为蛋白质三维结构预测以及对结构进行可视化两步。蛋白质三维结构预测是基于蛋白质中氨基酸序列预测蛋白质折叠结构的步骤,**常用的预测方法为同源建模,同源建模的原理是序列相似的蛋白质具有相似的蛋白质结构,要推测一个未知结构蛋白的三维结构,只需要找到与之序列高度相似的已知结构模板。在无法进行同源建模(找不到模型)的情况下,还有折叠识别及从头建模法,但是计算量大运行缓慢且建模准确度不如同源建模。获得蛋白质三维结构预测的pbd文件后还需要通过分子三维结构软件绘制可视化的三维图,并分析特殊位点(分子对接或突变位点分析),常用的有pymol和DeepView等。数据要求目标蛋白的氨基酸序列或者编码蛋白的基因序列,突变数据等。下游分析突变位点靶向药物分析等。 微生物多样性分析桌面软件。四川组学实验数据科学服务

genomeview(基因浏览图):genomeView是对基因组的可视化,可以直观展示RNA-seq和ChIP-seq的信号,证实转录因子结合对基因转录的影响等等。

数据要求:RNA-seq和ChIP-seq等数据。应用示例:文献1:Genomic landscape and evolution of metastatic chromophobe renal cell carcinoma.(于2017年6月发表在JCI Insight.,影响因子6.041)。本文对转移性肾嫌色细胞*进行了系统的基因组研究,文中绘制基因流览图对整个基因组数据进行了可视化。转移性肾嫌色细胞*的基因组景观和演化。 四川诊疗软件开发数据科学专业服务基因组数据全链条处理。

ssGSEA基本原理

对于一个基因表达矩阵,ssGSEA首先对样本的所有基因的表达水平进行排序获得其在所有基因中的秩次rank。然后对于输入的基因集,从基因集中寻找表达数据里存在的基因并计数,并将这些基因的表达水平求和。接着基于上述求值,计算通路中每个基因的富集分数,并进一步打乱基因顺序重新计算富集分数,重复一千次,***根据基因富集分数的分布计算p值整合基因集**终富集分数。

数据要求

1、特定感兴趣的基因集(通常为免疫细胞表面marker genes),列出基因集中基因

2、基因表达矩阵,为经过log2标准化的芯片数据或者RNA-seq count数数据(基因名形式与基因集对应)


下游分析

免疫细胞浸润分数相关性(corralation)分析

    GeneInteraction基因互作:基因相互作用指miRNA、lncRNA、circRNA或其它RNA介导DNA转录,从而影响mRNA的表达过程。通俗意义上来说,基因互作关系指基于序列预测的靶基因对。miRNA通过与靶mRNA的结合,或促使mRNA降解,或阻碍其翻译,从而***目的基因的表达。竞争性内源RNA网络是靶基因预测的研究深入,简称ceRNA网络。通过进行ceRNA网络的分析,我们能从一个更为宏观的角度来解释转录体如何构建基因表达调控网络,从而进一步挖掘基因在其中的调控机制。基本原理:miRNA主要通过与靶基因的非翻译区(UTR)结合而发挥其作用,对miRNA和mRNA、lncRNA、circRNA结合进行的预测称为靶基因预测。靶基因预测使用软件根据miRNA和靶基因间的结合的规律预测结合基因对。在生物体内,miRNA可以通过与proteincoding特异性结合,影响相关基因的表达,从而参与调控细胞内的各项功能。ceRNA具有miRNA结合位点,能后竞争性地结合miRNA,***miRNA对靶基因的调控。例如lncRNA与miRNA竞争性结合,影响miRNA调控mRNA的过程,**终导致的mRNA表达失调。我们使用基于序列预测的软件对差异分析得到的miRNA与mRNA,lncRNA,circRNA进行靶点预测和ceRNA网络分析。 根据委托方提供的参考文献和要求进行个性化特定分析。

    cox风险比例回归模型:产品详情产品评论(0)比例风险回归模型,又称Cox回归模型,是由英国统计学家。模型可以用来描述了不随时间变化的多个特征对于在某一时刻死亡率的影响。它是生存分析中的一个重要的模型。应用场景cox比例风险回归模型,由英国统计学家主要用于**和其他慢性疾病的预后分析,也可用于队列研究的病因探索单因素cox分析主要探索单个基因的**预后影响cox分析可用于转录组,甲基化,miRNA,LncRNA,可变剪切等等基本原理:在这里,是一个与时间有关的基准危险率,其选择具有充分的灵活度,一种可能的选择是采用概率论中的Weibull分布。是模型的参数。由于只要给定数据,就能够通过极大似然估计求出模型的参数,而的选择具有很大的灵活性,所以我们称之为一个半参数模型。对公式进行变形,得到:通过这个公式,我们可以发现,模型中各危险因素对危险率的影响不随时间改变,且与时间无关,同时,对数危险率与各个危险因素呈线性相关。这就是Cox回归中的两个基本假设。参数的极大似然估计:术语解读:1.输入变量,由m个影响因素组成:2.生存函数,输入为X时,在t时刻仍然存活的概率:3.死亡函数,输入为X时,在t时刻已经死亡的概率:4死亡密度函数,输入为X时。 采用机器学习算法对疾病的干性指数进行分型分类研究。四川诊疗软件开发数据科学专业服务

公共数据库挖掘、诊疗软件开发、算法还原与开发、临床统计等。四川组学实验数据科学服务

    cancersubtype**亚型分析:**的传统分型被***使用,但是有些分类与生存预后并没有明显的关系,因此需要研究人员开发有效的分类器对疾病进行针对性指导***。通过对分子谱与临床信息的综合性研究,重新定义**亚型,并对新定**分型进行分析,明确各亚型的发病机制和预后情况的差异。基本原理:使用SNFCC+与HC和NMF算法进行分子分型,然后进行分型之间的比较。CancerSubtypes包含以下5种计算方法对基因组数据进行**分子分型鉴定:术语解读:SNFCC+:相似网络融合加一致聚类(Similaritynetworkfusionplusconsensusclustering)HC:层次聚类(Hierarchicalclustering)NMF:非负矩阵分解(Non-negativematrixfactorization)DEG:差异表达基因数据要求:芯片数据。 四川组学实验数据科学服务

信息来源于互联网 本站不为信息真实性负责