山东生物/药物信息学分析数据科学欢迎咨询

时间:2021年05月05日 来源:

    术语解读:PPI:蛋白质-蛋白质相互作用(protein-proteininteraction)PPImoduleI:指蛋白质相互作用模块,一个模块指向一个功能数据要求:基因列表应用示例1:(于2018年3月发表在Immunity.,影响因子)T细胞活化过程中产生蛋白质组进行多重定量分析,然后对差异表达蛋白权重聚类,并将聚类蛋白叠加到PPI网络上以识别功能模块。D.模块大小的分布,通过将每个WPC(权重聚类结果)中的蛋白叠加到蛋白-蛋白相互作用(PPI)网络上识别模块。每个模块的蛋白质数量显示出来。E.各个模块及其交互的关系图。圆圈(节点)表示90个模块,圆圈大小与模块大小成比例。边连接共享PPIs的模块。在(F)和(G)中进一步扩展了装箱模块。F.来自WPC3的细胞质和线粒体核糖体的四个互连模块。显示了蛋白质的名称和每个模块的代表性功能术语。G.来自WPC3的蛋白酶体,OXPHOS和线粒体复合物IV途径的模块。 云生物提供数据科学服务。山东生物/药物信息学分析数据科学欢迎咨询

    ROC机器学习受试者工作特征曲线(receiveroperatingcharacteristiccurve,简称ROC曲线),又称为感受性曲线(sensitivitycurve),是用来验证一个分类器(二分)模型的性能的。一般应用于直观展示敏感性和特异性连续变量的综合指标,如比较多个biomarker或临床参数的诊断表现、比较多个算法的分类效果。基本原理ROC曲线工作原理是,向模型中输入已知正负类的一组数据,对比模型对该组数据的预测,衡量这个模型的性能。术语解读:1、TP(TruePositive,真正,TP)被模型预测为正的正样本(原来为正预测为正)2、TN(TrueNegative,真负,TN)被模型预测为负的负样本(原来为负预测为负)3、FP(FalsePositive,假正,FP)被模型预测为正的负样本(原来为负预测为正)4、FN(FalseNegative,假负,FN)被模型预测为负的正样本(原来为正预测为负)5、真正类率(TruePostiveRate)TPR:TP/(TP+FN),**分类器预测的正类中实际正实例占所有正实例的比例。Sensitivity6、假正类率(FalsePostiveRate)FPR:FP/(FP+TN),**分类器预测的负类中预测为正实例(实际为负实例)占所有负实例的比例。1-Specificity7、真负类率(TrueNegativeRate)TNR:TN/(FP+TN)。 云南组学实验数据科学售后分析在分子生物、细胞生物、实验动物、病理、临床样本方面已与长三角100余家企业形成良好合作关系。

bubbles(不同分组的基因表达或通路富集展示):

Bubbles可以同时展示pvalue和表达量。例如展示motif的pvalue和motif对应的转录因子的表达量,方便快速看出转录因子富集且高表达所在的group,预示着该分组对细胞状态的改变(例如细胞分化、转移、应激)起关键调控作用;例如做基因功能富集分析时,展示富集的通路qvalue和基因数量或geneRatio。

基本原理:

Bubbles的实质是分组数据下基因表达量或通路内基因数量的可视化,同时可以展示pvalue。

数据要求:

表达矩阵,分组

    LASSO是一种机器学习算法,通常被用来构建可以预测预后情况的基因模型。也可以筛选与特定性状相关性强的基因。LASSO对于高维度、强相关、小样本的生存资料数据有较好的效果。LASSO的基本思想是在回归系数的***值之和小于一个常数的约束条件下,使残差平方和**小化,从而使某些回归系数严格等于0,来得到可以解释的模型。该方法的估计参数λ为调整参数。随着l的增加,项就会减小,这时候一些自变量的系数就逐渐被压缩为0,以此达到对高维资料进行降维的目的。LASSO方法的降维是通过惩罚回归系数的数量来实现的。基本原理LASSO回归的特点是在拟合广义线性模型的同时进行变量筛选(VariableSelection)和复杂度调整(Regularization)。因此,不论目标因变量(dependent/responsevaraible)是连续的(continuous),还是二元或者多元离散的(discrete),都可以用LASSO回归建模然后预测。这里的变量筛选是指不把所有的变量都放入模型中进行拟合,而是有选择的把变量放入模型从而得到更好的性能参数。复杂度调整是指通过一系列参数控制模型的复杂度,从而避免过度拟合(Overfitting)。对于线性模型来说,复杂度与模型的变量数有直接关系,变量数越多,模型复杂度就越高。


检测服务及数据分析助力取得2020年国自然面上十项、青年基金十八项。

industryTemplate微生物多样性分析桌面软件。四川生物/药物信息学分析数据科学共同合作

甲状腺疾病的靶向药物研究。山东生物/药物信息学分析数据科学欢迎咨询

    GeneBodyProfile(对比不同的样品在某一区域的信号特征,不**于ChIP-seq、DNase-seq、ATAC-seq数据):GeneBodyProfile表观遗传修饰和对基因表达、细胞发育等过程有着深远的影响,但相关的研究还未完善。通过对比不同的样品在某一区域的信号特征,了解不同情况下该基因的表观遗传情况,帮助更好的了解其发***展过程。一般应用场景:观察相关基因转录起始位点(TSS)、转录终止位点(TTS)、genebody以及两侧信号特征;观察某一功能区域(CpGi、TSS、TTS、peaksummits或enhancer区)及其两侧信号特征。数据要求:ChIP-seq、DNase-seq或ATAC-seq数据。下游分析:基于展示的基因或功能情况1.补充展示部分的已有相关研究2.解释展示部分对研究课题的意义。 山东生物/药物信息学分析数据科学欢迎咨询

信息来源于互联网 本站不为信息真实性负责