辽宁数据库建设数据科学服务

时间：2021年05月15日来源：

GeneInteraction基因互作：基因相互作用指miRNA、lncRNA、circRNA或其它RNA介导DNA转录，从而影响mRNA的表达过程。通俗意义上来说，基因互作关系指基于序列预测的靶基因对。miRNA通过与靶mRNA的结合，或促使mRNA降解，或阻碍其翻译，从而***目的基因的表达。竞争性内源RNA网络是靶基因预测的研究深入，简称ceRNA网络。通过进行ceRNA网络的分析，我们能从一个更为宏观的角度来解释转录体如何构建基因表达调控网络，从而进一步挖掘基因在其中的调控机制。基本原理：miRNA主要通过与靶基因的非翻译区（UTR）结合而发挥其作用，对miRNA和mRNA、lncRNA、circRNA结合进行的预测称为靶基因预测。靶基因预测使用软件根据miRNA和靶基因间的结合的规律预测结合基因对。在生物体内，miRNA可以通过与proteincoding特异性结合，影响相关基因的表达，从而参与调控细胞内的各项功能。ceRNA具有miRNA结合位点，能后竞争性地结合miRNA，***miRNA对靶基因的调控。例如lncRNA与miRNA竞争性结合，影响miRNA调控mRNA的过程，**终导致的mRNA表达失调。我们使用基于序列预测的软件对差异分析得到的miRNA与mRNA，lncRNA，circRNA进行靶点预测和ceRNA网络分析。结合WGCNA的ceRNA分析。辽宁数据库建设数据科学服务

不同分组的全基因组拷贝数变化的比较：**初目的：不同分组的拷贝数变异在染色体水平和染色体臂水平的展示和比较。应用：不同分组的全基因组拷贝数变化的比较，展示genome-wideDNAcopy-numberprofiles。不同染色体臂的变异与临床表型息息相关。输入数据格式：一个表征每个样本的染色体变异（gain,balance,loss）的数值矩阵和样本分组信息。或者拷贝数的原始结果，可处理成所需矩阵。参考文献:(2):：本文计算出病人的拷贝数变异情况后，按照之前病人的分组比较了不同分组的染色体变异的异同，找到特定的染色体变异模式。确定了各组的特征，如lmonosomy2inPFB2,monosomy8inPFB3,monosomy3inPFB1,andgainof1qinPFB1.。云南数据科学承担各类项目超过400余项。

GSEA分析：GSEA全名为GeneSetEnrichmentAnalysis（基因集富集分析）。用以分析特定基因集（如关注的GO条目或KEGGPathway）在两个生物学状态（如**与对照，高龄与低龄）中是否存在差异。能够研究基因变化的生物学意义。普通GO/KEGG富集的思路是先筛选差异基因，然后确定这些差异基因的GO/KEGG注释，然后通过超几何分布计算出哪些通路富集到了，再通过p值或FDR等阈值进行筛选。挑选用于富集的基因有一定的主观性，没有关注到的基因的信息会被忽视，所以有一定的局限性。在这种情况下有了GSEA（GeneSetEnrichmentAnalysis），其思路是发表于2005年的Genesetenrichmentanalysis:aknowledge-basedapproachforinterpretinggenome-wideexpressionprofiles。主要是要有两个概念：预先定义的基因集S（基于先验知识的基因注释信息）和待分析基因集L（一般初始输入是表达矩阵）；然后GSEA目的就是为了判断S基因集中的基因是随机分布于L（按差异表达程度对基因进行排序），还是聚集分布在L的顶部或者底部（也就是存在差异性富集）。如果基因集中的基因***富集在L的顶部或者底部，这说明这些基因的表达对定义的分组（预先分组）的差异有***影响（一致性）。在富集分析的理论中。

棒棒糖图是直观显示蛋白质结构上的突变点**简单且有效的方式。许多致*基因具有比任何其他基因座更频繁突变的优先位点。这些位点被认为是突变热点，棒棒糖图可以用于显示突变热点以及其他突变位点。并可以对比不同**/亚型的突变位点。

基本原理

将蛋白质结构根据氨基酸顺序绘制为长条形，以不同色块标注不同结构域，在基因突变导致氨基酸改变的位置标注棒棒糖，并在棒棒糖圆球标注位点的突变频数以及突变位点。

数据要求

基因突变或者蛋白质突变数据

下游分析

1、突变位点靶向药物分析

2、驱动基因突变分析两个实验组的差异基因比较。

**突变频谱分析（突变模式）：目的：输入突变数据，用非负矩阵分解方法NMF分析突变特征，描述样本集的突变模式。什么是突变模式：这也是对TCGA数据的深度挖掘，从而提出的一个统计学概念。文章（Signaturesofmutationalprocessesinhumancancer）研究了30种**，发现21种不同的mutationsignature。如果理解了，就会发现这个其实蛮简单的，他们并不重新测序，只是拿已经有了的TCGA数据进行分析，而且居然是发表在nature上面！文章研究了4,938,362mutationsfrom7,042cancers样本，突变频谱的概念只是针对于somatic的mutation。一般是对**病人的**组织和*旁组织配对测序，过滤得到的somaticmutation，一般一个样本也就几百个somatic的mutation。还有其它文章（Mutationalsignatures:thepatternsofsomaticmutationshiddenincancergenomes）也是这样分析的从2013年提出到现在，已经有30种mutationsiganures，在cosmic数据库有详细记录，更新见：MutationalSignatures。它的概念就是：根据突变上下文分成96类，然后每类突变的频率不一样画一个条形图，可视化展现。应用场景：突变特征定义：体细胞突变是多个突变过程如DNA修复缺陷，暴露于外源或内源诱变剂等综合结果。目前能够对接超过50家实验室。云南数据科学

云生物立足于上海，提供相关数据科研咨询与服务。辽宁数据库建设数据科学服务

Adonis（置换多元方差分析，分析不同分组或环境因子对样品差异的解释度）：ADONIS置换多元方差分析（Permutationalmultivariateanalysisofvariance，PERMANOVA），又称非参数多因素方差分析（nonparametricmultivariateanalysisofvariance）、或者ADONIS分析。使用PERMANOVA可分析不同分组因素对样品差异的解释度，并使用置换检验进行***性统计。基本原理：置换多元方差分析（PERMANOVA，Adonis）是一种基于F统计的方差分析，依据距离矩阵对总方差进行分解的非参数多元方差分析方法。基本步骤是基于OTU丰度表，计算样本间样本间Bray-curtis距离，然后adonis分析生成结果，绘图展示。术语解读：OTU：operationaltaxonomicunits，分类单元Df：自由度，其值=所比较的分组数量-1；SumsOfSqs：即Sumsofsquares，总方差，又称离差平方和；MeanSqs：即Meansquares，均方（差）；FModel：F检验值；R2：即Variation(R2)，方差贡献，表示不同分组对样品差异的解释度，即分组方差与总方差的比值，R2越大表示分组对差异的解释度越高；Pr(>F)：***性p值，小于***。数据要求：OTU丰度表或者样本距离矩阵。辽宁数据库建设数据科学服务

上一篇：文章成稿指导数据科学售后服务服务至上「上海蕴卓生物科技供应」

下一篇：天津公共数据库挖掘数据科学经验丰富值得信赖「上海蕴卓生物科技供应」