如何理解对GEO数据库中的数据进行差异分析的工具GEO2R
如何理解对GEO数据库中的数据进行差异分析的工具GEO2R,很多新手对此不是很清楚,为了帮助大家解决这个难题,下面小编将为大家详细讲解,有这方面需求的人可以来学习下,希望你能有所收获。
员工经过长期磨合与沉淀,具备了协作精神,得以通过团队的力量开发出优质的产品。创新互联坚持“专注、创新、易用”的产品理念,因为“专注所以专业、创新互联网站所以易用所以简单”。公司专注于为企业提供做网站、成都网站设计、微信公众号开发、电商网站开发,小程序设计,软件按需定制等一站式互联网企业服务。
GEO数据库中的数据是公开的,很多的科研工作者会下载其中的数据自己去分析,其中差异表达分析是最常见的分析策略之一,为了方便大家更好的挖掘GEO中的数据,官网提供了一个工具GEO2R
, 可以方便的进行差异分析。
从名字也可以看出,该工具实现的功能就是将GEO数据库中的数据导入到R语言中,然后进行差异分析,本质上是通过以下两个bioconductor上的R包实现的
GEOquery
limma
GEOquery
用于自动下载GEO数据,并读取到R环境中;limma
是一个经典的差异分析软件,用于执行差异分析。
一组样本在GEO数据库中用series
表示,比如GSE25724
, 包含了case和control两组样本,case组包含6个生物学重复,control组包含7个生物学重复,共13个样本,链接如下
https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE25724
在网页上可以看到GEO2R
的按钮,点击这个按钮就可以进行分析了, 除了差异分析外,GEO2R
还提供了一些简单的数据可视化功能。
1. Value distribution
该选项用箱线图展示所有样本中表达量的分布,结果示意如下
2. Profile graph
该选项用于展示某个探针/基因在所有样本中的分布,结果示意如下
点击Sample values
, 可以看到对应的表达量值,示意如下
GEO2R
进行差异分析的步骤如下
1. 定义样本分组
通过Define groups
按钮定义样本分组,首先输入一个group的名字,然后选择对应的样本,示意如下
2. 参数调整
通过页面下方的Options
菜单,可以调整差异分析时的参数,示意如下
第一个参数用于选择多重假设检验的P值校正算法,第二个参数表示是否对原始的表达量进行log转换,第三个参数调整最终结果中展示的对应的platfrom的注释信息,是基于客户提供的supplement file中的信息, 还是使用soft
文件中的信息。
3. 执行
点击如下所示的Top 250
按钮,执行差异分析。
结果示意如下,在页面上只显示最显著的250个差异基因
全部基因的结果可以通过Save all results
导出,通过GEO2R
, 可以在没有任何编程基础的情况下,顺序的完成差异分析。
看完上述内容是否对您有帮助呢?如果还想对相关知识有进一步的了解或阅读更多相关文章,请关注创新互联行业资讯频道,感谢您对创新互联的支持。
网页名称:如何理解对GEO数据库中的数据进行差异分析的工具GEO2R
标题网址:http://pwwzsj.com/article/geciop.html