安装使用pyclone进行克隆演化推断,数据库设计
分类:威尼斯手机娱乐官网

pyclone介绍

  可以根据多个样品突变的allele frequency 和 copy number,推断出有该突变的细胞克隆所占的比例(cellular prevalence)在不同样品间的变化。比如:
威尼斯手机娱乐官网 1
每个cluster包括一些突变,它们在各个样品中克隆比例有着一致的变化

  1. 病人信息表
  2. 样品信息表
  3. 测序记录表
  4. 基因位点表
  5. 变异信息表
  6. 测序变异表
  7. 套餐信息表
  8. 癌症信息表
  9. 结构变异信息
  10. 基因融合变异信息
  11. 药物信息表
  12. 用药信息表

安装Conda

从官网下载Conda
有两个选择,一个是带有python 2.7的Miniconda ,带有python 3.6的Miniconda3 ,经本人电脑测试Miniconda3使用pyclone会出现问题,因此建议安装带python2.7的Miniconda
直接bash下载的文件安装
Miniconda2-latest-Linux-x86_64.sh
按照操作,第一步输入yes同意协议,然后可以选择安装路径,默认本地家目录,同时相应的python也会自动安装到目录

分表字段及数据限制

安装pyclone

按照官网说明安装pyclone
conda install pyclone -c aroth85
成功运行如下

[ywliao@WS02 utilities]$ PyClone 
usage: PyClone [-h] [--version]
               {setup_analysis,run_analysis,run_analysis_pipeline,build_mutations_file,plot_clusters,plot_loci,build_table}
               ...
PyClone: error: too few arguments

病人信息表

  1. 姓名
  2. 年龄
  3. 性别
  4. ID
  5. 联系电话
  6. 地址
  7. 医院
  8. 医生
  9. 原发癌症 【外键】
  10. 分析套餐 【外键】

运行测试文件

进入test/examples文件夹

PyClone run_analysis_pipeline --in_files SRR385938.tsv SRR385939.tsv SRR385940.tsv SRR385941.tsv --working_dir pyclone_analysis

在pyclone_analysis文件下会生成如下文件夹或文件

config.yaml   #指定用于PyClone分析的设置文件
plots/    #包括生成的全部图
tables/   #包括生成的全部表格
trace/    #包括MCMC抽样算法的原始痕迹
yaml/   #存放yaml突变文件的文件夹,用于PyClone分析

样品信息表

  1. 采样组织类型
  2. 采样时间
  3. 样品量
  4. 样品单位
  5. 病人信息【外键】
  6. 备注

输入的tsv文件的格式

tab分隔存在header的文件,包括以下几列

  • mutation_id,一个能够识别突变的单一ID,比如chr22:12345或者TP53_chr17:753342
  • ref_威尼斯手机娱乐官网 ,counts,突变位点的reference reads数
  • var_counts,突变位点的variant reads数
  • normal_cn,正常population的细胞拷贝数,对于人类常染色体来说是2,对于人类性染色体来说是1或2
  • minor_cn, 肿瘤细胞的minor拷贝数,一般从WGSS或者芯片的数据预测出
  • major_cn,肿瘤细胞的major拷贝数,一般从WGSS或者芯片的数据预测出

如果你没有minor copy number 和 major copy number,那么minor copy number设为0而major copy number设置为预测的总的拷贝数。
除了上述的列,其它列会自动忽略
使用PyClone run_analysis_pipeline -h查看帮助

测序记录表

  1. 测序ID
  2. OG ID
  3. CA-PM号
  4. R1
  5. R2
  6. 文件大小
  7. 样品信息【外键】
  8. panel
  9. 测序时间(取测序read文件的最后修改时间)

绘制进化树

如果pyclone的可视化无法满足你的需要,比如说你需要绘制进化树,可以使用supra hex;可以参考
这里提供一个将pyclone中的loci.tsv结果文件转换成supr hex能直接处理的矩阵的R函数

library(data.table)
library(supraHex)

Loci_tsv_To_Input <- function(dt){
  dc <- dcast(dt, formula = mutation_id ~ sample_id, value.var = "cellular_prevalence")
  dt_out <- dc[,-1]
  rownames(dt_out) <- dc[,1]
  return(as.matrix(dt_out))
}

dt <- fread("~/project/PE/Clone/tsv/Guoyuqin/tables/loci.tsv")
data <- Loci_tsv_To_Input(dt)

#build and visualise the bootstrapped tree
tree_bs <- visTreeBootstrap(t(data))

基因位点表

  1. Chromesome
  2. Start
  3. End
  4. Ref
  5. 基因【外键】// 外键的目的是为了增加参照完整性约束,也可以不设定外键
  6. 最长转录组
  7. 外显子编号

参考资料

pyclone usage:
pyclone文献:
suprahex处理pyclone结果:

变异信息

  1. 基因位点【外键】
  2. Alt
  3. HGVS.c
  4. HGVS.p
  5. 突变类型
  6. rs number
  7. 千人基因组突变频率
  8. 致病性预测(SIFT,PolyPhen2等)

我的博客即将搬运同步至腾讯云+社区,邀请大家一同入驻:

测序变异信息

  1. 测序记录【外键】
  2. 变异信息 【外键】
  3. 突变频率
  4. 测序深度
  5. 突变深度
  6. 分子标签数

套餐信息表

  1. 套餐名称
  2. 套餐价格
  3. 癌症【外键】

本文由威尼斯手机娱乐官网发布于威尼斯手机娱乐官网,转载请注明出处:安装使用pyclone进行克隆演化推断,数据库设计

上一篇:威尼斯手机娱乐官网大S转发微博祝福安以轩, 下一篇:cannot import name &#39;_imaging&#39; from &#39;
猜你喜欢
热门排行
精彩图文