小男孩‘自慰网亚洲一区二区,亚洲一级在线播放毛片,亚洲中文字幕av每天更新,黄aⅴ永久免费无码,91成人午夜在线精品,色网站免费在线观看,亚洲欧洲wwwww在线观看

分享

velvet軟件進行基因組組裝

 生信修煉手冊 2019-12-24

velvet是由EMBL-EBI開發(fā)的一款基因組組裝工具,官網(wǎng)如下

https://www./~zerbino/velvet/

安裝過程如下

wget https://www./~zerbino/velvet/velvet_1.2.10.tgz tar xzvf velvet_1.2.10.tgz cd velvet_1.2.10/ make 'MAXKMERLENGTH=127'

默認情況下,velvet支持的kmer最大長度為31bp, 如果想要只會更大長度的kmer,在編譯時需要設(shè)置MAXKMERLENGTH的值。編譯完成后,會生成如下兩個可執(zhí)行文件

  1. velveth

  2. velvetg

軟件的運行過程對應(yīng)的也分成兩步

1. velveth

用法如下

velveth Assem 31 -shortPaired -fasta -separate left.fa right.fa

第一個參數(shù)Assem, 代表輸出結(jié)果的目錄;shortPaired指定測序類型,fasta指定輸入的序列格式。

對于二代測序平臺的數(shù)據(jù),常用的測序類型包括以下兩種情況

  1. short

  2. shortPaired

short用于單獨數(shù)據(jù),shortPaired用于雙端數(shù)據(jù)。輸入的序列文件支持以下格式:

  1. fasta/fasta.gz

  2. fastq/fastq.gz

  3. sam/bam

通過不同的參數(shù)指定輸入文件的格式,-fasta對應(yīng)fasta格式;-fastq對應(yīng)fastq格式,-fastq.gz對應(yīng)fastq.gz格式,-fasta.gz對應(yīng)fasta.gz格式,-sam對應(yīng)sam格式,-bam對應(yīng)bam格式。

對于雙端數(shù)據(jù),有以下兩種格式

  1. interleaved

  2. separate

R1和R2端序列保存在兩個文件中,就是separate格式;interleaved是雙端序列的一種格式,R1端和R2端的序列保存在一個文件當(dāng)中,每一條序列的R1端之后緊跟著就是R2端序列;對于雙端測序,默認是interleaved格式,如果是separate格式,要顯示的聲明。

還需要注意的一個用法就是kmer長度,在實際分析時,通常會采用一系列的kmer長度分別組裝,然后挑選一個最佳的結(jié)果。velvet 的kmer參數(shù)可以設(shè)置為一個梯度,示例如下

velveth Assem 31,37,2 -shortPaired -fasta -separate left.fa right.fa

上述用法中的31,37,2表示從kmer=31開始組裝,然后進行遞增,步長為2,依次進行33, 35, 37共4個kmer長度的組裝。這樣的參數(shù)設(shè)計非常的貼合實際需求。

運行結(jié)束后,會在輸出目錄生成以下文件

  1. Sequences

  2. Roadmaps

2. velvetg

基本用法如下

velvetg Assembly/ -min_contig_lgth 100

第一個參數(shù)為上一步的輸出目錄,min_contig_lgth代表contig的最小長度,小于該長度的contig會被刪除,不會出現(xiàn)在最終的結(jié)果中。更多的參數(shù)和用法請參考官方手冊。

運行結(jié)束后,輸出目錄下的contigs.fa就是最終的組裝結(jié)果。

    轉(zhuǎn)藏 分享 獻花(0

    0條評論

    發(fā)表

    請遵守用戶 評論公約

    類似文章 更多