SAM文件一共有12列,第1-11列是固定的内容,第12列是可变的内容。(虽然BAM格式是SAM格式的二进制版本,但SAM的坐标起始位置是1,而BAM格式的坐标起始位置是0)。

BAM格式的一行(用samtools view打开看到的):

对应的SAM格式中这一行

Note: 虽然BAM格式储存的是0起始的坐标,我们用samtools打开看到的是1起始的。
Note:正常来说,read1和read2应该比对到参考基因组的不同链上。
1,第一列:测序得到的reads的名字(fastq文件第一行的部分),PE测序的read 1和read 2会以同样的名字出现。
2,第二列为整数,解释如下:
1 : 代表这个序列采用的是PE双端测序
2: 代表这个序列和参考序列完全匹配,没有错配和插入缺失
4: 代表这个序列没有mapping到参考序列上
8: 代表


6637

被折叠的 条评论
为什么被折叠?



