SeqAn3与SeqAn2性能、设计及I/O模块的对比分析
1. 性能分析
1.1 后插入操作开销
后插入操作存在明显的开销,在SeqAn2基于栈的字符串和 seqan3::small_vector
中情况一致,即使元素类型为 char
时也是如此。原本预计这些操作会更快(因为完全不涉及动态内存分配),但 std::vector
的性能也出奇地好。通过分析发现,在微基准测试中, std::vector
的 push_back()
操作可能并非完全串行。
1.2 位压缩存储性能
SeqAn2有自己的位压缩存储自定义实现,而SeqAn3基于 sdsl::int_vector
构建向量。总体而言,它们的性能相似,SeqAn2在读写方面稍快一些。在常量上下文中访问位压缩向量时,SeqAn3的实现表现更好。SeqAn2和SeqAn3在压缩存储的后插入操作上性能相近,基于逐元素写入速度,后插入性能看起来较为合理。需要注意的是,在压缩存储中存储不可压缩的字母表(如 char
)没有读写开销,但后插入操作的“基线”性能与插入到其他自定义容器(如栈存储)时相同。
1.3 视图性能
视图基准测试 | SeqAn3 | SeqAn2 |
---|---|---|