scanpy详细研究
-

mtx加载到系统后,会生成anndata对象

var 是一个dataframe 注释的所有的变量(scanpy场景下即为基因)有1列 存储的是gene_ids

obs也是一个dataframe 注释的是所有观察样本(scanpy场景下为barcodes 即细胞)该dataframe初始状态下是以barcode为索引的空dataframe

X为numpy的一个稀疏矩阵类型(sparse matrix)

-
gene_symbols和gene_ids
当读取数据的时候 默认设置用基因名还是ID作为列头 实际上scanpy会把这两个的对应关系作为第一个var保存下来 下面是使用gene_ids打开mtx的情况
