版本发布说明#
v 1.0.0#
首次公开发布。
v 1.1.7#
bulk 模块:#
新增 Deseq2,包含
pyDEseq函数:deseq2_normalize、estimateSizeFactors、estimateDispersions、Matrix_ID_mapping。集成 TCGA,提供
TCGA功能。引入富集分析,包含函数
geneset_enrichment、geneset_plot。
single 模块:#
集成 scdrug,提供函数
autoResolution、writeGEP、Drug_Response。新增 cpdb,提供函数
cpdb_network_cal、cpdb_plot_network、cpdb_plot_interaction、cpdb_interaction_filtered。集成 scgsea,提供函数
geneset_aucell、pathway_aucell、pathway_aucell_enrichment、pathway_enrichment、pathway_enrichment_plot。
v 1.1.8#
single 模块:#
修复 cpdb 中的错误,包括
cpdb_plot_network的导入错误和颜色问题。在 cpdb 中引入
cpdb_submeans_exacted,便于提取子网络。
v 1.1.9#
bulk2single 模块:#
新增
bulk2single模块。修复来自 bulk2space 的模型加载错误。
解决来自 bulk2space 的早停问题。
提供更友好的输入方式和可视化功能。
新增损失历史可视化。
utils 模块:#
在 plot 模块中引入
pyomic_palette。
v 1.1.10#
更新所有代码引用。
single 模块:#
修复
single.mofa.mofa_run函数中的无效参数。在
single.scanpy_lazy函数中新增原始计数层。引入
utils.plot_boxplot,用于绘制带抖动点的箱线图。新增
bulk.pyDEseq.plot_boxplot,用于绘制特定基因的带抖动点箱线图。
v 1.2.0#
bulk 模块:#
修复
bulk.geneset_enrichment中无效的cutoff参数。新增模块:
pyPPI、pyGSEA、pyWGCNA、pyTCGA、pyDEG。
bulk2single 模块:#
引入
bulk2single.save,用于手动保存模型。
v 1.2.1-4#
single 模块:#
新增
pySCSA模块,包含函数:cell_anno、cell_anno_print、cell_auto_anno、get_model_tissue。在
single.scanpy_lazy中实现双细胞过滤。新增
single.scanpy_cellanno_from_dict,简化注释流程。将 SCSA 数据库更新至 CellMarker2.0。
修复 SCSA 数据库键名错误:
Ensembl_HGNC和Ensembl_Mouse。
v 1.2.5#
single 模块:#
新增
pyVIA模块,包含函数:run、plot_piechart_graph、plot_stream、plot_trajectory_gams、plot_lineage_probability、plot_gene_trend、plot_gene_trend_heatmap、plot_clustergraph。修复
utils.pyomic_plot_set中的警告错误。更新依赖项,包括
pybind11、hnswlib、termcolor、pygam、pillow、gdown。
v 1.2.6#
single 模块:#
新增
pyVIA.get_piechart_dict和pyVIA.get_pseudotime。
v 1.2.7#
bulk2single 模块:#
新增
Single2Spatial模块,包含函数:load、save、train、spot_assess。修复 pip 中的包安装错误。
v 1.2.8#
修复 pip 安装错误。
bulk2single 模块:#
将
Single2Spatial中的deep-forest替换为Neuron Network用于分类任务。通过修改
predicted_size设置,使用 GPU 和批次级估算加速整个 Single2Spatial 推理过程。
v 1.2.9#
bulk 模块:#
修复
Matrix_ID_mapping中的重复索引映射问题。解决
pyWGCNA.plot_sub_network中的 hub 基因绘图问题。修复
pyGSEA.geneset_enrichment中的备用基因,以支持稀有物种。在
pyWGCNA.plot_matrix中新增矩阵绘图模块。
single 模块:#
在
pySCSA中新增rank_genes_groups检查。
bulk2single 模块:#
修复
deepforest的导入错误。
v 1.2.10#
将包重命名为
omicverse。
single 模块:#
修复
pySCSA中的参数错误。
bulk2single 模块:#
更新
bulk2single中的绘图参数。
v 1.2.11#
bulk 模块:#
修复
pyDEG.deg_analysis中的wilcoxon方法。在
pyDEG.plot_boxplot中新增处理组和对照组名称的参数设置。修复
pyWGCNA.plot_matrix中的图形显示问题。修复
pyWGCNA.analysis_meta_correlation中因独热编码导致的类别相关性失败问题。修复
pyWGCNA.plot_sub_network中的网络显示问题,并更新utils.plot_network以避免错误。
v 1.3.0#
bulk 模块:#
在
pyDEG.deg_analysis中新增DEseq2方法。在
bulk中引入pyGSEA模块。将原始
pyGSEA重命名为bulk中的pyGSE。在
utils中新增get_gene_annotation,用于基因名称转换。
v 1.3.1#
single 模块:#
新增
get_celltype_marker方法。
single 模块:#
新增
GLUE_pair、pyMOFA、pyMOFAART模块。新增
Multi omics analysis by MOFA and GLUE教程。更新
Multi omics analysis by MOFA教程。
v 1.4.0#
bulk2single 模块:#
新增
BulkTrajBlend方法。
single 模块:#
修复
scnocd模型中的错误。在
scnocd模型中新增save、load和get_pair_dict。
utils 模块:#
新增
mde方法。在
utils.read中新增gz格式支持。
v 1.4.1#
preprocess 模块:#
v 1.4.3#
preprocess 模块:#
修复
pp中的稀疏预处理错误。修复
via中的轨迹导入错误。新增轨迹基因相关性分析。
v 1.4.4#
single 模块:#
在
pySCSA模块中新增panglaodb数据库。修复
pySCSA.cell_auto_anno在某些细胞类型未在聚类中找到时的错误。修复
pySCSA.cell_anno在rank_genes_groups与聚类不一致时的错误。在 single 中新增
pySIMBA模块,用于批次校正。
preprocess 模块:#
在
ov.utils中新增store_layers和retrieve_layers。在
ov.utils中新增plot_embedding_celltype和plot_cellproportion。
v 1.4.5#
single 模块:#
新增
MetaTiME模块,用于在 TME 中自动执行细胞类型注释。
v 1.4.12#
更新
conda install omicverse -c conda-forge。
single 模块:#
新增
pyTOSICA模块,使用 Transformer 模型从参考 scRNA-seq 中执行细胞类型迁移。新增
atac_concat_get_index、atac_concat_inner、atac_concat_outer函数,用于合并/拼接 scATAC 数据。修复
MetaTime.predicted在出现未知细胞类型时的问题。
preprocess 模块:#
在
ov.utils中新增plot_embedding,使用特定颜色字典绘制 UMAP。
v 1.4.13#
bulk 模块:#
在
ov.bulk.pyWGCNA模块中新增mad_filtered,用于在计算网络时过滤鲁棒基因。修复
ov.bulk.pyPPI中的string_interaction,适配 string-db 更新。
preprocess 模块:#
修改
pp.preprocess的mode参数以控制预处理步骤。新增
ov.utils.embedding、ov.utils.neighbors和ov.utils.stacking_vol。
v 1.4.14#
preprocess 模块:#
在
pp.preprocess和pp.qc中新增batch_key。
utils 模块:#
新增
plot_ConvexHull,用于可视化聚类边界。新增
weighted_knn_trainer和weighted_knn_transfer,用于多 adata 整合。
single 模块:#
修复
mofa中的导入错误。
v 1.4.17#
bulk 模块:#
修复与
pydeseq2版本0.4.0的兼容性问题。新增
bulk.batch_correction,用于多 bulk RNA-seq/芯片样本的批次校正。
single 模块:#
新增
single.batch_correction,用于多单细胞数据集的批次校正。
preprocess 模块:#
在
pp.scale中新增layers_add参数。
v 1.5.0#
single 模块:#
新增
cellfategenie,用于计算时间相关基因/基因集。修复
atac_concat_outer中的名称错误。为
batch_correction新增更多 kwargs。
utils 模块:#
新增
plot_heatmap,用于可视化伪时间热图。修复
embedding在mpl版本大于3.7.0时的问题。新增
geneset_wordcloud,用于可视化伪时间基因集热图。
v 1.5.1#
single 模块:#
新增
scLTNN,用于推断细胞轨迹。
bulk2single 模块:#
使用
TAPE更新 bulk2single 中的细胞比例预测。修复 bulk2single 中的分组和归一化问题。
utils 模块:#
新增
Ro/e计算(作者:Haihao Zhang)。新增
cal_paga和plot_paga,用于可视化状态转移矩阵。修复
read函数。
v 1.5.2#
bulk2single 模块:#
解决基因符号不唯一时发生的矩阵错误。
修复
BulkTrajBlend在目标细胞不存在时的interpolation问题。修正
BulkTrajBlend中的generate函数。修正
BulkTrajBlend中cell_target_num设置为 None 时vae_configure的参数错误。引入
max_single_cells参数,用于BulkTrajBlend的输入配置。bulk RNA-seq 去卷积默认使用
scaden。
single 模块:#
修复
pyVIA在 root 设置为 None 时的错误。新增
TrajInfer模块,用于推断细胞轨迹。将
Palantir和Diffusion_map集成到TrajInfer模块。修正
batch_correction中的参数错误。
utils 模块:#
引入
plot_pca_variance_ratio,用于可视化 PCA 方差比例。新增
cluster和filtered模块,用于细胞聚类。集成
MiRA,用于计算 LDA 主题。
v 1.5.3#
single 模块:#
新增
scVI和MIRA,用于去除批次效应。
space 模块:#
新增
STAGATE,用于空间 RNA-seq 的聚类与去噪。
pp 模块:#
在
ov.pp.qc中新增doublets参数,用于控制双细胞检测(默认值为 True)。
v 1.5.4#
bulk 模块:#
修复
pyDEG.deg_analysis在pyDeseq2(v0.4.3)中无法设置n_cpus时的错误。
single 模块:#
修复
single.batch_correction中 combat 的参数错误。
utils 模块:#
新增
venn4图,用于可视化。修复
plot_network的标签可视化问题。在
LDA_topic中新增ondisk参数。
space 模块:#
新增
Tangram,用于将 scRNA-seq 映射到 stRNA-seq。
v 1.5.5#
pp 模块:#
新增
max_cells_ratio和max_genes_ratio,用于控制 scRNA-seq 质控中的最大阈值。
single 模块:#
新增
SEACells模型,用于从 scRNA-seq 计算元细胞。
space 模块:#
新增
STAligner,用于整合多个 stRNA-seq 数据集。
v 1.5.6#
pp 模块#
新增
mt_startswith参数,用于控制小鼠或其他物种的qc。
utils 模块#
新增
schist方法,用于单细胞 RNA-seq 聚类。
single 模块#
修复 SEACells 中
palantir的导入错误。新增
CEFCON模型,用于识别细胞命运决定的驱动调控因子。
bulk2single 模块#
在 nocd 配置中新增
use_rep和neighbor_rep参数。
space 模块#
新增
SpaceFlow,用于识别伪空间图谱。
v 1.5.8#
pp 模块#
新增
score_genes_cell_cycle函数,用于计算细胞周期。
bulk 模块#
修复
adjustText版本大于0.9时dds.plot_volcano文本绘制错误。
single 模块#
优化
MetaCell.load模型加载逻辑。修复使用
MetaCell.load加载模型时的错误。新增
Metacells教程。
pl 模块#
将 pl 作为下一版本统一绘图前缀,用于替代原 utils 中的绘图功能,同时保留原有 utils 中的绘图接口。
新增
embedding,使用ov.pl.embedding绘制 scRNA-seq 嵌入图。新增
optim_palette,提供空间约束方法,为各种场景下的单细胞空间数据可视化生成具有区分度的颜色分配。新增
cellproportion,绘制 scRNA-seq 堆叠条形比例图。新增
embedding_celltype,同时绘制细胞类型比例和嵌入图。新增
ConvexHull,在目标细胞周围绘制凸包。新增
embedding_adjust,调整嵌入图中细胞类型图例的文字。新增
embedding_density,绘制细胞中的类别密度。新增
bardotplot,绘制不同组间的条点图。新增
add_palue,绘制不同组间的 p 值阈值。新增
embedding_multi,支持mudata对象。新增
purple_color,用于紫色调色板可视化。新增
venn,支持从 2 到 4 个集合的韦恩图。新增
boxplot,用于可视化箱点图。新增
volcano,用于可视化差异表达基因结果。
v 1.5.9#
single 模块#
在
single.TrajInfer中新增slingshot。修复
scLTNN的若干错误。新增
GPU模式,用于 GPU 加速数据预处理。新增
cNMF,用于计算 NMF。
space 模块#
新增
Spatrio,用于将 scRNA-seq 映射到 stRNA-seq。
v 1.6.0#
将 CEFCON、GNTD、mofapy2、spaceflow、spatrio、STAligner、tosica 从根模块移至 external 模块。
space 模块#
在
omicverse.space中新增STT,用于计算空间转移张量。在
omicverse.external中新增scSLAT,用于不同空间切片的对齐。在
omicverse.external中新增PROST,在omicverse.space中新增svg,用于识别空间可变基因和空间域。
single 模块#
在
omicverse.single.cNMF中新增get_results_rfc,用于预测复杂 scRNA-seq/stRNA-seq 中的精确聚类。在
omicverse.utils.LDA_topic中新增get_results_rfc,用于预测复杂 scRNA-seq/stRNA-seq 中的精确聚类。在
omicverse.single中新增gptcelltype,使用大语言模型进行细胞类型注释(#82)。
pl 模块#
在
omicverse.pl中新增plot_spatial,用于可视化去卷积时的 spot 细胞比例。
v 1.6.2#
支持原生 Windows 平台。
在
omicverse.pp中新增mde,用于加速 UMAP 计算。
v 1.6.3#
新增
ov.setting.cpu_init,用于将环境切换到 CPU 模式。将
tape、SEACells和palantir模块移至external。
Single 模块#
新增
CytoTrace2,用于从单细胞 RNA 测序数据预测细胞潜能类别和绝对发育潜力。新增
cpdb_exact_target和cpdb_exact_source,用于提取特定配体/受体的均值。新增
gptcelltype_local,使用本地 LLM 识别细胞类型(#96 #99)。
Bulk 模块#
在 dds.result 中新增
MaxBaseMean列,帮助用户忽略空样本。
Space 模块#
在
STT.compute_pathway中新增**kwargs。新增
GraphST,用于识别空间域。
pl 模块#
新增
cpdb_network、cpdb_chord、cpdb_heatmap、cpdb_interacting_network、cpdb_interacting_heatmap和cpdb_group_heatmap,用于可视化 CellPhoneDB 结果。
utils 模块#
新增
mclust_py,用于识别高斯混合聚类。在
cluster函数中新增mclust方法。
v 1.6.4#
Bulk 模块#
优化 pyGSEA 的
geneset_plot坐标效果可视化。修复
pyTCGA.survival_analysis在矩阵稀疏时的错误(#62、#68、#95)。添加 tqdm,用于可视化
pyTCGA.survial_analysis_all的处理进度。修复
data_drop_duplicates_index删除重复索引时仅保留表达量最高基因的错误(#45)。在
ov.bulk中新增geneset_plot_multi,用于可视化多个富集结果(#103)。
Single 模块#
新增
mellon_density,用于计算细胞密度(#103)。
PP 模块#
修复
ov.pp.pca在主成分数小于 13 时的错误(#102)。在
ov.pp.qc的方法中新增COMPOSITE,用于预测双细胞(#103)。在
score_genes_cell_cycle中新增species参数,无需手动输入基因即可计算细胞周期。
v 1.6.6#
Pl 模块#
修复
ov.pl.cpdb_group_heatmap中的celltype_key错误(#109)。修复
ov.utils.roe在某些期望频率低于期望值时的错误。新增
cellstackarea,用于可视化样本中细胞类型的百分比堆积面积图。
Single 模块#
修复
ov.single.cytotrace2在 adata.X 非稀疏数据时的 bug(#115、#116)。修复 SEACells 的
ov.single.get_obs_value中的 groupby 错误。修复 cNMF 的错误(#107、#85)。
修复
Pycomplexheatmap版本大于 1.7 时的绘图错误(#136)。
Bulk 模块#
修复
ov.bulk.Matrix_ID_mapping中的键值错误。在
ov.bulk中新增enrichment_multi_concat,用于拼接富集结果。修复 gseapy 中的 pandas 版本错误(#137)。
Bulk2Single 模块#
新增
adata.var_names_make_unique(),避免基因不唯一时的矩阵形状错误(#100)。
Space 模块#
修复
ov.space.STT中construct_landscape的错误。修复
ov.space.svg中get_image_idx_1D的错误(#117)。新增
COMMOT,用于计算空间 RNA-seq 的细胞-细胞相互作用。新增
starfysh,用于无 scRNA-seq 参考的空间转录组去卷积(#108)。
PP 模块#
更新 ov.pp.mde 的约束错误(#129)。
修复
float128类型错误(#134)。
v 1.6.7#
Space 模块#
新增
n_jobs参数,用于调整extenel.STT.pl.plot_tensor_single的线程数。修复
extenel.STT.tl.construct_landscape中的错误。更新
COMMOT和Flowsig的教程。
Pl 模块#
新增
legend_awargs,用于调整pl.cellstackarea和pl.cellproportion中的图例设置。
Single 模块#
修复
cNMF模块中get_results和get_results_rfc的错误(#143、#139)。新增
sccaf,用于获取最佳聚类。修复 cytotrace2 中的
.str错误(#146)。
Bulk 模块#
修复
bulk.geneset_enrichment中gseapy的导入错误。优化离线富集分析的代码逻辑,新增 background 参数。
新增
pyWGCNA包,替代原始的 pyWGCNA 计算(#162)。
Bulk2Single 模块#
在
bulk2single_data_prepare中移除_stat_axis,使用index代替(#160)。
PP 模块#
修复
pp.regress_and_scale中的返回值 bug(#156)。修复使用
ov.pp.pca时的 scanpy 版本错误(#154)。
v 1.6.8#
Bulk 模块#
修复 gsea_obj.enrichment 中 log_init 的错误(#184)。
为
geneset_plot新增ax参数。
Space 模块#
新增 CAST,用于整合多个切片。
在
omicverse.tl中新增crop_space_visium,用于裁剪空间数据的子区域。
Pl 模块#
为
cpdb_heatmap新增legend参数。为
cellstackarea新增text_show参数。新增
ForbiddenCity颜色系统。
v 1.6.9#
PP 模块#
新增
recover_counts,用于在ov.pp.preprocess后恢复原始计数。移除
ov.pp.pca中添加的 lognorm 层。
Single 模块#
新增
MultiMap模块,用于整合多物种数据。新增
CellVote,用于投票选出最优细胞。新增
CellANOVA,用于整合样本并校正批次效应。新增
StaVia,用于计算伪时间和推断轨迹。
Space 模块#
新增
ov.space.cluster,用于识别空间域。新增
Binary,用于空间聚类。新增
Spateo,用于计算空间可变基因。
v 1.7.0#
新增 cpu-gpu-mixed 模式,使用 GPU 加速 scRNA-seq 分析。
将 Omicverse 的 Logo 展示方式改为 ov.plot_set。
Bulk 模块#
在差异表达基因分析中新增
limma、edgeR(#238)。修复
DEseq2分析的版本错误。
Single 模块#
新增
lazy函数,一键计算 scRNA-seq 的所有分析流程(#291)。新增
generate_scRNA_report和generate_reference_table,用于生成报告和参考(#291、#292)。修复
geneset_prepare无法读取非\t\t分隔的 gmt 文件的问题(#235、#238)。新增
geneset_aucell_tmp、pathway_aucell_tmp、pathway_aucell_enrichment_tmp,用于测试 chunk_size(#238)。新增
Fate的数据增强。在 VIA 中新增
plot_atlas_view_ov。修复矩阵过大时
recover_counts中的错误。新增
forceatlas2,用于计算X_force_directed。新增
milo和scCODA,用于分析不同细胞类型丰度。新增
memento,用于分析差异基因表达。
Space 模块#
新增
GASTON,用于从空间分辨转录组学(SRT)数据中学习组织切片的地形图(#238)。在 STT 的
plot_tensor_single中新增超级 kwargs。使用 GPU 加速更新
COMMOT。
Plot 模块#
新增
dotplot_doublegroup,用于可视化双组基因。在
cpdb_interacting_heatmap中新增transpose参数,用于转置图形。新增
calculate_gene_density,用于绘制基因密度。
v 1.7.1#
Single 模块#
修复
ov.single.lazy的若干错误。修复
ov.single.generate_scRNA_report的格式问题。更新
palantir的若干函数。新增
CellOntologyMapper,用于映射细胞名称。
v 1.7.2#
Pl 模块#
优化
ov.pl.box_plot的绘图效果。优化
ov.pl.volcano的绘图效果。优化
ov.pl.violin的绘图效果。新增比 scanpy 更美观的点图(#318)。
新增与 CellChat 类似的可视化功能(#313)。
Space 模块#
在
COMMOT中新增 3D 细胞-细胞相互作用分析(#315)。
Single 模块#
修复 pathway_enrichment 的错误(#184)。
新增支持 GPU 加速的 SCENIC 模块(#331)。
utils 模块#
新增 scICE,用于计算最佳聚类(#329)。
v 1.7.6#
LLM 模块#
新增
GeneFromer、scGPT、scFoundation、UCE、CellPLM,可在 OmicVerse 中直接调用。
Pl 模块#
优化嵌入图的可视化效果。
新增
ov.pl.umap、ov.pl.pca、ov.pl.mde和ov.pl.tsne。
v 1.7.8#
实现延迟加载系统,将 import omicverse 时间减少 40%(从约 7.8 秒降至约 4.7 秒)。
新增对 Apple Silicon(MLX)和 CUDA(TorchDR)设备的 GPU 加速 PCA 支持。
引入智能体系统,支持来自 8 家供应商的 50 余个 AI 模型的自然语言处理。
新增并修复 anndata-rs,以支持百万级数据集(#336)。
PP 模块#
在
ov.pp.pca()中新增 GPU 加速 PCA,支持 Apple Silicon MPS 设备的 MLX 加速。在
ov.pp.pca()中新增基于 TorchDR 的 PCA 加速,适用于 NVIDIA CUDA 设备。在
init_pca()和pca()函数中新增智能设备检测和自动后端选择。新增 GPU 加速失败时优雅回退到 CPU 实现的机制。
新增增强的详细输出,包含设备选择信息和 emoji 指示符。
在
init_pca()中新增基于方差贡献阈值的最优成分数确定。在
ov.pp.sude()中新增 GPU 加速 SUDE 降维,支持 MLX/CUDA。优化
ov.pp.qc,新增核糖体和血红蛋白基因,以获取更多数据质量信息。
Datasets 模块#
完全消除对 scanpy 的依赖,提升加载速度。
新增类似 dynamo 风格的数据集框架,收录全面的数据集集合。
新增带进度跟踪和缓存的鲁棒下载系统。
新增增强的 mock 数据生成功能,具有真实结构。
新增对 h5ad、loom、xlsx 和压缩格式的支持。
Agent 模块#
新增多供应商 LLM 支持(OpenAI、Anthropic、Google、DeepSeek、Qwen、Moonshot、Grok、智谱 AI)。
新增对英文和中文的自然语言处理。
新增带本地执行的代码生成架构。
新增多语言别名的函数注册系统。
新增智能 API 密钥管理和供应商特定配置。
Bulk 模块#
新增
BayesPrime和Scaden,用于去卷积 Bulk RNA-seq 的细胞类型比例。新增
alignment,用于将 fastq 对齐到计数矩阵。
Single 模块#
新增
ov.single.Annotation和ov.single.AnnotationRef,用于自动注释细胞类型。新增
ov.alignment.single,用于直接将 scRNA-seq 对齐到计数矩阵。
v 1.7.9#
实现智能延迟加载系统,将 import omicverse 时间大幅减少 85.6 倍(从约 16.57 秒降至约 0.19 秒)。
增强 RNA-seq 比对工作流,提供完整的 FASTQ 处理和计数工具集。
优化数据集管理,通过嵌套目录创建实现更好的组织结构。
性能优化#
延迟加载系统:
对所有主要模块实现基于
__getattr__机制的模块级延迟加载。为常用函数(read、palette、Agent 等)添加属性级延迟加载。
引入智能缓存系统,确保首次加载后即时访问。
初始导入时间从 16.57 秒降至 0.19 秒(提速 85.6 倍)。
完全保持向后兼容性——所有现有代码无需修改即可运行。
通过
__dir__()实现保留完整的 IDE 支持(含 Tab 补全)。通过延迟 settings 模块初始化修复循环导入问题。
MkDocs API 文档生成与延迟加载完全兼容。
用户收益:
即时启动 Jupyter notebooks 和脚本
按需加载——模块在首次访问时导入
简单任务减少内存占用
第二次访问已缓存,几乎即时(< 0.001 秒)
Alignment 模块#
全新 RNA-seq 比对综合工具集:
新增完整的原始测序数据处理端到端工作流:
ov.alignment.prefetch:从 NCBI 下载 SRA 数据集,内置重试逻辑。ov.alignment.fqdump:将 SRA 转换为 FASTQ 格式,支持并行处理。ov.alignment.parallel_fastq_dump:高性能并行 FASTQ 提取。ov.alignment.fastp:FASTQ 文件的质控和接头修剪。ov.alignment.STAR:使用 STAR 进行 RNA-seq 比对,参数可定制。ov.alignment.featureCount:基因级读段计数(从count更名以避免冲突)。ov.alignment.single:使用 kb-python(kallisto|bustools)一键完成 scRNA-seq 比对。ov.alignment.ref:为比对构建 kallisto|bustools 参考索引。ov.alignment.count:从比对读段定量基因表达。
主要特性:
为 bulk RNA-seq(STAR + featureCount)和 scRNA-seq(kb-python)工作流提供统一 API。
内置支持 kb-python 的 RNA 速度分析。
并行处理能力,加快数据转换速度。
自动处理双端和单端测序数据。
针对 bulk 和单细胞数据的技术特异性过滤。
与 SRA 工具集集成,无缝下载数据。
示例工作流:
# 下载并处理 bulk RNA-seq
ov.alignment.prefetch('SRR1234567', output_dir='./data')
ov.alignment.fqdump('SRR1234567', output_dir='./fastq')
ov.alignment.fastp('sample_1.fastq.gz', 'sample_2.fastq.gz', output_prefix='clean')
ov.alignment.STAR(fastq1='clean_1.fastq.gz', fastq2='clean_2.fastq.gz',
genome_dir='./genome', output_prefix='aligned')
ov.alignment.featureCount(bam='aligned.bam', annotation='genes.gtf', output='counts.txt')
# 或使用一键 scRNA-seq 比对
ov.alignment.single(
fastq=['read1.fastq.gz', 'read2.fastq.gz'],
index='./kb_index',
output_dir='./kb_output',
technology='10xv3'
)
PP 模块#
修复
ov.pp.preprocess中的 HVG(高变基因)选择问题。提升预处理流程的稳定性和准确性。
重构 PCA 实现,使用
torch_pca进行 GPU 加速(替代 TorchDR)。增强稀疏矩阵的 PCA 计算支持。
将 PCA 嵌入基础从
X_pca更新为PCA,提高清晰度和一致性。改善 PCA 计算中的 try-except 错误处理。
修复 PCA GPU 模式对稀疏矩阵的支持,避免内存错误。
Single 模块#
在
ov.single.batch_correction中新增CONCORD方法,用于单细胞数据整合。以最先进的算法增强批次校正能力。
修复 pySCENIC 中的关键性能问题:还原了导致内存问题和 scRNA-seq 数据处理减速的低效相关性计算优化。
移除 SCENIC 相关性计算中关于 dropout 基因的误导性警告。
恢复高效内存的成对相关性计算(防止超过 2 万基因时 OOM)。
SCENIC 现在使用原始方法:仅计算特定 TF-靶标对的相关性,而非创建完整的基因×基因矩阵。
新增
ov.single.find_markers,支持五种方法的统一标记基因识别:cosg、t-test、t-test_overestim_var、wilcoxon和logreg;统计方法原生移植自 scanpy,无需 scanpy 运行时依赖,数值结果一致(rtol=1e-4)。新增
ov.single.get_markers,以DataFrame或dict形式提取顶级标记基因,支持单/多聚类过滤和基于min_logfoldchange、min_score、min_pval_adj的可选过滤;输出包含pct_group和pct_rest列,显示每个聚类内外的细胞表达比例。
Space 模块#
新增
FlashDeconv,用于 Visium 空间转录组学的快速无 GPU 去卷积。新增
Banksy聚类方法,用于空间域识别。更新空间分析文档,新增新的聚类方法。
Web 模块#
发布
Omicverse-Notebook,无需本地安装即可在浏览器中进行交互式分析。发布
Omicverse-Web,无需编程即可进行基于 Web 的数据分析。为无编程背景的研究人员普及生物信息学分析。
Agent 模块#
增强
ov.Agent的自然语言数据分析处理能力。扩展 LLM 供应商支持和模型选择。
优化代码生成和执行流程。
Pl 模块#
增强散点图嵌入的分类图例处理。
新增
legend_loc='on data'选项,支持在图上直接标注。改善复杂数据集的可视化清晰度。
新增
ov.pl.markers_dotplot,作为rank_genes_groups_dotplot更简洁的替代品,改善默认值(standard_scale='var'、cmap='Spectral_r'、dendrogram=False)。修复
rank_genes_groups_df在聚类名称为数字字符串(如 leiden 的'0'、'1')时的KeyError;现在正确处理来自所有标记方法的结构化数组、DataFrame 和普通 2D 数组。
Datasets 模块#
新增完整的数据集 URL,便于数据访问。
扩展数据下载工具,带进度跟踪。
修复数据集下载自动创建嵌套目标目录的问题。
改善数据集工具的错误处理。
更新下载行为,提升数据获取可靠性。
文档#
强化点图和 DEG 分析教程中的数据处理文档。
更新 scTour 聚类教程,采用最新最佳实践。
新增 v1.7.9 的完整版本说明。
增强比对模块文档,提供端到端工作流。
Bug 修复#
解决
_settings和utils模块之间的循环导入问题。修复与最新包版本(zarr、pandas 等)的兼容性问题。
改善并行处理函数中的错误处理。
Single 模块#
增强 DEG 分析,加入表达百分比信息:为差异表达结果新增细胞表达百分比信息
新增
pct_ctrl列,显示对照组中表达每个基因的细胞百分比(0-100%)。新增
pct_test列,显示处理组中表达每个基因的细胞百分比(0-100%)。新增
pct_diff列,显示表达百分比差值(pct_test - pct_ctrl)。适用于所有 DEG 方法:
wilcoxon、t-test和memento-de。通过基于表达普遍性过滤基因,实现更好的标记基因识别。
类似于点图圆圈大小信息,有助于识别广泛表达与稀少表达的基因。
使用示例:
deg_obj = ov.single.DEG(adata, condition='condition',
ctrl_group='Control', test_group='Treatment')
deg_obj.run(celltype_key='cell_label', celltype_group=['T_cells'])
results = deg_obj.get_results()
# 现在包含 pct_ctrl、pct_test、pct_diff 列
兼容性#
NumPy 2.0 兼容性:修复所有 NPY201 兼容性问题,确保对 NumPy 1.x 和 2.x 的无缝支持。
已修复问题(共 31 个):
np.in1d→np.isin(9 处)omicverse/bulk/_dynamicTree.py:3 处(第 697、741 行)omicverse/single/_cosg.py:1 处(第 77 行)omicverse/external/GNTD/_preprocessing.py:2 处omicverse/external/scdiffusion/guided_diffusion/cell_datasets_WOT.py:1 处其他外部模块:2 处
np.row_stack→np.vstack(13 处)omicverse/external/CAST/CAST_Projection.py:2 处omicverse/external/CAST/visualize.py:2 处omicverse/external/scSLAT/viz/multi_dataset.py:多处omicverse/single/_mdic3.py:1 处
np.product→np.prod(4 处)omicverse/external/umap_pytorch/model.py:2 处omicverse/external/umap_pytorch/modules.py:2 处
np.trapz兼容性包装器(2 处)在以下文件中添加兼容性包装器:
omicverse/external/VIA/plotting_via.pyomicverse/external/VIA/plotting_via_ov.py
使用
numpy.trapezoid(NumPy 2.0+),回退到numpy.trapz(NumPy 1.x)
向后兼容性:
所有更改完全保持与 NumPy 1.x(1.13+)的向后兼容性
np.isin自 NumPy 1.13 起可用np.vstack在所有 NumPy 版本中可用np.prod在所有 NumPy 版本中可用自定义兼容性包装器处理
trapz/trapezoid的过渡
v 1.7.10#
范围#
本版本说明总结了从提交
cd3d151(版本设置为1.7.10rc1)到当前HEAD的变更。本窗口内的总代码变更:
252 个文件修改,+46,992 / -9,752。
Agent 与运行时#
将
ov.Agent架构升级为具有子代理委托的现代 agentic 工具调用工作流(v4/v5 演进)。提升 GPT-5.2 的鲁棒性、响应解析和后端错误处理。
新增执行合约、工具目录、运行时状态、追踪和清理策略的 harness 运行时组件。
强化沙箱行为,对内部模块实施受限导入控制。
新增 web 桥接和会话级执行改进,适用于 agent 工作流。
新模块#
新增
omicverse.biocontext,通过 BioContext MCP 工具进行生物医学知识查询。新增
omicverse.fm(基础模型适配器、路由、注册表和 API)。为通用/单细胞/bulk/空间 I/O 路径新增结构化
omicverse.io命名空间。新增
omicverse.jarvis多渠道机器人框架(飞书/QQ/Telegram),带桥接支持。
OmicVerse 核心改进#
持续增强
pp、pl、single、space和utils模块。修复预处理工具内部(
_utils.py和_scale.py路径)之间的循环导入问题。在关键分析模块(预处理、注释、轨迹、空间、数据集、bulk)中新增/更新函数级元数据和文档质量。
通过新的签名资源和改进的加载路径扩展数据集工具。
注册表与帮助系统#
改进注册表行为和包入口点中的模块导入暴露。
增强 agent 可发现性的函数/类注册元数据覆盖率。
注册表帮助生成现在与基于类的工具中的类构造函数文档更好地对齐。
Web 与 UI#
单细胞分析 UI 收到迭代升级:
更好的代码单元格管理和撤销行为
改进的 AnnData slot 详情检索和显示
更好的 DataFrame 渲染和集成
绘图密度/点样式控制优化
分析面板的国际化和 UX 打磨
omicverse_web服务层扩展了面向会话的 agent 服务支持。
开发者体验与测试#
新增 FM 测试套件和多个 harness/ovagent 测试模块。
移除已废弃的遗留优先级和复杂度分类器测试路径。
新增运行时合约和操作指南的工作流和 harness 文档页面。
文档#
更新和扩展 agent 架构和流式 API 文档。
更新
t_preprocess_cpu.ipynb,匹配最新的 GPU/版本检测行为。为 Jarvis 和 agent 相关工作流新增双语和部署导向指南。