量化性能，科学决策

BioProfile 采用多维度、相对性的评分体系，将复杂的高性能计算表现转化为直观的分数与效率指标。所有评分均以基准配置为参考（100 分），便于横向对比不同软硬件组合，精准定位性能瓶颈，为集群规划与调度优化提供量化依据。

核心评分维度

100

基准配置得分

相对

评分机制

三大核心指标

每款软件的单节点评测从三个维度分别打分，再综合为最终性能得分。

指标 S1

计算用时稳定性得分

评估在相同软硬件环境下，多次运行同一计算任务的时间波动性，反映系统运行的可靠性与一致性。

计算公式

稳定性得分 = max(

1 - σ / μ ,

) × 100

σ = 标准差，μ = 均值

数据来源：重复运行同一任务（通常 10 次），记录每次的计算用时。

得分越接近 100，说明计算用时越稳定，系统噪声影响越小。

指标 S2

大批量任务计算用时得分

衡量集群在同时处理多个独立任务时的吞吐能力，直接反映集群的资源利用效率与调度适配性。

计算公式

用时得分 = k × N / T_total

N = 任务数量，T_total = 完成全部任务的总用时
k = 基准系数（基准配置下 k 使得得分 = 100）

数据来源：在最佳并行模式下运行大批量任务（如 100 个），记录总完成时间。

得分越高，表明该集群在该软件任务类型下的单位时间吞吐量越大。

指标 S3

大批量任务计算能耗得分

可选

衡量完成一批计算任务所消耗的能源效率，兼顾性能与绿色计算。

计算公式

能耗得分 = k × N / E_total

N = 任务数量，E_total = 完成全部任务的总能耗
k = 基准系数

数据来源：监控大批量任务运行期间的节点总功耗。

得分越高，意味着完成相同工作量消耗的电能越少。

单节点深度评测综合得分

单节点的最终得分由上述三个指标综合计算得出，综合反映节点在运行特定软件时的性能、稳定性和能效表现。

完整公式（支持能耗统计）

综合性能得分 = avg(S_time, S_energy) × S_stability / 100

S_time = 大批量任务计算用时得分

S_energy = 能耗得分

S_stability = 计算用时稳定性得分

简化公式（不支持能耗统计）

综合性能得分 = S_time × S_stability / 100

当硬件不支持功耗监控时，仅使用用时得分与稳定性得分计算。

示例计算

若某软件 S_time = 200，S_energy = 150，S_stability = 95：

综合性能得分 = avg(200, 150) × 95 / 100

= 175 × 0.95

= 166.25

表明该节点在此软件上性能优于基准配置，且稳定性良好。

基准配置——一切得分的锚点

相对评分机制

为了消除绝对数值带来的比较困难，BioProfile 将所有评分锚定在一个预设的基准配置上。基准配置的所有指标得分均设为 100 分。其他配置的得分均为相对于基准的相对得分。

> 100

性能优于基准

= 100

等同于基准

< 100

性能劣于基准

仅当使用相同基准配置时，不同集群的得分才具有直接可比性。用户可根据自身需求更换基准配置。

集群整体性能与扩展效率

集群评测模式不仅输出集群性能得分，还引入“集群综合扩展效率”指标，衡量从单节点扩展至多节点集群的效能达成率。

集群性能得分

与单节点类似，计算集群大批量任务计算用时得分与能耗得分的平均值。

集群综合扩展效率

扩展效率 = 集群得分 / (单节点得分 × N) × 100%

理想值为 100%。低于 100% 说明存在通信、同步或存储瓶颈。

总体性能得分

将所有测试软件的综合性能得分（或集群性能得分）累加，得到节点或集群的总分。总分可用于快速比较不同硬件配置或不同集群的整体优劣。

节点总分

节点总分 = Σ 综合性能得分_i (i = 1, ..., n)

集群总分

集群总分 = Σ 集群性能得分_i (i = 1, ..., n)

总分覆盖所有参与评测的软件，不同软硬件配置的整体性能差距一目了然，为采购选型提供量化依据。

如何读懂评分？

综合性能得分高

节点/集群在该软件上综合表现优秀，适合部署该类型任务。

计算用时稳定性得分低

系统可能存在干扰（如其他用户作业、系统进程抖动），建议隔离环境或检查硬件稳定性。

用时得分高但能耗得分低

性能好但能效差，可考虑调整并行策略（如减少线程数降低功耗）。

集群扩展效率低

节点间通信或文件系统成为瓶颈，需优化网络拓扑或升级存储。

总分差距明显

不同软硬件配置的整体性能差距一目了然，为采购选型提供量化依据。

稳定性得分接近 100

系统运行极其稳定，适合对结果可重复性要求高的科研场景。

了解评测框架查看评测结果查看评测报告