跳转到内容

可视化最佳实践

画图容易,画好图难。这一节总结几个在实际工作中反复验证过的可视化原则。

图表选择速查

你想展示什么用什么图
趋势(随时间变化)折线图 plot()
分类对比(模型 A vs B)柱状图 plot(kind='bar')
分布形态(延迟/分数)直方图 plot(kind='hist') / KDE 图
两变量关系(质量 vs 长度)散点图 plot.scatter()
组成比例(来源占比)饼图 plot(kind='pie')
多变量分布(质量×长度×来源)散点矩阵 + 着色

最常见的新手错误是用折线图展示分类数据——比如把 model 名放在 X 轴上画折线。分类变量之间没有"顺序关系",用柱状图才是正确的选择。

配色与可读性

python
df.plot(kind='bar', colormap='viridis')

推荐使用感知均匀的色图(如 viridisSet2tab10),避免使用彩虹色图(jet/rainbow)——它们对色觉障碍人群不友好,而且会人为地制造数据中不存在的视觉差异。

导出图片

python
ax = df.plot(kind='bar', figsize=(10, 5))
fig = ax.get_figure()
fig.savefig('report.png', dpi=300, bbox_inches='tight')

dpi=300 保证打印质量,bbox_inches='tight' 防止标签被截断。在写报告或论文时,300dpi 是最低要求

基于 MIT 许可发布