项目:图像分类系统
本节定位
图像分类很适合作为第一个视觉项目,不是因为它最简单,而是因为它最容易把完整工程链路讲清楚:
- 类别怎么定
- 数据怎么组织
- baseline 怎么做
- 指标怎么看
- 错误怎么分析
这一节的目标不是做一个“能跑的模型”,而是做一个能讲清楚的项目。
学习目标
- 学会定义一个适合作品集展示的图像分类题目
- 学会把数据、baseline、评估和错误分析串成闭环
- 学会用最小可运行示例表达项目结构
- 理解图像分类项目里最值得展示的是什么
一、先别急着选模型,先把项目题目选对
1.1 一个适合练手的题目通常有三个特征
- 类别边界清楚
例如猫 / 狗 / 鸟、苹果叶片病害分类、垃圾分类 - 数据能拿到
不要一开始就选你根本没法收集样本的题目 - 错误能解释
分错后你能说出可能原因,而不 是只剩“模型不行”
1.2 一个很稳的项目题目
例如:
做一个“宠物照片分类器”,把图片分成
cat / dog / rabbit三类。
它的优点是:
- 类别直观
- 数据相对容易收集
- 很适合做 confusion matrix 和错误样例分析
1.3 不建议一开始就做的题目
例如:
- 上百类细粒度分类
- 类别边界极其模糊
- 数据严重不平衡但你还没准备好处理
二、项目最小闭环长什么样?
一个最小但完整的图像分类项目,通常至少应包含:
- 题目与标签定义
- 数据集组织与划分
- baseline
- 训练与验证
- 评估与错误分析
- 演示方式
如果这 6 件事都说清了,即使模型不复杂,项目也会很有说服力。