视频分析【选修】
本节定位
视频分析最容易被误解成:
- 把很多图片一帧一帧跑一遍
这当然是起点,但不是全部。
视频真正带来的新问题在于:
同一个目标会随着时间连续变化,而时间本身也带着信息。
所以这节重点是把“时间维度”这件事讲清楚。
学习目标
- 理解视频任务和单帧图像任务的根本区别
- 理解抽帧、跟踪、时序建模各自解决什么问题
- 通过可运行示例建立视频分析最小直觉
- 理解为什么很多 视频系统其实是“图像模型 + 时间逻辑”的组合
一、视频为什么比单张图更复杂?
1.1 因为同一目标会跨帧出现
一张图里,你只需要回答当前画面。
视频里还要考虑:
- 它刚刚在哪
- 接下来会去哪
1.2 因为“变化”本身就是信息
很多视频任务里,真正重要的不是某一帧长什么样,
而是:
- 动作怎么发生
- 轨迹怎么移动
1.3 一个类比
单张图像分析像看照片。
视频分析更像看监控回放,你会自然关心:
- 前后关系
- 事件过程