什么是机器学习
欢迎来到机器学习阶段
前三个阶段你学了 Python、数据分析和数学基础。现在,你终于要开始让计算机自己"学"东西了。这是整个 AI 旅程中最激动人心的阶段之一。
学习目标
- 理解什么是机器学习以及它与传统编程的区别
- 掌握机器学习的三大分类(监督学习、无监督学习、强化学习)
- 理解机器学习的完整工作流程
- 建立正确的 ML 思维框架
一、机器学习到底是什么?
1.1 一句话定义
机器学习 = 让计算机从数据中自动发现规律,而不是由人类手写规则。
1.2 传统编程 vs 机器学习
| 传统编程 | 机器学习 | |
|---|---|---|
| 输入 | 规则 + 数据 | 数据 + 期望输出 |
| 输出 | 结果 | 规则(模型) |
| 适用场景 | 规则明确(如计算税额) | 规则难以描述(如识别猫) |
| 编写方式 | 人工编写 if-else 逻辑 | 算法自动从数据中学习 |
1.3 为什么需要机器学习?
有些任务,人类说不清规则:
# 传统编程:判断邮件是否是垃圾邮件
def is_spam_traditional(email):
if "免费" in email:
return True
if "中奖" in email:
return True
if "点击领取" in email:
return True
# ... 还有多少规则?永远写不完!
return False
# 机器学习:给模型 10 万封已标注的邮件,让它自己学
# model.fit(emails, labels)
# model.predict(new_email) → 自动判断
机器学习适用的场景:
- 规则复杂或未知(图像识别、语音识别)
- 规则会变化(推荐系统、欺诈检测)
- 数据量大到人类无法手动分析
- 需要个性化的结果
二、机器学习的三大分类
2.1 监督学习——有"标准答案"
核心:给模型大量"输入-输出"配对数据,让它学习映射关系。
| 类型 | 输出 | 例子 |
|---|---|---|
| 分类 | 离散类别 | 邮件→垃圾/正常,图片→猫/狗 |
| 回归 | 连续数值 | 面积→房价,特征→温度 |
# 监督学习的数据格式
# X(特征/输入) y(标签/输出)
# [面积, 房间数, 楼层] → 房价
# [120, 3, 15] → 350万
# [80, 2, 8] → 220万
# [200, 4, 20] → 580万
关键:训练数据必须有标签(标准答案)。模型的目标是学会从 X 预测 y。
2.2 无监督学习——没有"标准答案"
核心:只有输入数据,没有标签。让模型自己发现数据中的结构和模式。
| 类型 | 做什么 | 例子 |
|---|---|---|
| 聚类 | 把相似的数据分组 | 客户分群、新闻归类 |
| 降维 | 减少特征数量 | PCA(第三阶段学过) |
| 异常检测 | 找出不正常的数据 | 信用卡欺诈检测 |
# 无监督学习的数据:没有标签
# X(特征)
# [消费金额, 消费频次, 最近消费]
# [500, 10, 3天前]
# [50, 2, 30天前]
# [1000, 20, 1天前]
# → 模型自动分成 "高价值客户"、"低频客户" 等群组
2.3 强化学习——通过"试错"学习
核心:智能体(Agent)在环境中采取行动,根据奖励/惩罚调整策略。
| 要素 | 说明 |
|---|---|
| 智能体 | 做决策的 AI |
| 环境 | 智能体所在的世界 |
| 状态 | 当前环境的信息 |
| 行动 | 智能体能做的选择 |
| 奖励 | 行动后得到的反馈 |
# 强化学习的直觉:训练小狗
# 状态:小狗看到的环境
# 行动:坐下 / 站起 / 握手
# 奖励:做对了 → 给零食(+1),做错了 → 不给(0)
# 经过多次试错,小狗学会了正确的行为
本课程的重点
本阶段主要学习监督学习和无监督学习。强化学习会在第九阶段(AI Agent)中涉及。
2.4 三种学习方式对比
| 监督学习 | 无监督学习 | 强化学习 | |
|---|---|---|---|
| 数据有标签? | 有 | 没有 | 有奖励信号 |
| 目标 | 预测标签 | 发现结构 | 最大化奖励 |
| 典型算法 | 线性回归、决策树 | K-Means、PCA | Q-Learning、PPO |
| AI 应用 | 图像分类、翻译 | 客户分群、推荐 | 游戏 AI、机器人 |