项目：文本情感分析

本节定位

情感分析项目很适合做作品集，不是因为它最炫，而是因为它很适合训练“项目判断力”：

标签怎么定
baseline 怎么建
错误怎么解释
结果怎么展示

这一节的目标不是堆复杂模型，而是把一个小项目真正做完整。

学习目标

学会给情感分析任务设计稳定的标签边界
学会搭一个可解释 baseline 并读懂结果
学会把错误分析做成项目亮点，而不是事后补丁
学会把一个小 NLP 项目包装成可交付作品

一、项目题目先要收窄

1.1 最稳的起点是二分类

先做：

positive
negative

而不是一开始就做：

positive / neutral / negative / irony / mixed

1.2 为什么二分类适合练手？

因为：

标签更清楚
数据更容易准备
错误更容易分析

1.3 一个适合作品集的题目

例如：

做一个“课程评价情感分析器”，判断评论是正向还是负向。

这个题目非常适合，因为用户语料、标签边界和业务意义都比较清楚。

二、项目最小闭环长什么样？

定义标签边界
准备小型标注数据
做 baseline
做错误分析
设计一个最小推理接口或展示页

如果这 5 步都清楚，你的项目通常就已经比“只训个模型”更像作品级了。

三、先跑一个最小 baseline 项目

为了让逻辑足够清楚，这里先用一个关键词统计型 baseline。
它当然不够强，但非常适合解释项目闭环。

from collections import Counter

train_data = [
    ("这门课讲得很清楚", "positive"),
    ("案例很多，学起来很顺", "positive"),
    ("内容太乱了", "negative"),
    ("讲得太快，听不懂", "negative"),
]

test_data = [
    ("这门课真的很清楚", "positive"),
    ("内容有点乱", "negative"),
    ("案例很多但是讲太快", "negative"),
]


positive_words = Counter()
negative_words = Counter()

for text, label in train_data:
    tokens = list(text)
    if label == "positive":
        positive_words.update(tokens)
    else:
        negative_words.update(tokens)


def predict(text):
    score = 0
    for token in text:
        score += positive_words[token]
        score -= negative_words[token]
    return "positive" if score >= 0 else "negative", score


results = []
for text, gold in test_data:
    pred, score = predict(text)
    results.append({"text": text, "gold": gold, "pred": pred, "score": score})
    print(results[-1])

3.1 这个 baseline 为什么有教学价值？

因为它很容易解释：

为什么判成正面
为什么判成负面

这让你能真正做“错误分析”，而不是只盯一个数字。

四、真正让项目变强的是错误分析

4.1 先把错例挑出来

errors = [row for row in results if row["gold"] != row["pred"]]
print(errors)

4.2 常见错误类型

对情感分析来说，最值得单独看的是：

否定词
例如“不差”“不推荐”
反讽
例如“真棒，又崩了”
混合评价
例如“内容很好，但太难了”

4.3 为什么错误分析这么值钱？

因为它能直接告诉你下一步该怎么做：

补数据
改标签标准
升级模型

五、这个项目怎么往作品级再推一步？

5.1 补一个传统强基线

例如：

TF-IDF + LogisticRegression

让你的项目至少有：

规则基线
传统 ML 基线

5.2 再补一个深度 baseline

例如：

embedding + pooling
BERT 分类

5.3 展示时不要只放总分

很推荐展示：

标签定义
baseline 对比
典型错例
负样本 hardest cases

这样项目会非常完整。

六、最容易踩的坑

6.1 标签标准不一致

这是很多情感项目的第一大坑。

6.2 只看准确率

不看具体错在哪，你很难真正优化。

6.3 一开始就追求最复杂模型

没有 baseline，复杂模型的提升就很难讲清。

七、小结

这节最重要的是建立一个项目习惯：

情感分析项目最有价值的地方，不是模型多复杂，而是你能否把标签边界、baseline、错误分析和升级路线讲成一个完整闭环。

只要这一点做到位，即使题目不大，也会非常像作品级课程。

练习

自己设计 12 条课程评价，并给出正负标签。
在 baseline 上再手工加入一个“否定词翻转规则”，看看能否修掉某类错误。
想一想：为什么情感分析特别适合做错误分析展示？
如果你要把这个项目扩成三分类，你会先改标签标准还是先换模型？为什么？

学习目标​

一、项目题目先要收窄​

1.1 最稳的起点是二分类​

1.2 为什么二分类适合练手？​

1.3 一个适合作品集的题目​

二、项目最小闭环长什么样？​

三、先跑一个最小 baseline 项目​

3.1 这个 baseline 为什么有教学价值？​

四、真正让项目变强的是错误分析​

4.1 先把错例挑出来​

4.2 常见错误类型​

4.3 为什么错误分析这么值钱？​

五、这个项目怎么往作品级再推一步？​

5.1 补一个传统强基线​

5.2 再补一个深度 baseline​

5.3 展示时不要只放总分​

六、最容易踩的坑​

6.1 标签标准不一致​

6.2 只看准确率​

6.3 一开始就追求最复杂模型​

七、小结​

练习​