scikit-learn 笔记

分类标签转数值

方法1:LabelEncoder

1
2
3
4
5
6
from sklearn.preprocessing import LabelEncoder

# 将 分类标签 转为 数值
class_le = LabelEncoder()
y_train_n = class_le.fit_transform(df_raw_train["Label"].astype("str"))
y_test_n = class_le.fit_transform(df_raw_test["Label"].astype("str"))

方法2:自定义条件对应填值

1
2
3
4
5
6
7
8
# 将 Spam 用 1 表示, Non-Spam 用 0 表示
df_train.loc[df_train["Label"]=="Spam", "Label"] = 1
df_train.loc[df_train["Label"]=="Non-Spam", "Label"] = 0
print(df_train.head)

df_test.loc[df_test["Label"]=="Spam", "Label"] = 1
df_test.loc[df_test["Label"]=="Non-Spam", "Label"] = 0
print(df_test.head)

参考

感谢帮助!