本文共 440 字,大约阅读时间需要 1 分钟。
一,基本流程:
1.确定要编码的对象
2.确定分类变量、特征
3.将其转化为二进制向量表示
二,举例
比如要对[“青年”, “中年”, “老年”,“中年”]进行one-hot编码
1,确定要编码的对象:
["青年", "中年", "老年","中年"]
2,确定分类变量、特征:
["青年", "中年", "老年"] 一共有三种类别或者说三个特征
3,将其转化为二进制向量表示
因为一共有三个特征,所以编码对象的每个样本一共用三位二进制表示:
青年 中年 老年青年 1 0 0中年 0 1 0老年 0 0 1中年 0 1 0
所以编码完后的矩阵为:
[[1, 0, 0], [0, 1, 0], [0, 0, 1], [0, 1, 0]]
Done!
转载地址:http://vkjo.baihongyu.com/