博客
关于我
one-hot编码的流程步骤
阅读量:262 次
发布时间:2019-03-01

本文共 440 字,大约阅读时间需要 1 分钟。

一,基本流程:

1.确定要编码的对象

2.确定分类变量、特征

3.将其转化为二进制向量表示

二,举例

比如要对[“青年”, “中年”, “老年”,“中年”]进行one-hot编码

1,确定要编码的对象:

["青年", "中年", "老年","中年"]

2,确定分类变量、特征:

["青年", "中年", "老年"]  一共有三种类别或者说三个特征

3,将其转化为二进制向量表示

因为一共有三个特征,所以编码对象的每个样本一共用三位二进制表示:

青年  中年   老年青年             1         0         0中年             0         1         0老年             0         0         1中年             0         1         0

所以编码完后的矩阵为:

[[1, 0, 0], [0, 1, 0], [0, 0, 1], [0, 1, 0]]

Done!

转载地址:http://vkjo.baihongyu.com/

你可能感兴趣的文章
关于信号的截断备忘录
查看>>
从零构建通讯器--5.6 通讯代码精粹之epoll函数实战1(连接池)
查看>>
Ubuntu命令行C++编译链接第三方库及命名空间
查看>>
为什么vs中的地址值是顺序相反的?
查看>>
如何判断两个浮点数是否相等?
查看>>
什么是地址?
查看>>
2019徐州网络赛K XKC's basketball team(结构体排序+二分+RMQ)
查看>>
POJ - 3984 迷宫问题(bfs+路径标记)
查看>>
HDU - 1114 Piggy-Bank(dp_完全背包)
查看>>
2017ccpc杭州 E. Master of Subgraph(点分治 + 树dp + bitset)
查看>>
HDU - 4597 Play Game (博弈 + 区间dp)
查看>>
Educational Codeforces Round 99 (Rated for Div. 2)(A-E)
查看>>
2021牛客寒假算法基础集训营3
查看>>
codeforces1485D.Multiples and Power Differences(思维)
查看>>
C++ | 虚拟地址空间
查看>>
int 越界处理
查看>>
Linux-调试器(gdb)、make&&makefile、git操作(图文并茂)
查看>>
营收环比增幅近50%,星巴克在经历“劫”后重生吗?
查看>>
苹果进军搜索,背后藏着什么“阳谋”?
查看>>
上市两年后迎首次盈利,拼多多“稳”了吗?
查看>>