博客
关于我
one-hot编码的流程步骤
阅读量:263 次
发布时间:2019-03-01

本文共 440 字,大约阅读时间需要 1 分钟。

一,基本流程:

1.确定要编码的对象

2.确定分类变量、特征

3.将其转化为二进制向量表示

二,举例

比如要对[“青年”, “中年”, “老年”,“中年”]进行one-hot编码

1,确定要编码的对象:

["青年", "中年", "老年","中年"]

2,确定分类变量、特征:

["青年", "中年", "老年"]  一共有三种类别或者说三个特征

3,将其转化为二进制向量表示

因为一共有三个特征,所以编码对象的每个样本一共用三位二进制表示:

青年  中年   老年青年             1         0         0中年             0         1         0老年             0         0         1中年             0         1         0

所以编码完后的矩阵为:

[[1, 0, 0], [0, 1, 0], [0, 0, 1], [0, 1, 0]]

Done!

转载地址:http://vkjo.baihongyu.com/

你可能感兴趣的文章
MyBatisPlus快速入门——MyBatisPlus集成Druid配置应用
查看>>
react项目:react拦截器和token问题
查看>>
2020-11-22周总结
查看>>
BCGControlBar教程:应用向导
查看>>
MyEclipse教程:Web开发——部署并测试项目
查看>>
【更新】CLion v2018.3发布(六):VCS和插件
查看>>
Linux-调试器gdb-make/makefile-git工具
查看>>
C++-必须知道的类的6个默认成员函数(构造-析构-拷贝构造-操作符重载)
查看>>
移动通信教学大纲
查看>>
leetcode关于微信读书的笔记-字符串
查看>>
文件服务器——src文件夹
查看>>
从零构建通讯器--4.4-4.5信号在创建线程的实战作用、write函数写入日志设置成不混乱、文件IO详解
查看>>
从零构建通讯器--5.2三次握手,telnet,wireshark
查看>>
关于信号的截断备忘录
查看>>
从零构建通讯器--5.6 通讯代码精粹之epoll函数实战1(连接池)
查看>>
Ubuntu命令行C++编译链接第三方库及命名空间
查看>>
为什么vs中的地址值是顺序相反的?
查看>>
如何判断两个浮点数是否相等?
查看>>
什么是地址?
查看>>
2019徐州网络赛K XKC's basketball team(结构体排序+二分+RMQ)
查看>>