快速将非数值型目标变量转化为数值型变量

快速将非数值型目标变量转化为数值型变量,比如把[‘L’,’M’,’N’]转化为[1,2,3]或多维向量类型

转化前:

df_train.y.value_counts()
C    620
R    477
G    361
M    353
L    267
T    216
E     87
Name: y, dtype: int64

法1:转化为一维型

from sklearn import preprocessing
# 获取目标变量列
data_y=df_train['y']
# 获取目标变量值
y_labels=list(data_y.value_counts().index)
# 创建标签预处理器
le=preprocessing.LabelEncoder()
le.fit(y_labels)

# 对每一个标签值进行映射
y=data_y.map(lambda x :le.transform([x])[0])
y.value_counts()

转化后:

0    620
5    477
2    361
4    353
3    267
6    216
1     87
Name: y, dtype: int64

法2:转化为多维型

from keras.utils.np_utils import to_categorical
from sklearn import preprocessing
# 获取目标变量列
data_y=df_train['y']
# 获取目标变量值
y_labels=list(data_y.value_counts().index)
# 创建标签预处理器
le=preprocessing.LabelEncoder()
le.fit(y_labels)
# 获取标签的类别数
num_labels=len(y_labels)

# 对每一个标签值进行映射
y=to_categorical(data_y.map(lambda x :le.transform([x])[0]),num_labels)
print(y[:5])

转化后:

array([[0., 0., 0., 0., 0., 0., 1.],
       [0., 0., 0., 0., 0., 0., 1.],
       [0., 0., 1., 0., 0., 0., 0.],
       [0., 0., 1., 0., 0., 0., 0.],
       [0., 0., 1., 0., 0., 0., 0.]])

文章作者: IrvingBei
版权声明: 本博客所有文章除特別声明外,均采用 CC BY 4.0 许可协议。转载请注明来源 IrvingBei !
评论
 上一篇
Keras examples-babi_rnn Keras examples-babi_rnn
1 任务描述本实验利用提供的20个种类的数据集,完成KQA的任务。 2 具体实现任务整体流程如图所示: (1)引入必要的包from __future__ import print_function from functools impor
2018-07-24
下一篇 
Keras examples-addition_rnn Keras examples-addition_rnn
Keras examples-addition_rnn1、任务描述(1)任务概述:主要是利用序列学习来实现两个整数(字符串)的加法(2)任务分析:两个整数相加,需要通过神经网络来训练,于是不能够直接将整型作为神经网络的输入;想想办法,如果将
2018-07-20
  目录