机器学习sklearn和字典特征抽取

时间:2021-01-29 12:02:49   收藏:0   阅读:0

sklean数据集

sklearn.datasets

sklearn小数据集


技术图片

技术图片

sklearn大数据集


sklearn数据集的使用


技术图片

 

 

 

sklearn数据集返回值介绍

 
def datasets_demo(): """ sklearn数据集使用 """ #获取数据集 iris=load_iris() print("鸢尾花数据集:\n",iris) print("查看数据集描述:\n",iris.DESCR) print("查看特征值的名字:\n",iris.feature_names) print("查看特征值:\n",iris.data,iris.data.shape) #数据集划分 # 训练集的特征值x_train 测试集的特征值x_test 训练集的目标值y_train 测试集的目标值y_test x_train,x_test,y_train,y_test = train_test_split(iris.data,iris.target,test_size=0.2,random_state=22) #训练集的特征值 print("训练集的特征值:\n",x_train,x_train.shape ) # 随机数种子 x_train1, x_test1, y_train1, y_test1 = train_test_split(iris.data, iris.target, random_state=6) x_train2, x_test2, y_train2, y_test2 = train_test_split(iris.data, iris.target, random_state=6) print("如果随机数种子不一致:\n", x_train == x_train1) print("如果随机数种子一致:\n", x_train1 == x_train2) return None
 

特征提取


字典特征提取


作用:对字典数据进行特征值化

我们对以下数据进行特征提取

[{‘city‘: ‘北京‘,‘temperature‘:100} {‘city‘: ‘上海‘,‘temperature‘:60} {‘city‘: ‘深圳‘,‘temperature‘:30}]
 
def dict_demo(): """ 对字典类型的数据进行特征抽取 :return: None """ data = [{‘city‘: ‘北京‘, ‘temperature‘: 100}, {‘city‘: ‘上海‘, ‘temperature‘: 60}, {‘city‘: ‘深圳‘, ‘temperature‘: 30}] # 1、实例化一个转换器类 transfer = DictVectorizer(sparse=False) # 2、调用fit_transform data = transfer.fit_transform(data) print("返回的结果:\n", data) # 打印特征名字 print("特征名字:\n", transfer.get_feature_names()) return None
 

技术图片

 

 对于特征当中存在类别信息的我们都会做one-hot编码处理

评论(0
© 2014 mamicode.com 版权所有 京ICP备13008772号-2  联系我们:gaon5@hotmail.com
迷上了代码!