<>DataFrame

1. 创建 DataFrame
# 创建一个空的 DataFrame #df = pd.DataFrame(columns=['车牌号', '车型', '标签']) df = pd.
DataFrame([['沪C 100232', '奔驰', 'Y'], ['鲁A 801353', '奥迪', 'N'], ['豫H 666132',
'宝马', 'Y']]) df.columns = ['车牌号', '车型', '标签'] 车牌号 车型 标签 0 沪C 100232 奔驰 Y 1 鲁A
801353 奥迪 N 2 豫H 666132 宝马 Y
2. mapping变换【车型】列数据
# 奔驰 -> 1, 奥迪 -> 2, 宝马 -> 3. mapping_1 = {'奔驰': 1, '奥迪': 2, '宝马': 3} df['车型'] =
df['车型'].map(mapping_1) 车牌号 车型 标签 0 沪C 100232 1 Y 1 鲁A 801353 2 N 2 豫H 666132 3
Y
3. 处理【车牌号】列数据
# 沪C 100232 ->沪C , 鲁A 801353 ->鲁A , 豫H 666132 ->豫H. df['车牌号'] = list(map(lambda
var: var[:2],df['车牌号'].tolist())) 车牌号 车型 标签 0 沪C 1 Y 1 鲁A 2 N 2 豫H 3 Y
4. 处理【标签】列数据
# Y ->0 , N ->1 , Y ->0. mapping_2 = {value:ind for ind,value in enumerate(set(
df['标签']))} df['标签'] = df['标签'].map(mapping_2) 车牌号 车型 标签 0 沪C 1 0 1 鲁A 2 1 2 豫H
3 0
5. one_hot 处理【车牌号】
pd.get_dummies(df) #pd.get_dummies(df['车牌号']) 车型 标签 车牌号_沪C 车牌号_豫H 车牌号_鲁A 0 1 0
1 0 0 1 2 1 0 0 1 2 3 0 0 1 0

技术
©2019-2020 Toolsou All rights reserved,
(精华)2020年7月15日 微信小程序 template的使用Vue el-select 获取label值Java分布式系统高并发解决方案小结python 中的短路逻辑pytorch之ResNet18(对cifar10数据进行分类准确度达到94%)SpringDataJPA的Repository理解Golang数组平分,数组拆分,数组分组指定位置输出字符串--PTApython3读取文件指定几行,并写入另一个文件Vue + Element-ui的下拉框el-select获取额外参数