pandas修改DataFrame列名的实现方法_Python

pandas修改DataFrame列名的实现方法

2021-06-01 00:22耗子 Python

这篇文章主要介绍了pandas修改DataFrame列名的实现方法，文中通过示例代码介绍的非常详细，对大家的学习或者工作具有一定的参考学习价值，需要的朋友们下面随着小编来一起学习学习吧

提出问题

存在一个名为dataset的DataFrame

				?

									>>> dataset.columns

									Index(['age', 'job', 'marital', 'education', 'default', 'housing', 'loan',

									    'contact', 'month', 'day_of_week', 'duration', 'campaign', 'pdays',

									    'previous', 'poutcome', 'emp.var.rate', 'cons.price.idx',

									    'cons.conf.idx', 'euribor3m', 'nr.employed', 'y'],

									   dtype='object')

现在, 我要将其columns名字改为:

				?

									>>> new_columns

									Index(['age_0', 'job_1', 'marital_2', 'education_3', 'default_4', 'housing_5',

									    'loan_6', 'contact_7', 'month_8', 'day_of_week_9', 'duration_10',

									    'campaign_11', 'pdays_12', 'previous_13', 'poutcome_14',

									    'emp.var.rate_15', 'cons.price.idx_16', 'cons.conf.idx_17',

									    'euribor3m_18', 'nr.employed_19', 'y_20'],

									   dtype='object')

该如何操作？

解决

一.通过DataFrame.columns类的自身属性修改:

1.无脑赋值直接修改

				?

									>>> # 先解决`new_columns`的推导问题

									>>> # 列表推导

									>>> new_columns_list = [column_str+'_'+str(i) for i ,column_str in enumerate(dataset.columns)]

									>>> # 类型转换

									>>> new_columns = pd.core.indexes.base.Index(new_columns_list)

									>>> dataset.columns = new_columns

2.通过.map(mapper, na_action=None)函数来修改

				?

									>>> # 注:mapper 多运用 lambda 表达式

									>>> # 但我似乎没有找到在 lambda 表达式中改变两个值的方法

									>>> # 所以只能蹩脚地用一个全局变量i, 和映射函数mapper()

									>>> # 希望大家能帮我找到方法

									>>> i = 0

									>>> def mapper(x): # 映射函数即 mapper

									  global i

									  x += '_' + str(i)

									  i += 1

									  return x

									>>> dataset.columns.map(mapper)

3.参考博客用到了DataFrame.columns.str对象

用help(DataFrame.columns.str)翻遍了文档，

也没能找到可以被我拿来套用的方法, 想着抽时间把这段文档翻译一下

二.通过DataFrame.rename()函数来修改

1.暴力字典法(好处：可以只修改特定的列)

				?

									>>> # 此处先用字典推导法

									>>> new_dict = {

									  key:key+'_'+str(i)

									  for i, key in enumerate(dataset.columns)

									  }

									>>> dataset.rename(columns=new_dict, inplace=True)

2.映射修改法

				?

									>>> # 原博文依然用到了 lambda 表达式

									>>> # 我就再生搬硬套一次, 把上面的复制过来

									>>> # 蹩脚地用一个全局变量i, 和映射函数mapper()

									>>> i = 0

									>>> def mapper(x): # 映射函数即 mapper

									  global i

									  x += '_' + str(i)

									  i += 1

									  return x

									dataset.rename(columns=mapper, inplace=True)