df['Name']='abc'
将添加新列并将所有行设置为该值:
In [79]:
df
Out[79]:
Date, Open, High, Low, Close
0 01-01-2015, 565, 600, 400, 450
In [80]:
df['Name'] = 'abc'
df
Out[80]:
Date, Open, High, Low, Close Name
0 01-01-2015, 565, 600, 400, 450 abc
您可以使用 insert
指定新列的位置。在这种情况下,我使用 0
将新列放在左侧。
df.insert(0, 'Name', 'abc')
Name Date Open High Low Close
0 abc 01-01-2015 565 600 400 450
总结其他人的建议,并添加第三种方式
你可以:
分配(**kwargs):df.assign(名称='abc')
访问新的列系列(它将被创建)并设置它: df['Name'] = 'abc'
插入(位置,列,值,allow_duplicates=False)df.insert(0,'名称','abc')
其中参数 loc ( 0 <= loc <= len(columns) ) 允许您在所需的位置插入列。
'loc' 为您提供插入后列所在的索引。例如,上面的代码将列 Name 插入为第 0 列,即它将插入到第一列之前,成为新的第一列。 (索引从 0 开始)。
所有这些方法都允许您从系列中添加新列(只需将上面的“abc”默认参数替换为系列)。
单班轮作品
df['Name'] = 'abc'
创建一个 Name
列并将所有行设置为 abc
值
我想更多地关注@michele-piccolini 的部分答案。
我坚信 .assign
是这里的最佳解决方案。在现实世界中,这些操作并不是孤立的,而是在一个操作链中。如果您想支持一系列操作,您可能应该使用 .assign
方法。
这是一个在滑雪胜地使用降雪数据的示例(但同样的原则也适用于……财务数据)。
这段代码读起来就像一个步骤配方。赋值(使用 =
)和 .insert
都使这变得更加困难:
raw = pd.read_csv('https://github.com/mattharrison/datasets/raw/master/data/alta-noaa-1980-2019.csv',
parse_dates=['DATE'])
def clean_alta(df):
return (df
.loc[:, ['STATION', 'NAME', 'LATITUDE', 'LONGITUDE', 'ELEVATION', 'DATE',
'PRCP', 'SNOW', 'SNWD', 'TMAX', 'TMIN', 'TOBS']]
.groupby(pd.Grouper(key='DATE', freq='W'))
.agg({'PRCP': 'sum', 'TMAX': 'max', 'TMIN': 'min', 'SNOW': 'sum', 'SNWD': 'mean'})
.assign(LOCATION='Alta',
T_RANGE=lambda w_df: w_df.TMAX-w_df.TMIN)
)
clean_alta(raw)
请注意行 .assign(LOCATION='Alta',
,它在其余操作的中间创建了一个具有单个值的列。
一条线为我完成了这项工作。
df['New Column'] = 'Constant Value'
df['New Column'] = 123
您可以简单地执行以下操作:
df['New Col'] = pd.Series(["abc" for x in range(len(df.index))])
df['date'] = pd.Series([pd.date_range('2020-01-01', '2023-12-31') for x in range(len(df.index))])
[0,0,0]
的Trajectory
列?它不适合您的方式df['Trajectory'] = [0,0,0]
,因为 pandas 将list
理解为整个列。