问题出现情景:
读取DataFrame中某一行,并进行value_counts()。
print(df['Layout'].value_counts())
打印出来的如下
2室1厅 9485
3室1厅 3999
3室2厅 2765
1室1厅 2681
2室2厅 1671
4室2厅 930
1室0厅 499
4室1厅 295
5室2厅 200
2房间1卫 170
1房间1卫 146
3房间1卫 116
......
其中包括 xx室xx厅 和 xx房间xx卫,需要将所有"xx房间xx卫"格式的数据都移除掉,只保留"xx室xx厅"的数据。
所以代码如下:
df = df.loc[df['Layout'].str.extract('^\d(.*?)\d.*?') == '室']
出现错误:

解决办法:加个expand=False
df = df.loc[df['Layout'].str.extract('^\d(.*?)\d.*?',expand=False) == '室']
本文解决在DataFrame中使用正则表达式提取特定格式数据时遇到的问题,通过调整extract方法的参数,成功过滤掉不符合条件的数据项。
:ValueError: Cannot index with multidimensional key&spm=1001.2101.3001.5002&articleId=100061997&d=1&t=3&u=b4fecc6c39284070a4402af24c608204)

被折叠的 条评论
为什么被折叠?



