【Python3】pandas.read_csv详解

最新推荐文章于 2024-09-23 10:47:04 发布

原创最新推荐文章于 2024-09-23 10:47:04 发布 · 2w 阅读

·

17

·

本内容遵循CC 4.0 BY-SA版权协议

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

标签

#Python #pandas #read_csv #参数 #读取文件

Python 专栏收录该内容

93 篇文章

订阅专栏

本文详细解析Python中Pandas库的read_csv函数，涵盖path、sep、header等关键参数的使用，帮助读者掌握高效读取和预处理CSV数据的方法。

Python3.8

Python 是一种高级、解释型、通用的编程语言，以其简洁易读的语法而闻名，适用于广泛的应用，包括Web开发、数据分析、人工智能和自动化脚本

Python数据分析，一般第一步就是读取数据，这篇详解pandas读取数据read_csv。

read_csv函数参数
几个常用的参数包括path、sep、header、index_col、names、skiprows、na_values、nrows、skip_footer、encoding。下面主要对这几个参数解释。
读取文件，必要参数path给出文件路径，encoding设置csv文件编码格式，默认为“utf-8”，这里文件格式为“gbk”。
sep给出文件分隔符，默认为‘,’，这里文件分隔符也是‘,’,如果分隔符为其他符号，可以用此参数。
header默认为0，表示第0行为标题，可以给定None表示文件无标题，同时在header为None时可以给定参数names来给定列名。
skiprows可以选择忽略前面的行数，通过下图可以对比使用skiprows前后的shape。
na_values可以用来替换NA值，当然这里我的数据没有NA，如果有的话可以用这个参数。
nrows从文件开始时选取需要读取的行数。可以看到使用nrows=3之后，数据只有前三行。（df.head()默认读取前五行）
skipfooter从文件末尾选择需要忽略的行数。忽略了28行之后，只剩下前五行了。

我们下次再见，如果还有下次的话！！！
欢迎关注微信公众号：516数据工作室

您可能感兴趣的与本文相关的镜像

Python3.8

Python3.8

Conda

Python

Python 是一种高级、解释型、通用的编程语言，以其简洁易读的语法而闻名，适用于广泛的应用，包括Web开发、数据分析、人工智能和自动化脚本

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。