001 pandas 输入输出文件

本文详细介绍了pandas库中用于读写文件的各种方法,包括read_csv、read_table的基本用法,如设置分隔符、自定义列名、指定索引列以及部分读取数据。同时,还涵盖了导出数据到csv和json格式的to_csv和to_json函数的使用技巧。

pandas 读写文件

pandas读取文件

pandas读取文件的方法

read_csv/read_table参数

在这里插入图片描述在这里插入图片描述

导入

基本导入 read_csv

print(pd.read_csv('test.csv'))
print(pd.read_table('test.csv', sep=','))

数据库导入

# import sqlalchemy
# db = sqlalchemy.create_engine('sqlite:///mydata.sqlite')
# db = sqlalchemy.create_engine('mysql+pymysql://root:xxxxx@localhost/xxxx')
# pd.read_sql('select * from test', db)

分隔符 sep

# 正则分隔符
pd.read_table('examples/ex3.txt', sep='\s+')

没有列名 header

print(pd.read_csv('test_no_head.csv', header=None))

自定义列名 name

 names = ['name', 'p_id', 'id', 'level']
 print(pd.read_csv('tt.csv', names=names))

某列设为索引 index_col

print(pd.read_csv('tt.csv', names=names, index_col='id'))
层次化索引
print(pd.read_csv('tt.csv', names=names, index_col=['p_id', 'id']))

部分读取 nrows chunksize

# 只读取8行*
print(pd.read_csv(filename, nrows=8, header=None))*

# 逐块读取
pd.read_csv(filename, chunksize=100)

导出

导出 to_csv

# 导出数据
dd = pd.read_csv(filename, nrows=8, names=['name', 'pid', 'id', 'level'])
dd.index.name = 'id'
dd.to_csv('out.csv')

# 自定义导出的列
dd1.to_csv(sys.stdout, index=False, columns=['name', 'id'])

导出 to_json (read_json)

import json

res = json.loads(obj)
print(type(res), res)
res_json = json.dumps(res)
print(type(res_json), res_json)

data = pd.read_json('examples/example.json')
data.to_json('xxx.json')
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值