python:pandas合并csv文件的方法(图书数据集成)-创新互联

数据集成:将不同表的数据通过主键进行连接起来,方便对数据进行整体的分析。

成都创新互联专注为客户提供全方位的互联网综合服务,包含不限于做网站、网站制作、红安网络推广、小程序设计、红安网络营销、红安企业策划、红安品牌公关、搜索引擎seo、人物专访、企业宣传片、企业代运营等,从售前售中售后,我们都将竭诚为您服务,您的肯定,是我们大的嘉奖;成都创新互联为所有大学生创业者提供红安建站搭建服务,24小时服务热线:18982081108,官方网址:www.cdcxhl.com

两张表:ReaderInformation.csv,ReaderRentRecode.csv

ReaderInformation.csv:

python:pandas合并csv文件的方法(图书数据集成)

ReaderRentRecode.csv:

python:pandas合并csv文件的方法(图书数据集成)

pandas读取csv文件,并进行csv文件合并处理:

# -*- coding:utf-8 -*-
import csv as csv
import numpy as np
# -------------
# csv读取表格数据
# -------------
'''
csv_file_object = csv.reader(codecs.open('ReaderRentRecode.csv', 'rb'))
header = csv_file_object.next()
print header
print type(header)
print header[1]
data = []
for row in csv_file_object:
  data.append(row)
data = np.array(data)
print data[0::, 0]
'''
# -------------
# pandas读取表格数据
# -------------
import pandas as pd
df = pd.read_csv('ReaderRentRecode.csv') # 读者借阅信息表
'''
print df.head()
print '----------------'
print df[['读者证号', '读者姓名', '书名', '中图法分类号']] # 选取其中的四列
print '------------------------------------------------------------------'
print
'''
dd = pd.read_csv('ReaderInformation.csv')
'''
print dd.head()
print '----------------'
print dd[['读者证号', '读者性别', '读者单位', '读者类别']]
print '------------------------------------------------------------------'
print
'''
data = pd.merge(df, dd, on=['读者证号', '读者姓名'], how='left') # pandas csv表左连接
data = data[['读者证号', '读者姓名', '读者性别', '书名', '中图法分类号', '读者单位', '读者类别']]
print data
print '------------------------------------------------------------------'
print
# -------------
# pandas写入表格数据
# -------------
data.to_csv(r'data.csv', encoding='gbk')

当前名称:python:pandas合并csv文件的方法(图书数据集成)-创新互联
文章位置:http://pwwzsj.com/article/degddo.html