pythonpandas合并两个csv文件_python:pandas合并csv文件的方法(图书数据集成)

数据集成:将不同表的数据通过主键进行连接起来,方便对数据进行整体的分析。

两张表:ReaderInformation.csv,ReaderRentRecode.csv

ReaderInformation.csv:

《pythonpandas合并两个csv文件_python:pandas合并csv文件的方法(图书数据集成)》

ReaderRentRecode.csv:

《pythonpandas合并两个csv文件_python:pandas合并csv文件的方法(图书数据集成)》

pandas读取csv文件,并进行csv文件合并处理:

# -*- coding:utf-8 -*-

import csv as csv

import numpy as np

# ————-

# csv读取表格数据

# ————-

”’

csv_file_object = csv.reader(codecs.open(‘ReaderRentRecode.csv’, ‘rb’))

header = csv_file_object.next()

print header

print type(header)

print header[1]

data = []

for row in csv_file_object:

data.append(row)

data = np.array(data)

print data[0::, 0]

”’

# ————-

# pandas读取表格数据

# ————-

import pandas as pd

df = pd.read_csv(‘ReaderRentRecode.csv’) # 读者借阅信息表

”’

print df.head()

print ‘—————-‘

print df[[‘读者证号’, ‘读者姓名’, ‘书名’, ‘中图法分类号’]] # 选取其中的四列

print ‘——————————————————————‘

print

”’

dd = pd.read_csv(‘ReaderInformation.csv’)

”’

print dd.head()

print ‘—————-‘

print dd[[‘读者证号’, ‘读者性别’, ‘读者单位’, ‘读者类别’]]

print ‘——————————————————————‘

print

”’

data = pd.merge(df, dd, on=[‘读者证号’, ‘读者姓名’], how=’left’) # pandas csv表左连接

data = data[[‘读者证号’, ‘读者姓名’, ‘读者性别’, ‘书名’, ‘中图法分类号’, ‘读者单位’, ‘读者类别’]]

print data

print ‘——————————————————————‘

print

# ————-

# pandas写入表格数据

# ————-

data.to_csv(r’data.csv’, encoding=’gbk’)

合并后的csv文件:data.csv

《pythonpandas合并两个csv文件_python:pandas合并csv文件的方法(图书数据集成)》

通过使用pandas的函数merge来进行两个表的左连接,最后得到相应的data.csv文件。

以上这篇python:pandas合并csv文件的方法(图书数据集成)就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持我们。

您可能感兴趣的文章:

使用Python对Csv文件操作实例代码

Python遍历pandas数据方法总结

使用python获取csv文本的某行或某列数据的实例

在Python中利用Pandas库处理大数据的简单介绍

python处理csv数据的方法

Python利用pandas计算多个CSV文件数据值的实例

时间: 2018-04-10

    原文作者:weixin_39658716
    原文地址: https://blog.csdn.net/weixin_39658716/article/details/111841502
    本文转自网络文章,转载此文章仅为分享知识,如有侵权,请联系博主进行删除。
点赞