APP下载

基于python的大资料分析-pandas资料读取(程式码实战)

消息来源:baojiabao.com 作者: 发布时间:2026-05-15

报价宝综合消息基于python的大资料分析-pandas资料读取(程式码实战)

我们常见的资料储存格式无非就是csv、excel、txt以及数据库等形式。

资料读取

在pandas中可以使用一些函式完成资料的读取。比如read_csv、read_excel、read_table、read_sql等,这些分别是啥意思呢。。。。自己看字尾就能明白啦~

下面我们就通过撸程式码来了解它们

txt档案

格式:read_table(档案路径与档名, names=[列名1,列名2,.....], sep="",......)

其中names为列名,预设为档案中的第一行作为列名

sep为分隔符,预设为空

from pandas import read_table

#txt

df=read_table(r\'D:python_workspaceanacondarz.txt\')

#检视前五行资料

df.head(5)

#检视后两行资料

#df.tail(2)

rz.txt的内容如下

csv档案

格式:read_csv(档案路径与档名, names=[列名1,列名2,.....], sep="",......)

解释同上,不在废话

#csv

from pandas import read_csv

df=read_csv(r\'D:python_workspaceanacondarz.csv\')

df

rz.csv的内容如下

excel档案

格式:read_excel(档案路径与档名, sheetname=sheet的名称, header=0)

sheetname可以指定读取几个sheet,sheet数目从0开始。如果sheetname=[0,2]则代表读取第一个和第三个sheet

header为0表示以档案第一行作为表头显示;为1则把档案第一行丢弃不作为表头显示。

#exel

from pandas import read_excel

df=read_excel(r\'D:python_workspaceanacondarz.xls\', sheetname=\'Sheet3\')

df

mysql

首先安装pymysql,通过pip命令即可安装

格式:read_sql(要查询的sql语句, 数据库的连结物件)

import pandas as pd

import pymysql

#具体的数据库连结资讯自行替换 conn=pymysql.connect(host=\'xxxx\',database=\'xxx\',user=\'root\', password=\'\',port=3306,charset=\'utf8\')

sql=\'select * from a\'

r=pd.read_sql(sql,conn)

#关闭数据库连结

conn.close

print(r.head(5))

2020-01-16 15:51:00

相关文章