基于python的大数据分析-pandas数据读取(代码实战)-创新互联

我们常见的数据存储格式无非就是csv、excel、txt以及数据库等形式。

创新互联是一家集网站建设,通榆企业网站建设,通榆品牌网站建设,网站定制,通榆网站建设报价,网络营销,网络优化,通榆网站推广为一体的创新建站企业,帮助传统企业提升企业形象加强企业竞争力。可充分满足这一群体相比中小企业更为丰富、高端、多元的互联网需求。同时我们时刻保持专业、时尚、前沿,时刻以成就客户成长自我,坚持不断学习、思考、沉淀、净化自己,让我们为更多的企业打造出实用型网站。

数据读取

在pandas中可以使用一些函数完成数据的读取。比如read_csv、read_excel、read_table、read_sql等,这些分别是啥意思呢。。。。自己看后缀就能明白啦~

下面我们就通过撸代码来了解它们

txt文件

格式:read_table(文件路径与文件名, names=[列名1,列名2,.....], sep="",......)

其中names为列名,默认为文件中的第一行作为列名

sep为分隔符,默认为空

from pandas import read_table

#txt
df=read_table(r'D:python_workspaceanacondarz.txt')
#查看前五行数据
df.head(5)
#查看后两行数据
#df.tail(2)

rz.txt的内容如下

基于python的大数据分析-pandas数据读取(代码实战)

csv文件

格式:read_csv(文件路径与文件名, names=[列名1,列名2,.....], sep="",......)

解释同上,不在废话

#csv
from pandas import read_csv

df=read_csv(r'D:python_workspaceanacondarz.csv')
df

rz.csv的内容如下

基于python的大数据分析-pandas数据读取(代码实战)

excel文件

格式:read_excel(文件路径与文件名, sheetname=sheet的名称, header=0)

sheetname可以指定读取几个sheet,sheet数目从0开始。如果sheetname=[0,2]则代表读取第一个和第三个sheet

header为0表示以文件第一行作为表头显示;为1则把文件第一行丢弃不作为表头显示。

#exel
from pandas import read_excel

df=read_excel(r'D:python_workspaceanacondarz.xls', sheetname='Sheet3')
df

mysql

首先安装pymysql,通过pip命令即可安装

格式:read_sql(要查询的sql语句, 数据库的链接对象)

import pandas as pd
import pymysql

#具体的数据库链接信息自行替换
conn=pymysql.connect(host='xxxx',database='xxx',user='root',
password='',port=3306,charset='utf8')
sql='select * from a'
r=pd.read_sql(sql,conn)
#关闭数据库链接
conn.close()
print(r.head(5))

另外有需要云服务器可以了解下创新互联scvps.cn,海内外云服务器15元起步,三天无理由+7*72小时售后在线,公司持有idc许可证,提供“云服务器、裸金属服务器、高防服务器、香港服务器、美国服务器、虚拟主机、免备案服务器”等云主机租用服务以及企业上云的综合解决方案,具有“安全稳定、简单易用、服务可用性高、性价比高”等特点与优势,专为企业上云打造定制,能够满足用户丰富、多元化的应用场景需求。

网页标题:基于python的大数据分析-pandas数据读取(代码实战)-创新互联
网站路径:https://www.cdcxhl.com/article36/cepcpg.html

成都网站建设公司_创新互联,为您提供自适应网站关键词优化网站维护定制开发微信公众号网站改版

广告

声明:本网站发布的内容(图片、视频和文字)以用户投稿、用户转载内容为主,如果涉及侵权请尽快告知,我们将会在第一时间删除。文章观点不代表本网站立场,如需处理请联系客服。电话:028-86922220;邮箱:631063699@qq.com。内容未经允许不得转载,或转载时需注明来源: 创新互联

网站优化排名