pandas的Series数组的使用方法-创新互联

这篇文章给大家分享的是pandas的Series数组的使用方法的内容。小编觉得挺实用的,因此分享给大家做个参考。一起跟随小编过来看看吧。  

目前创新互联已为1000+的企业提供了网站建设、域名、网络空间、网站托管、服务器托管、企业网站设计、蒸湘网站维护等服务,公司将坚持客户导向、应用为本的策略,正道将秉承"和谐、参与、激情"的文化,与客户和合作伙伴齐心协力一起成长,共同发展。

很多时候,我们数据除了数值之外,还有字符串,时间序列等

比如:我们通过爬虫获取到了存储在数据库中的数据

所以, numpy能够帮助我们处理数值,但是pandas处理处理数值之外(基于numpy),还能够帮助我们处理其他类型的数据

pandas常用的数据类型

1.Series一维, 带标签(索引)数组

2. DataFrame二维, Series容器

pandas的Series学习

创建一个Series数组

import pandas as pd

import numpy as np

# 创建长度为10的Series数组

t = pd.Series(np.arange(10))

pandas的Series数组的使用方法

这样就可以创建一个简单的Series数组了,数组的左边是它的索引,右边是它的值

,因此它有index和values方法

pandas的Series数组的使用方法

更改Series数组的索引值

其中index=list(string.ascii_uppercase[:10])表示的是取前10位大写字母来代替索引

在这里插入代码片

注意: pd.Series能够干什么,能够传入什么类型的数据让其变为series结构,index是什么?

在什么位置,对于我们常见的数据库或者ndarray来说,index是什么,如何给一组数据指定index?

在pd.Series()中的参数可以传入一个字典,也能传入一个列表,元组等

重新给其指定其他的索引之后,如果能够对应上,就取其值,如果不能,就为nan, 此时数据的类型就为float类型了,因为numpy中的nan为float类型,pandas会自动根据数据类型更改Series的dtype类型,若要修改此类型,使用.astype即可修改

pandas之Series切片和索引

t = pd.Series(np.arange(10), index=list(string.ascii_uppercase[:10]))

t[2:10:2] # 从第三个开始以步长为2,到第10个为止

t[[2, 3, 6]] # 选择第三个, 第四个, 和第七个的值

t["F"] # 选择索引为F的值

结果如下:

切片:在"[]"中直接传入start end 或者步长即可

索引:一个的时候传入序号或者index,多个的时候传入序号或者index的列表

pandas之Series的索引和值

对于一个陌生的series类型,我们如何知道它的索引和具体的值呢:

t.index ==> 返回数组的索引,是一个列表类型,可以进行遍历,也可进行强制类型转换,如: tuple(t.index) # 进行强制类型转换

t.values ==> 返回数组的值,是一个列表类型,可以进行遍历,也可进行强制类型转换,如: tuple(t.values)

Series对象本质上由两个数组构成。

一个数组构成对象的键(index,索引),一个数组构成对象的值(values),键 -> 值

ndarray的很多方法都可以运用于series类型,比如argmax,clip

series具有where方法,但是结果和ndarray不同,具体方法可以查看官方文档np.Series.where使用教程

pandas读取mongodb数据

这里由于我的mongodb里面没有数据,所以我就手动添加了一些数据(0.0)

from pymongo import MongoClient

import pandas as pd

client = MongoClient()

collection = client["xin"]["test"]

data = list(collection.find())

a = ["hello", "world"]

data.append(a)

t1 = data[0]

t1 = pd.Series(t1)

print(t1)

结果如下

pandas的Series数组的使用方法

pandas读取外部文件

pandas提供了很多读取数据的方法,比如:

pandas的Series数组的使用方法

这里我以csv文件举例

import pandas as pd

# pandas 读取文件

t = pd.read_csv("./demo.csv")

print(t)

csv文件结果如下

pandas的Series数组的使用方法

我们这组的数据存在csv文件中,我们直接使用pd.read_csv即可

和我们想象中的有些差别,我们以为他会是一个Series类型,但实际上它是一个DataFrame数组类型。

关于pandas的Series数组的使用方法就分享到这里了,希望以上内容可以对大家有一定的帮助,可以学到更多知识。如果觉得文章不错,可以把它分享出去让更多的人看到。

另外有需要云服务器可以了解下创新互联cdcxhl.cn,海内外云服务器15元起步,三天无理由+7*72小时售后在线,公司持有idc许可证,提供“云服务器、裸金属服务器、高防服务器、香港服务器、美国服务器、虚拟主机、免备案服务器”等云主机租用服务以及企业上云的综合解决方案,具有“安全稳定、简单易用、服务可用性高、性价比高”等特点与优势,专为企业上云打造定制,能够满足用户丰富、多元化的应用场景需求。

当前名称:pandas的Series数组的使用方法-创新互联
网页URL:https://www.cdcxhl.com/article44/dddihe.html

成都网站建设公司_创新互联,为您提供定制开发服务器托管定制网站品牌网站建设手机网站建设品牌网站设计

广告

声明:本网站发布的内容(图片、视频和文字)以用户投稿、用户转载内容为主,如果涉及侵权请尽快告知,我们将会在第一时间删除。文章观点不代表本网站立场,如需处理请联系客服。电话:028-86922220;邮箱:631063699@qq.com。内容未经允许不得转载,或转载时需注明来源: 创新互联

搜索引擎优化