pandas基本数据类型---series基本功能

本文研究学习pandas的series的基本功能,虽然series的重要性不比DataFrame,但在数据处理上并不意味着可以离开series, 下表是series的基本功能

编号 属性或方法 解释
1 axes 返回行轴标签列表
2 dtype 返回对象的数据类型
3 empty 如果系列为空,则返回True
4 ndim 返回底层数据的维数,默认定义:1
5 size 返回基础数据中的元素数
6 values 将系列作为ndarray返回
7 head() 返回前n行
8 tail() 返回最后n行

1. axes

from pandas import Series

lst = ['python', 'c++', 'c#', 'java']
ser = Series(lst, index=['a', 'b', 'c', 'd'])

print(ser.axes)

程序输出结果

[Index(['a', 'b', 'c', 'd'], dtype='object')]

2. dtype

from pandas import Series

lst = ['python', 'c++', 'c#', 'java']
ser = Series(lst, index=['a', 'b', 'c', 'd'])

print(ser.dtype)

score_dict = {
    'c++': 99,
    'python': 100,
    'c#': 98,
    'java': 97
}

ser = Series(score_dict)
print(ser.dtype)

程序输出结果

object
int64

在series中,如果元素存在字符串,dtype则是object

3. empty

如果series是空的,则empty属性为True

from pandas import Series

lst = []
ser = Series(lst)
print(ser.empty)

程序输出结果

True

4. ndim

返回底层数据的维度,series是1D的数据结构

from pandas import Series

lst = ['python', 'c++', 'c#', 'java']
ser = Series(lst, index=['a', 'b', 'c', 'd'])

print(ser.ndim)

程序输出结果是 1

5. size

size返回系列的大小

from pandas import Series

lst = ['python', 'c++', 'c#', 'java']
ser = Series(lst, index=['a', 'b', 'c', 'd'])

print(ser.size)

lst里只有4个元素,由此生成的series的size必然是4

6. values

将系列作为ndarray返回

from pandas import Series

lst = ['python', 'c++', 'c#', 'java']
ser = Series(lst, index=['a', 'b', 'c', 'd'])

print(ser.values)

score_dict = {
    'c++': 99,
    'python': 100,
    'c#': 98,
    'java': 97
}

ser = Series(score_dict)
print(ser.values, type(ser.values))

程序输出结果

['python' 'c++' 'c#' 'java']
[ 99 100  98  97] <class 'numpy.ndarray'>

values返回的数据类型是numpy.ndarray, 不是list,这一点务必要牢记

7. head

返回前n个数据,默认n=5, head是一种快速查看数据的方法,通过观察数据来了解当前数据的处理情况

from pandas import Series

lst = ['python', 'c++', 'c#', 'java']
ser = Series(lst, index=['a', 'b', 'c', 'd'])

print(ser.head(2))

程序输出结果

a    python
b       c++
dtype: object

8. tail

功能和head一样,只是返回的是后n个数据

from pandas import Series

lst = ['python', 'c++', 'c#', 'java']
ser = Series(lst, index=['a', 'b', 'c', 'd'])

print(ser.tail(2))

程序输出结果

c      c#
d    java
dtype: object

扫描关注, 与我技术互动

QQ交流群: 211426309

加入知识星球, 每天收获更多精彩内容

分享日常研究的python技术和遇到的问题及解决方案