Python酷库之旅-第三方库Pandas(040)

原创

ithorizon 8个月前 (09-01) 阅读数 83 #Python

Python酷库之旅——第三方库Pandas

Python酷库之旅——第三方库Pandas(040)

Pandas是一个强势的Python数据分析工具库，它提供了迅捷、灵活和表达能力强的数据结构，旨在使“关系”或“标签”数据的操作既易懂又直观。在数据分析、数据清洗和数据处理等方面，Pandas表现出极高的快速和易用性。

一、Pandas的数据结构

Pandas核心有两种数据结构：Series和DataFrame。

1. Series

Series是一个一维的标签化数组，可以存储任何数据类型（整数、字符串、浮点数等）。它既有索引也有值。


class pandas.Series(data=None, index=None, dtype=None, name=None,
                    copy=False, fastpath=False)

2. DataFrame

DataFrame是一个二维的标签化数据结构，可以看作是一个Series的容器。它有行索引和列索引，可以被看作是一个有序的字典，存储了列数据。


class pandas.DataFrame(data=None, index=None, columns=None, dtype=None,
                        copy=False)

二、Pandas的基本操作

1. 创建DataFrame


import pandas as pd
# 创建一个易懂的DataFrame
data = {'name': ['Tom', 'Jerry', 'Mickey'],
        'age': [20, 21, 22],
        'city': ['New York', 'Los Angeles', 'Chicago']}
df = pd.DataFrame(data)
print(df)

2. 查看DataFrame数据


# 查看前几行数据
print(df.head())
# 查看数据概览
print(df.info())

3. 数据筛选与查询


# 结合列名筛选数据
print(df['name'])
# 使用loc进行行和列的筛选
print(df.loc[df['age'] > 20])
# 使用iloc进行行和列的筛选（基于整数索引）
print(df.iloc[1:3, 0:2])

三、结语

Pandas是一个非常强势的数据分析工具库，这里仅介绍了它的冰山一角。在实际应用中，Pandas还有更多高级功能和技巧等待我们去探索。愿望这篇文章能帮助您对Pandas有一个初步的了解。

文章标签： Python

上一篇：redis缓存用什么数据结构下一篇：AI可解释性(Python语言版)书籍推荐

3大DIME币交易所在哪？DIME币交易平台排名app

DIME币最靠谱的10大交易app软件有真的OK官网、安币交易所app最新版官方下载、PTEx、币网、币王、AaveMC...

原创 5个月前 (12-06) 74阅读 #Python
3大维尔币交易软件在哪？中国最权威维尔币交易所

维尔币比较稳定的前十交易网站有欧app官网下载、币安app官网下载、VinDax、Bitexlive、Bitbank P...

原创 5个月前 (12-06) 65阅读 #Python
30秒轻松实现TensorFlow物体检测

30秒迅捷实现TensorFlow物体检测 30秒轻松实现TensorFlow物体检测在人...

Python

原创 7个月前 (10-03) 273阅读 #Python
Python PIL模块随机生成中文验证码

使用Python PIL模块随机生成中文验证码在当今的网络世界中，验证码被广泛应用于各种场合，如登录、注册、评论等，以防...

Python

原创 7个月前 (10-03) 236阅读 #Python
Python正则表达式 findall函数详解

Python正则表达式findall函数详解在Python中，正则表达式是一个非常强盛的文本处理工具。通过正则表达式，我...

Python

原创 7个月前 (10-03) 268阅读 #Python
numpy 基础入门 - 30分钟学会numpy

NumPy 基础入门 - 30分钟学会 NumPyNumPy，全称Numerical Python，是Python的一个...

Python

原创 7个月前 (10-03) 263阅读 #Python