pandas的使用方法

Pandas是Python中用于数据处理和分析的一个重要库,它提供了高性能、易用的数据结构和数据分析工具。下面是Pandas的一些常用功能和用法:

1. 导入Pandas库:

import pandas as pd

2. 创建Series和DataFrame:

# 创建Series
s = pd.Series([1, 2, 3, 4, 5])
print(s) # 输出:
# 0 1
# 1 2
# 2 3
# 3 4
# 4 5
# dtype: int64

# 创建DataFrame
data = {'Name': ['Tom', 'John', 'Emma'],
'Age': [25, 30, 28]}
df = pd.DataFrame(data)
print(df) # 输出:
# Name Age
# 0 Tom 25
# 1 John 30
# 2 Emma 28

3. 数据读取和写入:

# 从CSV文件读取数据
data = pd.read_csv('data.csv')

# 将DataFrame数据写入CSV文件
data.to_csv('data.csv', index=False)

4. 数据选择和筛选:

# 选择列
print(df['Name']) # 输出:
# 0 Tom
# 1 John
# 2 Emma
# Name: Name, dtype: object

# 选择行
print(df.iloc[0]) # 输出:
# Name Tom
# Age 25
# Name: 0, dtype: object

# 筛选行
print(df[df['Age'] > 25]) # 输出:
# Name Age
# 1 John 30
# 2 Emma 28

5. 数据处理:

# 添加新列
df['Salary'] = [5000, 6000, 5500]

# 删除列
df = df.drop('Age', axis=1)

# 数据排序
df = df.sort_values(by='Salary')

# 缺失值处理
df = df.fillna(0)

6. 数据分组和聚合:

# 数据分组
grouped = df.groupby('Name')

# 求和
print(grouped['Salary'].sum())

# 平均值
print(grouped['Age'].mean())

这只是Pandas库的一些基本用法,Pandas还有很多其他的功能和方法,如数据合并、数据透视、数据可视化等。

你可以参考Pandas的官方文档获取更多详细的使用指南:https://pandas.pydata.org/docs/

© 版权声明
THE END
喜欢就支持一下吧
点赞5赞赏 分享