Pandas是Python中用于数据处理和分析的一个重要库,它提供了高性能、易用的数据结构和数据分析工具。下面是Pandas的一些常用功能和用法:
1. 导入Pandas库:
import pandas as pd
2. 创建Series和DataFrame:
# 创建Series
s = pd.Series([1, 2, 3, 4, 5])
print(s) # 输出:
# 0 1
# 1 2
# 2 3
# 3 4
# 4 5
# dtype: int64
# 创建DataFrame
data = {'Name': ['Tom', 'John', 'Emma'],
'Age': [25, 30, 28]}
df = pd.DataFrame(data)
print(df) # 输出:
# Name Age
# 0 Tom 25
# 1 John 30
# 2 Emma 28
3. 数据读取和写入:
# 从CSV文件读取数据
data = pd.read_csv('data.csv')
# 将DataFrame数据写入CSV文件
data.to_csv('data.csv', index=False)
4. 数据选择和筛选:
# 选择列
print(df['Name']) # 输出:
# 0 Tom
# 1 John
# 2 Emma
# Name: Name, dtype: object
# 选择行
print(df.iloc[0]) # 输出:
# Name Tom
# Age 25
# Name: 0, dtype: object
# 筛选行
print(df[df['Age'] > 25]) # 输出:
# Name Age
# 1 John 30
# 2 Emma 28
5. 数据处理:
# 添加新列
df['Salary'] = [5000, 6000, 5500]
# 删除列
df = df.drop('Age', axis=1)
# 数据排序
df = df.sort_values(by='Salary')
# 缺失值处理
df = df.fillna(0)
6. 数据分组和聚合:
# 数据分组
grouped = df.groupby('Name')
# 求和
print(grouped['Salary'].sum())
# 平均值
print(grouped['Age'].mean())
这只是Pandas库的一些基本用法,Pandas还有很多其他的功能和方法,如数据合并、数据透视、数据可视化等。
你可以参考Pandas的官方文档获取更多详细的使用指南:https://pandas.pydata.org/docs/
© 版权声明
本站资源来自互联网收集,仅供用于学习和交流,请勿用于商业用途。如有侵权、不妥之处,请联系站长并出示版权证明以便删除。敬请谅解!
THE END