import pandas as pd
# 创建一个简单的 DataFrame
data = {
'姓名': ['张三', '李四', '王五'],
'年龄': [28, 34, 22],
'城市': ['北京', '上海', '广州']
}
df = pd.DataFrame(data)
# 显示 DataFrame 的前几行
print("显示 DataFrame 的前几行:")
print(df.head())
# 获取基本信息
print("\n获取 DataFrame 的基本信息:")
print(df.info())
# 统计描述
print("\n统计描述:")
print(df.describe())
# 筛选数据
filtered_df = df[df['年龄'] > 25]
print("\n筛选年龄大于25岁的数据:")
print(filtered_df)
# 添加新列
df['职业'] = ['工程师', '设计师', '教师']
print("\n添加新列后的 DataFrame:")
print(df)
# 按列分组并计算平均值
grouped = df.groupby('城市')['年龄'].mean()
print("\n按城市分组并计算平均年龄:")
print(grouped)
# 排序
sorted_df = df.sort_values(by='年龄', ascending=False)
print("\n按年龄降序排列的 DataFrame:")
print(sorted_df)
创建 DataFrame:
pd.DataFrame() 方法将字典转换为 DataFrame。显示 DataFrame 的前几行:
df.head() 可以查看 DataFrame 的前几行,默认显示前 5 行。获取基本信息:
df.info() 提供 DataFrame 的基本信息,包括每列的数据类型和非空值的数量。统计描述:
df.describe() 提供数值列的基本统计信息,如均值、标准差、最小值、最大值等。筛选数据:
df[df['年龄'] > 25] 筛选出年龄大于 25 岁的行。添加新列:
df['职业']。按列分组并计算平均值:
groupby() 方法按某一列分组,并对另一列进行聚合操作,如计算平均值。排序:
sort_values() 方法按某一列进行排序,ascending=False 表示降序排列。下一篇:python 打印时间
Laravel PHP 深圳智简公司。版权所有©2023-2043 LaravelPHP 粤ICP备2021048745号-3
Laravel 中文站