当前位置: 首页 > news >正文

Python 数据分析与可视化 Day 1 - Pandas 数据分析基础入门

🎯 今日目标

  • 理解 Pandas 的作用和核心概念
  • 学会创建 Series 和 DataFrame
  • 掌握基本数据读取(CSV)与常用查看方法

🧰 1. 什么是 Pandas?

Pandas 是基于 NumPy 的强大数据分析库,提供了灵活的表格数据结构 DataFrame,让你可以像操作 Excel 或数据库一样处理数据。


🧱 2. 核心数据结构

🧩 Series(带标签的一维数组)

import pandas as pds = pd.Series([90, 85, 78], index=["张三", "李四", "王五"])
print(s)

输出:

张三    90
李四    85
王五    78
dtype: int64

🧩 DataFrame(二维表格)

data = {"姓名": ["张三", "李四", "王五"],"成绩": [90, 85, 78],"是否及格": [True, True, False]
}df = pd.DataFrame(data)
print(df)

输出:

   姓名  成绩  是否及格
0  张三   90   True
1  李四   85   True
2  王五   78  False

📖 3. 数据导入(CSV 文件)

df = pd.read_csv("students.csv", encoding="utf-8")
print(df.head())   # 查看前几行
print(df.info())   # 概况
print(df.describe())  # 描述性统计(数值字段)

🔧 4. 常用基本操作

print(df["成绩"])               # 访问某列
print(df.iloc[0])               # 按行索引访问
print(df[df["成绩"] >= 80])    # 筛选数据
print(df.sort_values("成绩", ascending=False))  # 排序

🧪 今日练习任务

  1. 创建一个 DataFrame,包含 5 名学生的姓名、性别、成绩、是否及格字段

    data = {"姓名": ["张三", "李四", "王五", "赵六", "钱七"],"成绩": [90, 85, 78, 88, 92],"是否及格": [True, True, False, True, True],"性别": ["男", "女", "男", "女", "男"]
    }df = pd.DataFrame(data)
    print(df)
    

    输出:

       姓名  成绩   是否及格 性别
    0  张三  90   True1  李四  85   True2  王五  78  False3  赵六  88   True4  钱七  92   True
  2. 筛选出所有不及格学生并打印

    failing_students = df[df["是否及格"] == False]
    print("不及格学生:")
    print(failing_students)
    

    输出:

    不及格学生:姓名  成绩   是否及格 性别
    2  王五  78  False
  3. 计算成绩的平均分、最大分、最小分

    average_score = df["成绩"].mean()
    max_score = df["成绩"].max()
    min_score = df["成绩"].min()
    

    输出:

    平均分: 86.6, 最大分: 92, 最小分: 78
    
  4. 将该 DataFrame 保存为 students.csv 文件(使用 to_csv

    df.to_csv("students.csv", index=False, encoding='utf-8-sig')
    print("DataFrame 已保存为 students.csv 文件")
    

    输出:

    DataFrame 已保存为 students.csv 文件
    

    在这里插入图片描述


✅ 示例:保存为 CSV 文件

df.to_csv("students.csv", index=False, encoding="utf-8")

✍️ 今日总结

  • 掌握了 Pandas 的核心结构:Series 与 DataFrame
  • 学会了基本的数据读取、创建和查看方法
  • 初步能用 Pandas 做简单的数据筛选、排序和保存

题外话

在这里插入图片描述

http://www.lqws.cn/news/447139.html

相关文章:

  • Stable Diffusion 实战-手机壁纸制作 第二篇:优化那些“崩脸”和“马赛克”问题,让图像更加完美!
  • Tensorflow推理时遇见PTX错误,安装CUDA及CuDNN, 解决问题!
  • 职坐标IT培训:嵌入式AI物联网开源项目精选
  • AIGC - Prompt Optimizer 提示词优化器
  • stm32之使用中断控制led灯
  • MFC中使用CRichEditCtrl控件让文本框中的内容部分加粗
  • 李宏毅《生成式人工智能导论》 | 第3讲-第5讲:训练不了模型可以训练自己 含作业3、让AI村民组成虚拟村庄会发生什么
  • EchoEar(喵伴):乐鑫发布与火山引擎扣子联名 AI 智能体开发板
  • 高保真组件库:全选
  • Matplotlib 绘图库使用技巧介绍
  • 如何实现一个64 bit ID Unique Generator
  • Laravel框架的发展前景与Composer的核心作用-优雅草卓伊凡
  • 大数据复习HDFS
  • 苍穹外卖-2025 完成基础配置环节(详细图解)
  • 端口安全配置示例
  • golang excel导出时需要显示刷新
  • go客户端ssh交换机
  • Mysql5.7 自动备份恢复示例
  • 渗透实战:绕过沙箱机制的反射型XSS
  • ROS学习之动作通信
  • 苍穹外卖--WebSocket、来单提醒、客户催单
  • 图像特征检测算法ORB
  • ros中相机话题在web页面上的显示,尝试js解析sensor_msgs/Image数据
  • 动态规划:01 背包(闫氏DP分析法)
  • Linux系统远程操作和程序编译
  • JS红宝书笔记 - 8.1 理解对象
  • 零基础指南:利用Cpolar内网穿透实现Synology Drive多端笔记同步
  • PHP 生成当月日期
  • 解决 Docker 里 DrissionPage 无法连接浏览器的问题,内含直接可用的Docker镜像(DrissionPage 浏览器链接失败 怎么办?)
  • 23种设计模式--简单工厂模式理解版