当前位置: 首页 > news >正文

Python Day40 学习(复习学习日志Day5-7)

重新对信贷数据集进行了填补空缺值的操作

自己写的时候,还是出现了问题:

首先是忘记了要定义一下data, 通过data =pd.read_csv('data.csv')可以将读取到的数据保存到变量data中,方便后续进行数据分析。

其次,是漏掉了

c = data.columns.tolist()

这行代码的作用是:把DataFrame的所有列名提取出来,转换成一个列表,赋值给变量c。

  • data.columns 得到的是一个包含所有列名的Index对象。
  • .tolist() 方法把这个Index对象转换成普通的Python列表。
  • 这样,c 就是一个包含所有列名的列表,比如:['A', 'B', 'C', ...]

这样做的好处是,后面可以用for i in c:来遍历每一列,方便批量处理每一列的数据。

复习日志Day5,Day6,Day7的内容

补充:关于括号中逗号的使用

在 pd.get_dummies(data, columns=['Home Ownership']) 这样的函数调用中,括号里的逗号是用来分隔不同的参数的。

详细解释

  • 在 Python 的函数调用中,括号里可以传递多个参数,每个参数之间用逗号 , 分隔。
  • 比如:函数名(参数1, 参数2, 参数3, ...)
  • 在 pd.get_dummies 这个函数里:
    • 第一个参数 data 是要处理的数据(DataFrame)。
    • 第二个参数 columns=['Home Ownership'] 是一个关键字参数,指定要进行独热编码的列。
  • 如果你还要加其他参数,比如 drop_first=True,也要用逗号分隔。

勘误:须先填补缺失值再进行独热编码

补充:关于drop_first = True

手写笔记复习

今日复习到这里,明日继续,加油!@浙大疏锦行​​​​​​​

http://www.lqws.cn/news/82999.html

相关文章:

  • 《QDebug 2025年5月》
  • 简单工厂模式
  • [蓝桥杯]交换次数
  • 强化学习-深度学习和强化学习领域
  • NLP学习路线图(十八):Word2Vec (CBOW Skip-gram)
  • 移动AI神器GPT Mobile:多模型自由切换
  • 三种经典算法优化无线传感器网络(WSN)覆盖(SSA-WSN、PSO-WSN、GWO-WSN),MATLAB代码实现
  • 【HW系列】—安全设备介绍(开源蜜罐的安装以及使用指南)
  • 【Linux系列】Gunicorn 进程架构解析:主进程与工作进程
  • CTF:网络安全的实战演练场
  • 调整数据集的方法
  • Playwright Python API 测试:从入门到实践
  • IBM 与嘉士伯(Carlsberg)携手推进 SAP S/4HANA 数字化转型,打造啤酒行业新范式
  • 【机器学习】支持向量机(SVM)
  • Spring Cloud 2025 正式发布啦
  • 数据库管理-第332期 大数据已死,那什么当立?(20250602)
  • c++继承
  • 使用pdm+uv替换poetry
  • 任务26:绘制1-12月各省份平均气温和预测可视化图形(折线
  • Java生态中的NLP框架
  • MySQL 全量 增量备份与恢复
  • CNN卷积网络:让计算机拥有“火眼金睛“(superior哥AI系列第4期)
  • 第2篇:数据库连接池原理与自定义连接池开发实践
  • 服务器间文件传输
  • DAY41 CNN
  • 头指针 VS 头节点 VS 首元节点
  • 需求调研文档——日志文件error监控报警脚本
  • Day43
  • 高效微调方法简述
  • android binder(1)基本原理