当前位置: 首页 > news >正文

python pyecharts 数据分析及可视化

一、任务要求:

任务一:药品消费趋势分析
【任务说明】
现有某医疗机构 10 年的药品销售数据,请根据任务要求完成数
据分析。
【任务要求】
读取所需数据集后对数据进行必要的清洗,分析中成药和西药在
这 10 年中销售占比以及销售额的变化情况,绘制出堆叠面积图并用
Django 框架渲染到前端页面,绘图要求如下:
1.使用 PyEcharts 库绘制堆叠面积图;
2.使用 Django 框架在前端页面中渲染展示堆叠面积图;

二、代码部分:

import pandas as pd
import pyecharts.options as opts
from pyecharts.charts import Line# 读取数据
data_mpv_sale = pd.read_excel(r'./MPV销量数据2012-2021(1).xlsx')# 去重和排序
data_mpv_sale2 = data_mpv_sale.drop_duplicates(subset=['采集时间', '排名'], keep='last')
data_mpv_sale2 = data_mpv_sale2.sort_values(by=['采集时间', '排名'])
print(f"")
print(f"data_mpv_sale2:\n{data_mpv_sale2}")# 转换采集时间为日期格式,便于比较
data_mpv_sale2['采集时间'] = pd.to_datetime(data_mpv_sale2['采集时间'], format='%Y%m')# # 过滤2017年之后的数据
# data_mpv_sale3 = data_mpv_sale2[data_mpv_sale2['采集时间'] > '2017-01-01']
data_mpv_sale3 = data_mpv_sale2# 新增车型_厂商列
data_mpv_sale3['车型_厂商'] = data_mpv_sale3['车型'] + '_' + data_mpv_sale3['厂商']# 创建年份和月份列
data_mpv_sale3['年份'] = data_mpv_sale3['采集时间'].dt.year
data_mpv_sale3['月份'] = data_mpv_sale3['采集时间'].dt.month
print(f"data_mpv_sale3:\n{data_mpv_sale3}")# 定义季度函数
def jidu(month):
"""根据月份返回季度"""
if month <= 3:
return 1
elif month <= 6:
return 2
elif month <= 9:
return 3
else:
return 4# 应用季度函数
data_mpv_sale3['季度'] = data_mpv_sale3['月份'].apply(jidu)# 新增年份_季度列
data_mpv_sale3['年份_季度'] = data_mpv_sale3['年份'].astype(str) + '年' + data_mpv_sale3['季度'].astype(str) + '季度'# 汇总销量数据
sale_season = data_mpv_sale3.groupby(by=['车型_厂商', '年份_季度'])['销量'].sum()# 获取销量前20的车型
sale_total20 = data_mpv_sale3.groupby(by=['车型_厂商'])['销量'].sum().sort_values(ascending=False)[:20].index.valuesprint(f"sale_total20:\n{sale_total20}")# 定义时间列表
year = [2017, 2018, 2019, 2020, 2021]
season = [1, 2, 3, 4]
list_time = [f'{y}年{s}季度' for y in year for s in season if not (y == 2021 and s >= 3)]
print(f"list_time:\n{list_time}")# 创建字典存储销量
sale_dict = {}
for c in sale_total20:
sale_dict[c] = [int(sale_season.get((c, t), 0)) for t in list_time]
print(f"sale_dict:\n{sale_dict}")# 创建折线图
c = (
Line(init_opts=opts.InitOpts(width='800px', height='400px'))
.add_xaxis(xaxis_data=list_time)
.set_global_opts(
tooltip_opts=opts.TooltipOpts(trigger="axis", axis_pointer_type="cross"),
yaxis_opts=opts.AxisOpts(type_="value", axistick_opts=opts.AxisTickOpts(is_show=True),
splitline_opts=opts.SplitLineOpts(is_show=True)),
xaxis_opts=opts.AxisOpts(type_="category", boundary_gap=False),
datazoom_opts=opts.DataZoomOpts(),
)
)# 绘制销量曲线
for name, sale_list in sale_dict.items():
c.add_yaxis(
series_name=name,
stack="总量", # 堆积
y_axis=sale_list,
areastyle_opts=opts.AreaStyleOpts(opacity=0.5),
label_opts=opts.LabelOpts(is_show=False), # 隐藏数据标签
is_smooth=True, # 平滑曲线
)# 渲染图表
c.render_notebook() # 如果在Jupyter中运行
# 或者
c.render('mpv_sales_trend.html') # 保存为HTML文件

三、运行结果:

http://www.lqws.cn/news/532999.html

相关文章:

  • 创客匠人解析视频号公私域互通逻辑:知识变现的破圈与沉淀之道
  • [特殊字符]推客带货小程序解决方案——0门槛裂变营销,佣金赚不停!
  • 408考研逐题详解:2010年第7题——连通图的边
  • 代码随想录|图论|06岛屿数量(广搜BFS)
  • PhoneRescue 4.3绿色版!解决iPhone数据丢失、系统崩溃等场景
  • 单片机 - STM32F103“复用功能重映射”完整解析:从JTAG释放到TIM重映射实战详解
  • CTF:PHP 多关卡绕过挑战
  • 专注推理查询(ARQs):一种提升大型语言模型指令遵循度、决策准确性和防止幻觉的结构化方法
  • 【攻防篇】解决:阿里云docker 容器中自动启动xmrig挖矿
  • ISP Pipeline(5): Auto White Balance Gain Control (AWB) 自动白平衡
  • 数据结构大项目
  • react - ReactRouter—— 路由传参
  • 【STM32 学习笔记】PWR电源控制
  • Java 大视界 -- 基于 Java 的大数据可视化在智慧城市能源消耗动态监测与优化决策中的应用(324)
  • 【linux】全志Tina配置swupdate工具进行分区打包
  • 《PT100两线制温度测量系统设计:从电路原理到嵌入式实现》
  • 【嵌入式ARM汇编基础】-ELF文件格式内部结构详解(二)
  • 香港政府发表《香港数字资产发展政策宣言 2.0》,提出「LEAP」框架
  • 星型模式(Star Schema)
  • lua脚本为什么能保证原子性
  • 云效代码仓库导入自建gitlab中
  • Redis核心知识详解:从全局命令到高级数据结构
  • 首款SUV小米YU7、小米AI眼镜等新品重磅发布,玄戒O1超大规模量产
  • 湖北理元理律师事务所:科学债务优化如何守护民生底线
  • MySQL 总是差八个小时,如何破?
  • Linux中部署Jenkins保姆间教程
  • 爬虫005----Selenium框架
  • 9. 回文数
  • MySQL (二):范式设计
  • Linux服务器部署Leantime与cpolar构建低成本团队协作环境