数据分析实战 | 探寻销售额降低的缘由

2022年05月11日 阅读数:9
这篇文章主要向大家介绍数据分析实战 | 探寻销售额降低的缘由,主要内容包括基础应用、实用技巧、原理机制等方面,希望对大家有所帮助。

你们好,我是丁小杰。

本文案例的来源为《数据分析实战》一书,书中使用的是 R 语言,接下来一段时间,我会用 Python + Tableau 尽量的将案例复现出来,以供你们学习。python

场景描述

某公司经营的一款 APP 小游戏,每个月销售额稳定上涨,可是在 7 月却忽然降低,不管从市场环境或是游戏自己的环境来看,这个游戏的销售额都还有继续增加的空间
,影响该游戏销售额的主要影响因素可能有两点:web

  • 游戏活动上新
  • 商业宣传力度更改

经了解发现app

  • 游戏活动与上月活动并没有较大改变
  • 因为预算紧缺,宣传力度有所降低

接下来咱们会根据数据分析来证明上述结论,并提出恢复销售额的方法。svg

数据描述

DAU(Daily Active User)

天天至少来访 1 次的用户数据,139112 行。学习

字段 类型 含义
log_date str 访问时间
app_name str 应用名
user_id numpy.int64 用户 ID
DPU(Daily Payment User)

天天至少消费 1 日元的用户数据(0.056 元),884 行。ui

字段 类型 含义
log_date str 访问时间
app_name str 应用名
user_id numpy.int64 用户 ID
payment numpy.int64 消费金额
Install

记录每一个用户首次登陆游戏的时间,29329 行。spa

字段 类型 含义
install_date str 首次登陆时间
app_name str 应用名
user_id numpy.int64 用户 ID

数据分析

数据读取

读取三个数据集。3d

import pandas as pd

DAU_data = pd.read_csv('DAU.csv')
DPU_data = pd.read_csv('DPU.csv')
install_data = pd.read_csv('install.csv')

显示 DAU 数据集前五行。code

DAU_data.head()

显示 DPU 数据集前五行。xml

DPU_data.head()

显示 Install 数据集前五行。

install_data.head()

数据合并

将每日活跃用户数据 DAU 与用户首次登陆数据 Install 进行合并,将 user_id
app_name 做为参照 key。这样就能够获得用户的首次登陆时间。

all_data = pd.merge(DAU_data,
                    install_data,
                    on=['user_id', 'app_name'])
all_data.head()

获得用户首次登陆时间后,再与每日消费用户数据 DPU 进行合并,使用左链接的方式,保留 all_data 中的全部数据,缺失值默认为 NaN

all_data = pd.merge(all_data,
                    DPU_data,
                    on=['log_date', 'app_name', 'user_id'],
                    how='left')
all_data.head()

数据处理

payment 列中的空值填充为 0。

all_data['payment'] = all_data['payment'].fillna('0')
all_data

payment 列的单位转换为元,log_dateinstall_date 都只保留月份便可。

all_data['payment'] = all_data['payment'].astype(float)
all_data['payment'] = all_data['payment'] * 0.056
all_data['log_date'] = pd.to_datetime(all_data['log_date']).map(lambda x : x.strftime("%m")[1] + '月')
all_data['install_date'] = pd.to_datetime(all_data['install_date']).map(lambda x : x.strftime("%m")[1] + '月')
all_data.head()

新老用户划分

登陆月份 > 首次登陆月份 的用户定义为老用户,其余则定义为新用户。

all_data['user'] = all_data['log_date'] > all_data['install_date']
all_data['user'] = all_data['user'].map({
   
   False: '新用户', True: '老用户'})
all_data.head()

按照 log_date, user 分组对 payment 求和,统计各月新老用户的带来的销售额。

user_category = all_data.groupby(['log_date', 'user'])['payment'].sum().reset_index()
user_category.head()


能够看到 6 月和 7 月的老用户带来的销售额基本相同,但 7 月新用户带来的销售额明显少于 6 月。

将销售额划分区域,看看哪一个层次的用户消费在减小。

import numpy as np

sale_df = all_data.loc[all_data['payment'] > 0, ['log_date', 'payment']].copy()
bins = list(range(0, 101, 30)) + [np.inf]
labels = [str(n) + '-' + str(n + 30) for n in bins[:-2]] + ['>90']
sale_df['payment_cut'] = sale_df['payment'].apply(lambda x : pd.cut([x], bins=bins, labels=labels)[0])
sale_df.head()


根据上面柱状图能够看出,和 6 月相比,7 月消费额在 60 元如下的用户数量减小了一部分。

到此咱们就能够获得一些结论。

结论

新用户中的产生消费的用户发生了减小,特别是消费金额较少的小额消费用户。所以,公司须要再次开展商业宣传活动并恢复到以前的水平,这样才有可能提高潜在用户对公司产品的认知度,增长新的用户。

案例参考

[1]《数据分析实战》 [日] 酒卷隆志 里洋平/著 肖峰/译


对于刚入门 Python 或是想要入门 Python 的小伙伴,能够经过下方小卡片联系做者,一块儿交流学习,都是重新手走过来的,有时候一个简单的问题卡好久,但可能别人的一点拨就会恍然大悟,由衷的但愿你们可以共同进步。另有整理的近千套简历模板,几百册电子书等你来领取哦!

👇🏻 关注小卡片,回复“交流群”,一块儿学习Python👇🏻