讲这种东西一定要互动,否则对方的思维跟不上你的节奏就让你的心血白费。所以,我总会配合我的肢体语言,再通过提问和初初互动。
“那是不是直接用这5年每个月的数据做一个折线图,观察折线图中是否存在某种趋势?”我提问道。
“是吧?”初初不大确定地回答。
“那如果你的产品,就像你们公司做服装,是不是存在很大的季节性变化规律?”我提示道。
我这么一说,初初立刻反应过来,点头称是。
“那如果你们公司某个季节突然为了配合中国的节日搞了一个促销活动,或者是为了庆祝你们公司成立10年、20年,搞一个强力的回馈活动,那当月数据是不是可能出现极端值?”我再次提示道。
初初略微思考下,再次点头。
我还是用实际的数据作图讲解更清楚点,所以我找到仪器公司的那些原始数据,直接做了一个折线图。因为其中含有60多个月份的数据,折线图被我故意拉的很长,这样有利于初初细看。
“喏,你看出什么规律了吗?”只见初初电脑上显示的折线图粗看一下并没有什么规律,折线上下波动,这5年时间里有几个大的极端值波动。
初初凑过来认真看,我此刻的心思并不在电脑屏幕上,而关心的是她第一次靠我如此之近。我已经能闻到她秀发的味道了,简直沁人心脾啊。但是,此刻我并任何非分之想,甚至身体僵硬住了,说不紧张那是假的。
“嘶~”初初长舒一口气,说:“没看出来,好像整体数据在上升。”
说着,她用手在屏幕上划了一条弧线。不过,这条她人为所拟合的弧线上下的数值间距十分大。要是用她画的这条弧线去做趋势方程式,那最后所预测的数据在实际运用过程中就会显得毫无价值。因为她的这条弧线并没有去除季节性规律以及极端值因素。
待初初坐好后,我说:“你要是这么做,还是没有去掉极端值和季节性变化的影响。”
说到这里,我停顿了下,以为她会问点什么。不成想,她一副“请君详解”的表情。
好吧,谁让我这么不矜持呢?
“所以,在做时间序列分析之前,我们应该首先要对数据进行整理。比如极端值,通常我们的处理手段是将出现极端值的月份的数据暂时剔除,然后将前后两个月的数据加总求平均作为这个极端值月份的模拟数据。这样,极端值不就被平滑掉了?”我笑着望着她。
初初惊讶道,“原来是这样啊?”
我点点头,继续道,“接下来是季节性影响因子了。”
我将销量的数据排成一列,又在销量的数据旁边新建了一个指标,取名叫“移动平均月份”。然后以第一年的第12月作为新指标序列的第一个月份数据,将第一年的12个月数据加总求平均。在检查完我输入的公式后,鼠标移到表格右下角,使得指标箭头变成“十”字型后往下拖动,拖出了一系列数据出来。
“你看,这列新的数据就是移动平均数值。它以年为单位,剔除了季节性变化。然后,我们再做一条折线图试试看。”说完,我作出了一条近似弧线的折线图出来。接着,我又在直接在excel里点击了趋势线这个选项,并在下拉选项中选择了r平方和公式选项,这个时候,这个新的折线图中又出现了一条弧线以及方程式。
“看到没?这条弧线就是我所建立的趋势线,而旁边的这个方程式就是我模拟出来的趋势预测方程式。你再看看这个r平方,统计学专业术语叫做‘相关系数’。一般只有当相关系数大于085时,我们才会认可这个趋势方程式。它代表这个趋势方程式可以85以上代表整个趋势线。”我解释道。
“而你在看,我做的这条趋势线的r平方是0998。那就说明这条趋势线几乎可以完美地预测接下来的月份数据了。只是,所预测的月份是移动平均值。所以,我们还要再反向算出单月的预测数据。”说完,我再次在excel文档上直接用函数和公式再次演算了我所做的真实预测值。
“你慢点,慢点,我跟不上。”初初一着急,赶紧拉住我的手,凑上前认真看。
哇,她竟然抓了我的手,今天这手就不洗了,哈哈哈。
此时,我再一次心襟荡漾,浮想联翩了。
要是有人此时从我身后看过来,一定会以为初初正趴在我身上在做着什么少儿不宜的动作呢。
“这个……这个……这里……这里……哦~原来是这样的啊?明白了,明白了。”初初歪着身子,右手拿着鼠标左点点、右点点,自言自语着。
“那这行就都是你的预测值了?”她指着我新增的第三列问道。
我赶紧在第三列最顶部输入“预测值”三个字。
“对的,你看,你对比下第一列原始数据和第三列的预测数据看看……呃,好吧,我再做个差异值出来。”于是,我再增加署名为“差异值”的第四列出来,输入“=c2-a2”的公式后,我再用鼠标往下拖拉出一列数据出来。
“发现没?我用模拟预测方程式计算出来的预测值和原始数据相减后的差异值是不是都不大?”我又列出了第五列署名“百分比”的数据,输入公式“=c2/a2”后用鼠标再次拖拉出一列数据,然后选中第五列点击选项卡中的“”符号,结果全部是百分比。
“喏,百分比是不是都是98-998之间?”我微