当我们采集了大量的检测数据到业务系统,除了可以做SPC分析,其实还可以做很多事情的。今天就介绍一个强大的相关和回归分析功能。
生产线上有一个搅拌罐,每分钟采集罐子的温度、转速、压强,生产线末端也是每分钟采集产出品的透明度(假如越大越好)和浓度(假如越大越好)。除了我们可以对这五个检测项目做SPC分析外,我们还想知道罐子的温度、转速、压强对透明度和浓度有什么样的影响。
上面的业务场景的数据,我们可以下载到本地,用excel或者minitab一个一个做分析,包括滞后分析,但这样的工作量是很多的,并且这只是一个业务场景。
需要手动下载可能相关的数据
需要手动做相关和回归分析
一般会考虑滞后,这样相关和回归的整理数据过程就更繁琐了
业务场景很多的时候,就没有动力去做了
就无法发现隐藏的关系来改善生产过程
这些检测数据都已经采集到了SPC系统,我们直接选择罐子的温度、转速、压强和产出品的透明度和浓度,就可以批量做相关和回归了。你也可以选择其他的可能相关的检测项目来做。
因为经过罐子后,需要2分钟产品才到达浓度和透明度的检测,所以我们选择0~2的滞后期数
系统会从选择的5个检测项目中抽取2个(共有10种)两两进行相关和回归分析,滞后期0~3共3期,10*3=30个相关和回归分析。
这个热力图是对角线对称的,我们只需要看一边。
浓度、透明度和温度、转速、压强的相关系数,我们看到两个0.8的相关系数,就是温度t-2~透明度t,转速t-2~透明度t
另外我们还发现温度t~转速t,温度t-1~转速t-1,温度t-2~转速t-2的相关系数是1
温度和转速对透明度有很明显的影响
温度和转速是强相关的,他们是非独立变量,这里看出来温度是通过调整转速来实现的。
我们可以通过调整转速来实现提高透明度
越高的转速,我们得到透明度越高,前提是我们的生产工艺、设备允许。
调高转速,会有其他影响吗?
我们看各个滞后期对浓度的影响,如上图,相关系数很小。很明显,我们调整转速、温度,并不会改变浓度。所有我们可以放心的调整转速来实现温度的调整从而得到更好的透明度。
我们现在确定了【转速t-2~透明度t】的相关系数很大,接下来我们看看这两个变量的回归分析,在这个界面下拉找到
可以看出来,我们只要每提高转速1,透明度就会提高0.96,这样就可以指导我们如何提高生产质量了。
我们确定了这个相关性,并没有对浓度有影响,但我们可以进一步分析,增加滞后期数,看看滞后3期、滞后4期或者更多,确认温度、转速没有对更后续的浓度产品不良的影响。
另外,我们可以增加更多的检测项目,来确认我们调整转速、温度有没有对其他的检测项目会产生影响。
这个相关和回归分析,本身就不是一个非常复杂的分析,但我们结合系统数据,可以批量去分析,这个才是这个案例的强大之处。