多變量分析於商業上的應用

在現代,客戶(消費者)資訊對企業而言,越來越重要,再加上顧客導向的時代,產品資訊要與客戶資訊結合,行銷與研發資訊要結合,品保與生產資訊要結合,甚至企業經營與管理資訊要結合,在在考驗管理者的整合能力,然而在現在資訊爆炸的時代,什麼是有意義的資訊?資訊如何可以變成有用的知識?因此如何有效利用多變量分析工具,呈現多維模式數據的整合展現,多變量分析工具更顯其重要性!

大數據與AI都在各產業喊得震天價響,且不止於大企業,現在,基本上,中小企業也能玩入門款了。但是煞費苦心搞了Big Data工具之後,到底有沒有用?這到底是科學還是迷信?還是噱頭?有專家認為,大數據基本上是[科學算命],也可以是[啄木鳥](找出蛀蟲—企業問題背後的問題)的角色。若用於找出問題與脈動的方向或預測,這就可以是科學算命;若用於各部門/各時間/各產品數據模組的關聯性問題就可以是啄木鳥。

達85%的企業主管認為Big Data「有助於做出更周全的商業決策」,但只有23%主管認為這些Big Data計畫「到目前為止還算成功」,52%則認為「不怎麼成功」。原因是「計畫拖太久、東西太艱深(大部分員工無法了解)、如果不聘請專業顧問或資料科學家,便很難從中得出關鍵而有效的觀點….」。

所以你必須弄清楚大數據的意義不在於大成本的建構資料庫,在於你如何可以[萃取]現有的資訊(數據),也因此你應該建構自己的大數據平台,加上商業祕密的觀念,利用雲端收集資訊(數據),但利用終端進行分析萃取(許多說法是利用雲端龐大的能量進行分析萃取),是最適合中小企業的做法。

多變量的意義

大數據的真正意義在於必須將資訊變成知識,讓知識進入商業(價值鏈)模式中,而如何從數據中「萃取」出有用的資訊,多變量統計分析就是探索方向(萃取)的重要工具, 過去我們在看不同層面的數據時,必須一項一項分開來分析其結果,並進行有意義的統計,但多變量的概念,是將這些數據放在一個空間內同時來看,這也符合一個企業體真實的狀態,也許過去認為沒有相干的資訊,在多變量的體系下,會顯示出[隱形]的關聯性,而往往這正是先前找不出原因的問題的來源。

多變量的應用案例

先看行銷應用,通常我們在行銷部門會有人口統計變數(demographics)/社經背景型態等數據,會希望獲得比較自身產品與競爭產品的各方面產品力指標,或者希望探討人口統計變數及社經背景與其喜好程度間的關係,這些關聯就可用多變量分析來觀察。

例如執行案例中,共有不同種類的8種蕃茄,結合儀器數據、感官分析數據、消費者行為數據,透過PLS的多變量分析,可以結論出:1).相當的消費者喜歡番茄 A、O及C;2).蕃茄A、O及C基本上具有高甜度、顏色、風味、氣味及多汁性等特性;3).喜歡番茄A、O及C的消費者為年輕(18-39歲),自述喜歡像櫻桃式的番茄、不太去傳統市場、對缺乏甜味及鮮豔顏色的番茄不會滿意等消費行為。這樣的結論相信是每家業者夢寐以求希望可以獲得的重要資訊,對研發與行銷部門都有可遵循的方向。實務上,其實還可以納入採購部門、品保部門、業務部門的數據,就可以有更多的結論運用。

因此,舉凡行銷有關的產品/品牌/概念/服務之市場定位、消費行為/消費認知/行銷效益/廣告效果之影響因素分析、產品力/品牌力/通路力競爭分析比較、產品或服務之滿意度/接受度/喜好度/厭煩度調查、行銷研究/市場研究之實驗設計等等的需求,都可以透過多變量量分析找到想要的答案,甚至包括這些需求之間的關聯性,讓公司的行銷發展有藍海的策略。

再看研發應用,通常研發人員很想知道產品品質重要的變數、希望評估相對重要變數的主效應及交互作用、期待最適化產品及製程(準確描述反應曲面),往往收集數據後,卻也無法得到有效的結論。實際上,多變量分析就是您最好的選擇。

例如執行案例中,有12個果醬樣品,分別採用不同品種及季節的蔓越莓為原料,每一樣品都以12個品評變數量測(sensory measurements),以10個品評員,重複3次,到底哪一個感官特性是重要的(貢獻度大的)呢?經過多變量分析結果結論紅色度、顏色、蔓越苺氣味、蔓越莓風味等四項感官特性對喜好性的貢獻度最高。

因此,舉凡研發部門希望獲得的答案,包括新配方是否可歸類到模仿目標群內?自身樣品與競爭者樣品在同類別中嗎?自身樣品與競爭樣品到底有啥不一樣?可以用儀器數據預測感官分析數據嗎?配方/製程等變數組合何者是最適化?新指標可以取代原指標嗎?甚至品質/成本/指標之影響因素分析、各樣品/產品比較的田野調查等工作,多變量分析都可以達成願望,且利用多變量軟體,甚至可以幫你進行實驗設計。

再者於品管的應用,品管部門希望知道哪些製程變數對最終品質有影響?希望可以有好的指標進行快速分類/歸類/判定的工作,甚至可以快速預測終產品的品質結果,這些期望就可用多變量分析來執行。

例如執行案例中,已有36項蔬菜油樣品(玉米、葵花油 、橄欖油等),可否使用分光儀掃描(spectral scans)作為歸類指標?尚有40項未知樣品等待歸類。經多變量分析建立模式,確認分光儀掃描數據可進行初步歸類,該模式可以做為後續40項未知樣品歸類的預測工作。

因此在品管功能願望上,包括建立一個半成品預測模式能提供我們終產品品質訊息而不用破壞終產品、找出儲存條件對產品的影響關係、能以儀器預測品質指標、進行品質落點的預測、生產線預測性維護等工作,都可以透過多變量分析來達成。

最後在經營管理的應用方面,無論是人資、會計、採購等經營管理層面,其實都有可收集的資訊與數據,放在不同層面的指標,就可以進行問題的評估。

例如執行案例中,一家公司34個單位的員工填寫關於工作的任務、氣氛等問題的問卷,同時他們也給予一個工作滿意度的整體評分,可否進行分析得知哪些是良好工作的重要指標呢 ? 哪一個單位需要改善其工作環境呢 ?多變量分析的結果給出了答案,同時讓管理階層理解其優先順序。

因此,在經營管理層面,許多問題分析,甚至是內部顧客滿意度(部門間/功能間/上下游間)都能以此多變量分析工具進行關聯性/問題指標/優先順序等研究,強化經營管理的競爭力與解決問題的能力。

多變量的工具

各國科學家近年來不斷投入多變量分析(multivariate analysis)的發展與應用,各文獻的發表及商業統計軟體的開發如雨後春筍般冒出,令人眼花撩亂,傳統統計書籍中所介紹的多變量分析方法,也是大家比較熟悉的有應用於共變異(covariance)分析的主成份分析(principal component analysis, PCA)、多元尺度分析(multidimensional scaling, MDS)與因子分析(factor analysis, FA)等,而應用於分類及歸類的則有區隔分析(discriminant analysis, DA)與叢集分析(cluster analysis, CA),應用於多因子預測模式分析則有部份最小平方分析迴歸(partial least square, PLS)等。以PCA為例,其主要功能是將不同組之間的數據經過共變異量的計算後,歸納出某些組數據在新重組的向量上較接近,某些較疏遠,可以因此簡化關於標的或人員的資訊表達方式,通常可以應用於指標間的屬性,亦可應用於感官數據與儀器分析數據之間的屬性,是一個強而有力的工具;另以PLS為例,可區分為PLS1與PLS2兩種算程,兩者的差異在於PLS1是處理多個解釋變數及單一反應變數的情況,PLS2則是處理多個解釋變數及多個反應變數的情況,在結合儀器分析、分析性感官測試、喜好性感官測試及消費者行為調查等多態樣數據組時,可以利用PLS放在同一空間來探討其連結性及預測模式,讓技術部門(研發/生產/品保)與行銷部門(行銷/企劃/通路)可以共同探討企業產品的整體數據。

多變量分析的商業軟體包括Unscrambler、SAS及SPSS皆有此類功能的運算,目前專業多變量分析的則以Unscrambler為全球市場主流,使用的知名企業涵蓋各產業,食品相關知名企業包括Unilever, Gallo, Nestle, Kraft, P&G, Monsanto, Heineken, Frito Lay, Kikkoman, Tropicana, Carlsberg, Novartis等等,顯示其企業實用性。Uuscrambler的訴求在於如何把分散(碎裂)的訊息拼湊成原本的整體事實,透過其知覺式設計,簡單易學,不必是多變量分析的專家,也可以拿出一系列專業又好溝通的報告。與其他知名軟體如SAS及SPSS的比較下,專家對Uuscrambler的評語包括:

1).可以建立實驗設計系統、策略系統、預測系統,其中實驗設計部份,有內建程序可跟著做;不會發生數據不合現象,而其他兩者需自行進行實驗設計。
2).完全適用於少量樣本,而其他兩者在少樣本情況下不易有結果。
3).可支援多種格式。
4).可同時處理多筆資料,且多筆資料可交互分析。
5).具有強大的繪圖輸出功能,便於報告與解說。
6).包括PLS功能,而其他兩者需另加裝功能。
7).相對價格較低。

確實,目前全球以Unscrambler軟體佔多變量統計分析軟體市場很大的比重,算是主流之一。在探索出數據可能重要方向後,再由有經驗者解讀後,回到數據庫驗證,並建立預測模式,變成「萃取」出的有用資訊。尤其是Umscrambler已有豐富的感官分析、品管、市調與經營管理的應用經驗,建立很多參考模式。

THE UNSCRAMBLER 多變量分析 軟體銷售

多變量分析一日課程

多變量統計分析的應用-建模與預測