七大統(tǒng)計模型詳解
四、判別分析
本文引用地址:http://m.ptau.cn/article/201812/395418.htm1、概述
判別分析是基于已知類別的訓練樣本,對未知類別的樣本判別的一種統(tǒng)計方法,也是一種有監(jiān)督的學習方法,是分類的一個子方法!

具體是:在研究已經過分類的樣本基礎上,根據(jù)某些判別分析方法建立判別式,然后對未知分類的樣本進行分類!
2、判別方法
根據(jù)判別分析方法的不同,可分為下面幾類:
(1) 距離判別法
(2) Fisher判別法
(3) Bayes判別法
(4) 逐步判別法
比較常用的是Bayes判別法和逐步判別法
3、 注意事項:
判別分析主要針對的是有監(jiān)督學習的分類問題。這里重點注意其優(yōu)缺點:
(1) 距離判別方法簡單容易理解,但是它將總體等概率看待,沒有差異性;
(2) Bayes判別法有效地解決了距離判別法的不足,即:其考慮了先驗概率——所以通常這種方法在實際中應用比較多!
(3) 判別分析要求給定的樣本數(shù)據(jù)必須有明顯的差異,在進行判別分析之前,應首先檢驗各類均值是不是有差異,如果檢驗后某兩個總體的差異不明顯,應將這兩個總體合為一個總體,再由剩下的互不相同的總體重現(xiàn)建立判別分析模型。
(4)Fisher判別法和bayes判別法的使用要求:兩者對總體的數(shù)據(jù)的分布要求不同,F(xiàn)isher要求對數(shù)據(jù)分布沒有特殊要求,而bayes則要求數(shù)據(jù)分布是多元正態(tài)分布,但實際中卻沒有這么嚴格!
五、主成分分析
1、概述
主成分分析是一種降維數(shù)的數(shù)學方法,具體就是,通過降維技術將多個變量化為少數(shù)幾個主成分的統(tǒng)計分析方法。
在建模中,主要用于降維,系統(tǒng)評估,回歸分析,加權分析等等。
2、分類(無)
3、注意事項
在應用主成分分析時候,應該注意:
(1) 綜合指標彼此獨立或者不相互干涉
(2) 每個綜合指標所反映的各個樣本的總信息量等于對應特征向量的特征值。通常要選取的綜合指標的特征值貢獻率之和應為80%以上
(3) 其在應用上側重于信息貢獻影響力的綜合評價
(4) 當主成分因子負荷的符號有正也有負的時候,綜合評價的函數(shù)意義就不明確!
六、因子分析
1、概述
因子分析是將變量總和為數(shù)量較少的幾個因子,是降維的一種數(shù)學技術!
它和主成分分析的最大區(qū)別是:其是一種探索性分析方法,即:通過用最少個數(shù)的幾個不可觀察的變量來說明出現(xiàn)在可觀察變量中的相關模型,它提供了一種有效的利用數(shù)學模型來解釋事物之間的關系,體現(xiàn)出數(shù)據(jù)挖掘的一點精神!
2、分類
R型因子分析,即對變量的研究,此為常用
Q型因子分析,即對樣本的研究
3、因子分析和主成分分析的區(qū)別和聯(lián)系
(1) 兩者都是降維數(shù)學技術,前者是后者的推廣和發(fā)展
(2) 主成分分析只是一般的變量替換,其始終是基于原始變量研究數(shù)據(jù)的模型規(guī)律;而因子分析則是通過挖掘出新的少數(shù)變量,來研究的一種方法,有點像數(shù)據(jù)挖掘中的未知關聯(lián)關則發(fā)現(xiàn)!
七、時間序列
1、概述
時間序列預測法是一種定量分析方法,它是在時間序列變量分析的基礎上,運用一定的數(shù)學方法建立預測模型,使時間趨勢向外延伸,從而預測未來市場的發(fā)展變化趨勢,確定變量預測值。
基本特點是:假定事物的過去趨勢會延伸到未來;預測所依據(jù)的數(shù)據(jù)具有不規(guī)則性;撇開市場發(fā)展之間的因果關系。

2、分類
時間序列的變動形態(tài)一般分為四種:
長期趨勢變動
季節(jié)變動
循環(huán)變動
不規(guī)則變動
方法分類:
(1) 平均數(shù)預測
(2) 移動平均數(shù)預測
(3) 指數(shù)平滑法預測
(4) 趨勢法預測
(5) 季節(jié)變動法
評論