第43章 Microsoft神經網絡算法(1 / 1)



在進行分類或預測挖掘之前,必須首先準備好挖掘數據。一般需要對數據進行預處理,以幫助提高分類或預測的準確性、效率和可擴展性。

預測準確率、計算速度、魯棒性、可擴展性和可理解性是對分類與預測方法進行評估的五個重要方麵。

ID3算法是基於決策樹歸納的貪心算法,算法利用信息論原理來幫助選擇構造決策樹時非葉結點所對應的測試屬性。樹枝修剪則是通過修剪決策樹中由於噪聲產生的分支從而改進決策樹的預測準確率。

貝葉斯分類是基於有關事後概率的定理而提出的,它就像是一個白匣子,各個結點之間的影響程度和條件概率關係都可以明顯地看到,並且意義明確。因此,貝葉斯網絡更適合那些影響因素少而且關係明確的情況。

神經網絡也是一種分類學習方法,它利用後傳算法來搜索神經網絡中的一組權重,以使相應網絡的輸出與實際數據類別之間的均方差最小。

【思考題】

1.數據分類分為哪兩個步驟?簡述每步的基本任務。

2.簡述ID3算法的主要步驟。

3.簡述貝葉斯分類方法的計算過程。

4.簡述分類器的性能表示與評估的主要方法。



在進行分類或預測挖掘之前,必須首先準備好挖掘數據。一般需要對數據進行預處理,以幫助提高分類或預測的準確性、效率和可擴展性。

預測準確率、計算速度、魯棒性、可擴展性和可理解性是對分類與預測方法進行評估的五個重要方麵。

ID3算法是基於決策樹歸納的貪心算法,算法利用信息論原理來幫助選擇構造決策樹時非葉結點所對應的測試屬性。樹枝修剪則是通過修剪決策樹中由於噪聲產生的分支從而改進決策樹的預測準確率。

貝葉斯分類是基於有關事後概率的定理而提出的,它就像是一個白匣子,各個結點之間的影響程度和條件概率關係都可以明顯地看到,並且意義明確。因此,貝葉斯網絡更適合那些影響因素少而且關係明確的情況。

神經網絡也是一種分類學習方法,它利用後傳算法來搜索神經網絡中的一組權重,以使相應網絡的輸出與實際數據類別之間的均方差最小。

【思考題】

1.數據分類分為哪兩個步驟?簡述每步的基本任務。

2.簡述ID3算法的主要步驟。

3.簡述貝葉斯分類方法的計算過程。

4.簡述分類器的性能表示與評估的主要方法。