基于改進決策樹的不平衡數(shù)據(jù)集分類算法研究
計算機仿真
頁數(shù): 5 2024-08-15
摘要: 不平衡數(shù)據(jù)集中各類樣本數(shù)量不均,導致分類模型難以訓練。針對不平衡數(shù)據(jù)分類模型穩(wěn)定性差,準確率低的問題,提出一種基于改進C4.5決策樹數(shù)據(jù)分類算法,通過融合SMOTE優(yōu)化采樣算法,構(gòu)建出N_C4.5-IDC不平衡數(shù)據(jù)分類模型。模型首先利用K-Means聚類對數(shù)據(jù)集進行狀態(tài)分布分析,并使用SMOTE采樣法進行混合采樣,通過增加人為樣本點提高少數(shù)類樣本數(shù),對數(shù)據(jù)集進行平衡處理;然后對... (共5頁)