女生裸体视频一区二区三区_久久久久九九九_美日韩精品视频_欧美日韩亚洲一区二区三区在线_激情成人亚洲_亚洲一区自拍_日韩亚洲精品在线_国产精品入口66mio_亚洲在线日韩_久久亚洲二区

美林?jǐn)?shù)據(jù)
ABOUT US
美林?jǐn)?shù)據(jù)技術(shù)股份有限公司(簡(jiǎn)稱(chēng):美林?jǐn)?shù)據(jù),NEEQ:831546)是國(guó)內(nèi)知名的數(shù)據(jù)治理和數(shù)據(jù)分析服務(wù)提供商。

大話數(shù)據(jù)挖掘——預(yù)測(cè)分析之決策樹(shù)方法

2021-03-02 18:18:58
接上一篇《大話數(shù)據(jù)挖掘之預(yù)測(cè)分析》
徐教授的PPT又翻開(kāi)了新的一頁(yè),他將光筆指向屏幕上的樹(shù)狀圖,講道:“所謂決策樹(shù)就是一個(gè)類(lèi)似流程圖的樹(shù)型結(jié)構(gòu),樹(shù)的最高層結(jié)點(diǎn)就是根結(jié)點(diǎn),樹(shù)的每個(gè)內(nèi)部結(jié)點(diǎn)代表對(duì)一個(gè)屬性(取值)的測(cè)試,其分支就代表測(cè)試的每個(gè)結(jié)果,而樹(shù)的每個(gè)葉結(jié)點(diǎn)就代表一個(gè)類(lèi)別。從根節(jié)點(diǎn)到葉子節(jié)點(diǎn)的每一條路徑構(gòu)成一條‘IF…THEN…’分類(lèi)規(guī)則。”
李部長(zhǎng)凝視著大屏幕上的決策樹(shù),明白了其中的奧妙,不禁道:“決策樹(shù)方法實(shí)際上就是通過(guò)一定的評(píng)判策略判定哪一個(gè)屬性對(duì)分類(lèi)最為重要,就將其作為根節(jié)點(diǎn),然后再判斷余下的節(jié)點(diǎn)中最重要的的節(jié)點(diǎn),直到葉子節(jié)點(diǎn)。”
“好,理解得還比較透徹。不過(guò),李部長(zhǎng),什么樣的節(jié)點(diǎn)才可以標(biāo)注為葉子節(jié)點(diǎn)呢?”徐教授問(wèn)。
李部長(zhǎng)吱吱唔唔:“好像有三種情況……”
“對(duì),附合以下三個(gè)條件之一的節(jié)點(diǎn)就可為葉子節(jié)點(diǎn):(1)節(jié)點(diǎn)的樣本集合中所有的樣本都屬于同一類(lèi);(2)節(jié)點(diǎn)的樣本集合中所有的屬性都已經(jīng)處理完畢,沒(méi)有剩余屬性可以用來(lái)進(jìn)一步劃分樣本,這時(shí)候采用子集中多數(shù)樣本所屬于的類(lèi)來(lái)標(biāo)記該節(jié)點(diǎn);(3)節(jié)點(diǎn)的樣本集合中所有樣本的剩余屬性取值完全相同,但所屬類(lèi)別卻不同,此時(shí)用樣本中多數(shù)類(lèi)來(lái)標(biāo)示該節(jié)點(diǎn)。”
 
決策樹(shù)分類(lèi)
 
徐教授接著說(shuō):“決策樹(shù)算法的典型代表是ID3(Interactive Dicremiser version 3)算法,它是由Quinlan等人于1986年提出的,是當(dāng)前機(jī)器學(xué)習(xí)領(lǐng)域中最有影響力的算法之一。其核心思想是在決策樹(shù)的構(gòu)建過(guò)程中采取基于信息增益的特征選擇策略,即選取具有最高信息增益的屬性作為當(dāng)前節(jié)點(diǎn)的分裂屬性,使得對(duì)結(jié)果劃分中的樣本分類(lèi)所需要的信息量最小。以此構(gòu)造與訓(xùn)練數(shù)據(jù)一致的一棵決策樹(shù),從而保證了決策樹(shù)具有最小的分支數(shù)量和最小的冗余度。”
李部長(zhǎng):“ID3算法思想簡(jiǎn)單,并且由其構(gòu)造的決策樹(shù)對(duì)樣本的識(shí)別率比較高。在實(shí)際應(yīng)用中,ID3算法還有什么不足之處嗎?”
徐教授按了一下光筆,并說(shuō):“請(qǐng)看大屏幕ID3算法的缺點(diǎn)主要表現(xiàn)在以下幾個(gè)方面。”
 
ID3算法的不足之處
(1)ID3算法在搜索過(guò)程中不能再回溯重新考慮選擇過(guò)的屬性,從而收斂到局部最優(yōu)解而不是全局最優(yōu)解;
(2)信息增益的度量偏袒于屬性取值數(shù)目較多的屬性,這不太合理;
(3)ID3算法只能處理離散值得屬性,不能處理連續(xù)屬性;
(4)當(dāng)訓(xùn)練樣本過(guò)小或者包含有噪聲的時(shí)候,容易產(chǎn)生過(guò)度擬和(Overfitting)現(xiàn)象。
 
馬處長(zhǎng)看著屏幕,問(wèn)道:“徐老師,那怎樣改進(jìn)ID3算法呢?”
徐教授回答道:“針對(duì)ID3算法的不足,Quinlan于1993年提出了ID3的改進(jìn)的方法——C4.5。與ID3相比,C4.5主要在以下幾個(gè)方面作了修改,并且引進(jìn)了新的功能:用信息增益比率作為選擇標(biāo)準(zhǔn),彌補(bǔ)了ID3算法偏向于取值較多的屬性的不足;合并連續(xù)屬性的值;可以處理具有缺少屬性值的訓(xùn)練樣本;運(yùn)用不同的剪枝技術(shù)來(lái)避免決策樹(shù)的過(guò)擬合現(xiàn)象;K次交叉驗(yàn)證等等。”
李部長(zhǎng)又問(wèn):“徐老師,我們?cè)谑褂脹Q策樹(shù)算法進(jìn)行分類(lèi)時(shí),有時(shí)會(huì)出現(xiàn)過(guò)擬合現(xiàn)象,這是怎么回事呢?”
徐教授不厭其煩:“基本的決策樹(shù)構(gòu)造算法沒(méi)有考慮噪聲,因此生成的決策樹(shù)可以完全與訓(xùn)練數(shù)據(jù)擬合,也就是說(shuō),對(duì)訓(xùn)練數(shù)據(jù)的測(cè)試準(zhǔn)確度可以達(dá)到100%。但是在有噪聲的情況下,完全擬合將導(dǎo)致“過(guò)擬合”的結(jié)果,即對(duì)訓(xùn)練數(shù)據(jù)的完全擬合反而導(dǎo)致對(duì)新數(shù)據(jù)的預(yù)測(cè)能力下降。這是因?yàn)楫?dāng)訓(xùn)練數(shù)據(jù)集合包含噪聲時(shí),決策樹(shù)在生成的過(guò)程中為了與訓(xùn)練數(shù)據(jù)一致,必然生成了一些反映噪聲的分支,這些分支不僅在新的決策問(wèn)題中導(dǎo)致錯(cuò)誤的預(yù)測(cè),而且增加了模型的復(fù)雜度。”
馬處長(zhǎng)也問(wèn)道:“那怎么避免過(guò)擬合現(xiàn)象呢?”
徐教授:“解決決策樹(shù)生成過(guò)程中的過(guò)擬合問(wèn)題的方法主要是對(duì)決策樹(shù)進(jìn)行剪枝。剪枝是一種克服噪聲的技術(shù),它有助于提高決策樹(shù)對(duì)新數(shù)據(jù)的準(zhǔn)確分類(lèi)能力,同時(shí)能使決策樹(shù)得到簡(jiǎn)化,使其更容易理解,加快分類(lèi)速度。剪枝策略可分為預(yù)剪枝(pre-pruning)和后剪枝(post-pruning)兩種。預(yù)剪枝主要是通過(guò)建立某些規(guī)則限制決策樹(shù)的充分生長(zhǎng),后剪枝則是等決策樹(shù)充分生長(zhǎng)完畢后再剪去那些不具有一般代表性的葉節(jié)點(diǎn)或者分枝。盡管前一種方法可能看起來(lái)更直接,但是后一種方法在實(shí)踐中更成功。因此在實(shí)際運(yùn)用中更多的采用的是后剪枝技術(shù)。”

服務(wù)熱線
400-608-2558
咨詢熱線
15502965860-
美林?jǐn)?shù)據(jù)
微信掃描二維碼,立即在線咨詢
女生裸体视频一区二区三区_久久久久九九九_美日韩精品视频_欧美日韩亚洲一区二区三区在线_激情成人亚洲_亚洲一区自拍_日韩亚洲精品在线_国产精品入口66mio_亚洲在线日韩_久久亚洲二区
亚洲国产精品二十页| 亚洲成人免费视| 色综合视频在线观看| 国产精品视频一二三| 亚洲第一网站| 丝袜美腿亚洲综合| 欧美日韩精品高清| 99国产精品国产精品久久| 国产精品国产三级国产普通话99 | 国产做a爰片久久毛片| 日韩精品一区国产麻豆| 国内一区二区三区| 视频一区在线播放| 欧美一区二区在线免费观看| 色综合色综合色综合色综合色综合| 亚洲男人的天堂在线观看| 91国偷自产一区二区使用方法| 国产精品456露脸| 日本一区二区电影| 久久精品观看| 国产成人综合在线播放| 国产精品无遮挡| 久久综合激情| 99天天综合性| 亚洲成av人片| 精品sm在线观看| 亚洲欧美久久久| 国产成人精品在线看| 亚洲色图色小说| 欧美肥妇毛茸茸| 伊人久久av导航| 精品在线免费观看| 国产精品视频线看| 欧美综合一区二区| 欧美精品网站| 国内精品久久久久影院薰衣草| 欧美国产日韩在线观看| 欧美网站大全在线观看| 欧美精品麻豆| 精品影视av免费| 国产精品毛片大码女人| 欧美日韩免费观看一区三区| 亚洲视频在线二区| 国产毛片精品视频| 亚洲国产欧美另类丝袜| 欧美变态凌虐bdsm| 性欧美暴力猛交另类hd| 91在线视频在线| 久久91精品久久久久久秒播| 亚洲天堂免费看| 日韩久久久精品| 色哟哟欧美精品| 亚洲午夜激情| 国产91综合网| 麻豆成人在线观看| 亚洲少妇屁股交4| 亚洲精品一区二区三区精华液| 91国产丝袜在线播放| 亚洲最新在线| 你懂的视频一区二区| 国产做a爰片久久毛片| 亚洲国产精品久久艾草纯爱| 久久久精品国产免大香伊| 精品视频全国免费看| 99精品国产99久久久久久福利| jlzzjlzz亚洲女人18| 九九精品视频在线看| 亚洲国产精品人人做人人爽| 国产精品久久久久aaaa樱花| 日韩欧美国产精品| 欧美日韩国产三级| 麻豆精品91| 亚洲狼人精品一区二区三区| 91免费国产在线| 成人av综合在线| 国产一二精品视频| 美女在线一区二区| 亚洲国产精品久久久久婷婷884| 国产精品久久久久久久裸模| 精品久久国产97色综合| 9191久久久久久久久久久| 色菇凉天天综合网| 国产精品区免费视频| 一区在线观看| 国产自产精品| 欧美日韩国产一区精品一区| a级高清视频欧美日韩| 国产成人高清视频| 国产99久久久精品| 国产成人高清视频| 国产精品一品二品| 国产一区二区免费在线| 狠狠色综合色综合网络| 九色综合狠狠综合久久| 秋霞电影一区二区| 麻豆一区二区三| 蜜乳av一区二区三区| 久久精品国产999大香线蕉| 天天综合天天综合色| 日本亚洲最大的色成网站www| 亚洲第一在线综合网站| 亚洲va欧美va人人爽午夜| 一区二区成人在线视频| 亚洲午夜一区二区| 亚洲成人动漫在线免费观看| 亚洲一区二区三区影院| 亚洲午夜久久久| 日韩av在线发布| 久国产精品韩国三级视频| 久久草av在线| 国产成人综合在线观看| 成人性生交大片免费看在线播放 | 国产麻豆一精品一av一免费| 成人一二三区视频| 欧美在线免费| 亚洲国产欧美不卡在线观看| 国产精品免费一区二区三区在线观看 | 国产高清成人在线| www.日韩在线| 国内视频一区| 麻豆久久久9性大片| 在线观看不卡一区| 日韩三级中文字幕| 国产亚洲短视频| 亚洲天堂福利av| 亚洲图片一区二区| 免费在线观看一区| 国产999精品久久久久久绿帽| 91麻豆文化传媒在线观看| 欧美天天视频| 亚洲欧美日韩精品久久久| 欧美性一二三区| 精品欧美久久久| 一区二区中文视频| 天天综合色天天综合| 国产成人精品aa毛片| 欧美日韩在线一二三| 久久精品女人| 日韩欧美国产午夜精品| 日韩毛片在线免费观看| 免费人成精品欧美精品| 国产99久久久国产精品| 亚洲午夜在线| 欧美在线综合视频| 亚洲精品一区二区三区在线观看| 综合久久国产九一剧情麻豆| 日本欧美韩国一区三区| www.在线成人| 亚洲一区二区三区精品动漫| 欧美精品高清视频| 国产精品视频观看| 天天综合天天综合色| 不卡一区二区中文字幕| 国产一区二区黄色| 91精品国产欧美一区二区| 国产精品久久一卡二卡| 奇米亚洲午夜久久精品| 99视频一区二区| 久久久久综合| 国产亚洲欧洲一区高清在线观看| 亚洲小说春色综合另类电影| 懂色av一区二区三区蜜臀| 亚洲精品护士| 日韩欧美电影在线| 亚洲国产精品久久久久秋霞影院| 成人的网站免费观看| 亚洲欧美成人| 久久免费国产精品| 免费久久99精品国产| 亚洲午夜精品福利| 制服丝袜av成人在线看| 夜色激情一区二区| 972aa.com艺术欧美| 91久久精品国产91性色tv| 国产日韩亚洲欧美综合| 麻豆91精品91久久久的内涵| 在线观看成人一级片| 日韩欧美国产1| 日韩精品福利网| 国模大胆一区二区三区| 91 com成人网| 视频一区二区不卡| 午夜精品电影| 555夜色666亚洲国产免| 亚洲国产成人高清精品| 91污在线观看| 欧美日韩国产电影| 午夜精品一区在线观看| 欧美性色综合| 欧美大尺度电影在线| 麻豆一区二区在线| 国产精品日韩欧美一区| 国产欧美日韩在线看| 国产aⅴ精品一区二区三区色成熟| 久久天堂成人| 亚洲男同性恋视频| 午夜久久福利| 亚洲精品一区二区精华| 狠狠色综合播放一区二区| 久久网站免费|