要點(diǎn):
1. 斯坦福團(tuán)隊(duì)在論文中提出了MAPTree算法,這是一種基于貝葉斯決策樹(shù)理論的決策樹(shù)歸納方法。
2. MAPTree可以評(píng)估貝葉斯決策樹(shù)的后驗(yàn)分布,找到數(shù)據(jù)的最大后驗(yàn)概率決策樹(shù),從而改進(jìn)決策樹(shù)的性能。
3. 實(shí)驗(yàn)表明,MAPTree算法可以獲得比現(xiàn)有貪心決策樹(shù)算法更好的泛化性能,也能生成更簡(jiǎn)潔的決策樹(shù)。
站長(zhǎng)之家(ChinaZ.com)10月9日 消息:決策樹(shù)是一種廣泛使用的著名機(jī)器學(xué)習(xí)算法,可用于分類和回歸任務(wù)。斯坦福大學(xué)的研究人員在最新論文中提出了一種稱為MAPTree的決策樹(shù)歸納算法,這是基于貝葉斯決策樹(shù)理論的一種改進(jìn)方法。
MAPTree的全稱是“最大后驗(yàn)概率決策樹(shù)”。該方法的核心思想是評(píng)估貝葉斯決策樹(shù)后驗(yàn)分布,根據(jù)給定的數(shù)據(jù)集找到后驗(yàn)概率最大的決策樹(shù)結(jié)構(gòu)。相比通常的貝葉斯決策樹(shù)采樣過(guò)程,MAPTree可以更高效地直接尋找概率最大的決策樹(shù)。
項(xiàng)目地址:https://github.com/ThrunGroup/maptree
論文中,研究人員通過(guò)建立與AND/OR搜索相關(guān)的理論聯(lián)系,得出了使用MAPTree進(jìn)行最大后驗(yàn)推理的相關(guān)算法。實(shí)驗(yàn)結(jié)果顯示,MAPTree可以找到比基于貪心法的CART決策樹(shù)或隨機(jī)森林等當(dāng)前最優(yōu)算法更好的決策樹(shù)。
具體來(lái)說(shuō),MAPTree在多個(gè)數(shù)據(jù)集上的分類精度和對(duì)數(shù)似然值指標(biāo)上都優(yōu)于現(xiàn)有算法。當(dāng)模型性能相當(dāng)時(shí),MAPTree學(xué)習(xí)到的決策樹(shù)也往往更加簡(jiǎn)潔緊湊。這說(shuō)明MAPTree可以獲得很好的泛化能力。
研究人員認(rèn)為,MAPTree代表了決策樹(shù)技術(shù)發(fā)展的重要進(jìn)步。它提供了一種更高效、更穩(wěn)健的決策樹(shù)學(xué)習(xí)方法,不僅可以帶來(lái)預(yù)測(cè)性能的提升,也使決策樹(shù)模型更可解釋。MAPTree有望在決策樹(shù)相關(guān)理論和實(shí)際應(yīng)用方面都產(chǎn)生重要影響。
總體而言,這項(xiàng)斯坦福大學(xué)的研究成果為決策樹(shù)技術(shù)提供了一種嶄新的貝葉斯建模思路。MAPTree算法的提出改進(jìn)了決策樹(shù)的歸納方法,使其擁有更強(qiáng)大的學(xué)習(xí)能力。這項(xiàng)突破不僅利于決策樹(shù)算法本身的發(fā)展,也為決策樹(shù)在數(shù)據(jù)挖掘等領(lǐng)域的應(yīng)用帶來(lái)了新的契機(jī)。
(舉報(bào))