【新智元導(dǎo)讀】SPF算法是一種基于狀態(tài)序列頻域預(yù)測(cè)的表征學(xué)習(xí)方法,利用狀態(tài)序列的頻域分布來(lái)顯式提取狀態(tài)序列數(shù)據(jù)中的趨勢(shì)性和規(guī)律性信息,從而輔助表征高效地提取到長(zhǎng)期未來(lái)信息。強(qiáng)化學(xué)習(xí)算法(Reinforcement Learning, RL)的訓(xùn)練過(guò)程往往需要大量與環(huán)境交互的樣本數(shù)據(jù)作為支
......
本文由站長(zhǎng)之家合作伙伴自媒體作者“?新智元公眾號(hào)”授權(quán)發(fā)布于站長(zhǎng)之家平臺(tái),本平臺(tái)僅提供信息索引服務(wù)。由于內(nèi)容發(fā)布時(shí)間超過(guò)平臺(tái)更新維護(hù)時(shí)間,為了保證文章信息的及時(shí)性,內(nèi)容觀點(diǎn)的準(zhǔn)確性,平臺(tái)將不提供完全的內(nèi)容展現(xiàn),本頁(yè)面內(nèi)容僅為平臺(tái)搜索索引使用。需閱讀完整內(nèi)容的用戶,請(qǐng)查看原文,獲取內(nèi)容詳情。
(舉報(bào))