華人團(tuán)隊(duì)開源新模型U-Cast,像「放大鏡+過濾器」一樣,從上萬條時(shí)間序列里秒抓關(guān)鍵層級(jí),預(yù)測(cè)更快更準(zhǔn);同步發(fā)布十領(lǐng)域真實(shí)大數(shù)據(jù)集Time-HD,供全球研究者免費(fèi)練手,推動(dòng)高維時(shí)序預(yù)測(cè)進(jìn)入「ImageNet時(shí)刻」。
從金融市場(chǎng)的上千支股票,到智慧城市交通網(wǎng)絡(luò)的上萬個(gè)傳感器,我們正全面進(jìn)入一個(gè)由高維時(shí)間序列數(shù)據(jù)驅(qū)動(dòng)的時(shí)代。
然而,當(dāng)前主流的時(shí)間序列預(yù)測(cè)(TSF)模型,大多仍停留在僅包含幾個(gè)或幾百個(gè)變量的低維環(huán)境中進(jìn)行評(píng)估(Table 1)。

當(dāng)面對(duì)成千上萬個(gè)變量構(gòu)成的高維復(fù)雜系統(tǒng)時(shí)(Time-HD),則往往在效率與性能上表現(xiàn)出明顯的局限性。
此外,大規(guī)模數(shù)據(jù)集已被證明是多個(gè)研究領(lǐng)域取得突破的關(guān)鍵支撐。
例如,CV中的ImageNet、MS COCO,NLP中的GLUE、SQuAD,以及Graph中的OGB,都在推動(dòng)相應(yīng)領(lǐng)域的發(fā)展中發(fā)揮了決定性作用。
然而,在時(shí)序預(yù)測(cè)領(lǐng)域,始終缺乏同類的大規(guī)模基準(zhǔn),這使得研究進(jìn)展受到制約。
進(jìn)一步地,高維環(huán)境才能真正釋放通道依賴型模型的價(jià)值。
而在現(xiàn)有的低維數(shù)據(jù)集上,通道依賴型(Channel-Dependent, CD)模型相較通道獨(dú)立型(Channel-Independent, CI)模型并未表現(xiàn)出穩(wěn)定且顯著的優(yōu)勢(shì)。
這一現(xiàn)象容易引發(fā)懷疑,即顯式建模通道間關(guān)系是否真的有效?
之前有研究提出是維度數(shù)量本身限制了CD方法潛在優(yōu)勢(shì)的發(fā)揮。


通過理論分析(Theorem 1 and 2),他們證明了在高維環(huán)境下,當(dāng)存在非冗余變量時(shí),CD模型的貝葉斯風(fēng)險(xiǎn)(Bayes risk)始終低于CI模型,且這一優(yōu)勢(shì)會(huì)隨著維度增加而不斷擴(kuò)大。