【2024】WaveletMixtureofExpertsforTimeSeriesForecasting

其他
2025-09-08 18:48:02

1.方法

1.输入数据（X）：输入数据是一个时间序列信号，表示为波形信号。这个信号在处理之前首先通过 Reversible Instance Normalization (RevIN) 进行归一化，以确保其在后续的分析中保持一致的尺度和分布。

2.小波变换（DWT）：数据接着通过离散小波变换（Discrete Wavelet Transform, DWT）进行处理。小波变换会将信号分解成两个部分：

低频部分（Approximate Coefficient, XA）：它捕捉信号的周期性和主要趋势。高频部分（Detail Coefficient, XD）：它捕捉信号的噪声和细节。在此步骤中，高通滤波器（h[t]）和低通滤波器（g[t]）用于从输入信号中提取这两个不同的成分。

3.低频部分（XA）的处理：对于低频部分（XA），有两种处理方式，根据使用的模型不同： WaveTS-B（基础模型）：

MLP（多层感知机）用来处理低频部分。MLP是一个简单的前馈神经网络，它将低频部分的输入（XA）传入并进行预测。 WaveTS-M（高级模型）：在WaveTS-M中，除了使用MLP外，还加入了专家混合模型（MoE）来对低频部分进行更加细致的处理。

4.专家混合模型（MoE）的工作原理： 1. 门控网络（Gating Network）：门控网络的任务是根据输入数据 XA 动态地计算每个通道的权重。这些权重用于决定不同专家网络（Expert Networks）的重要性。门控网络的输出是一个概率分布，表示每个专家网络在当前任务中的重要性（即每个专家的“权重”）。

2. 专家网络（Expert Networks）：每个专家网络是一个单独的神经网络，它专注于数据的不同特征。通过门控网络的引导，每个专家根据分配的权重专门处理特定部分的数据，进行独立的预测。每个专家有自己特定的擅长领域，可能适合不同的数据模式或者特征。多个专家的预测结果会通过门控网络的权重进行加权融合，得到最终的输出。

输出层（Y）部分是你需要修改的地方。从回归输出（连续数值）改为分类输出（类别概率）。需要加一个 Softmax 层来生成类别概率，并使用交叉熵损失来训练模型。其他的部分，如 MoE 和 MLP 结构，依然适用，可以保持不变。

5.预测组合： WaveTS-M模型最终的低频部分（XA）的预测是通过门控网络和专家网络的联合工作完成的。每个专家根据自己的擅长领域做出预测，然后门控网络根据不同专家的权重动态加权，最终产生低频部分的预测。这个加权的预测会与高频部分（XD）进行融合。高频部分使用线性变换（Linear）来处理。最终，低频和高频部分的预测会合并，得到完整的时间序列预测。

6.逆归一化（iRevIN）：最后，预测结果会通过逆归一化（iRevIN）进行处理，以恢复到原始数据的尺度和分布，得到最终的预测值。

标签：

【2024】WaveletMixtureofExpertsforTimeSeriesForecasting由讯客互联其他栏目发布，感谢您对讯客互联的认可，以及对我们原创作品以及文章的青睐，非常欢迎各位朋友分享到个人网站或者朋友圈，但转载请说明文章出处“【2024】WaveletMixtureofExpertsforTimeSeriesForecasting”

上一篇
Fisco-Bcos单群组区块链部署

下一篇
【Rust中级教程】1.10.引用及内部可变性（简单回顾）：