这次项目是大二老师给我的,具体什么时候做的,我已经忘记了,现在重温一下;
首先我们都知道Informer的图像如图1,但是我觉得太复杂了,我便将中间的两层做了删掉,并对他们自带的测试集做了些测试,发现他们在时间方面的差距并不大(甚至可以说微乎其微),至于效率方面,这个与测试集有关,笔者在自己的项目和原论文项目中小小的测试了几次,效率并没有多大差距,但是我的老师在一些时序预测项目中发现有一定差距,但是因为当时的时间限制,也没有做太多“计较”
我的老师当时问了几个问题:
我做了相应的回答:
我在这里也给出Splice激活函数的图像
这是我的最终结果,每一个测试集跑了10次,平且去除最低和最高后平均的结果
从效果上来看,还不错,这是我的第一次小小的“成功”,因为时间、mse(均方误差)、mae(均值绝对误差)大部分要比论文好很多;
这篇文章仅仅记录一下我的大二下的第一次科研项目(重要的是,那个时候我前女友还陪着我)
关于实验源码,我不能公开,但是我可以将我的Splice激活函数的代码公开(其实有了公式,就算不公开,读者也能自己写出来):
class Splice(nn.Module):
def __init__(self):
super(Splice, self).__init__()Q
self.weight = nn.Parameter(torch.FloatTensor(1), requires_grad=True)
self.reset_parameters()
def reset_parameters(self):
self.weight.data.fill_(1.0)
def forward(self, input):
return exp(self.weight *input) / (1 + abs(input))
参与评论
手机查看
返回顶部