当前位置: 首页 > news >正文

如何做招聘网站效果分析北京网站定制公司

如何做招聘网站效果分析,北京网站定制公司,企业网站制作模板免费下载,建设牌官方网站1. 时序预测背景 时序数据,就是序列随时间变化的数据。时间序列分析,一般有时域和频域两种分析方法。时序预测的本质是在时域和频域层面探索时间序列变化的内在规律。 下图描述的是时域(temporal domain),横坐标是时…

1. 时序预测背景

时序数据,就是序列随时间变化的数据。时间序列分析,一般有时域和频域两种分析方法。时序预测的本质是在时域频域层面探索时间序列变化的内在规律

下图描述的是时域(temporal domain),横坐标是时间,纵坐标是某个测量信号的数值。时域能够最直观地反映序列随时间的变化。

时域分析一般包括周期、季节趋势这三类规律:

  • 周期性:重复的上升、下降过程,从哪来回哪去;

  • 季节性:固定频率的上升、下降,多为先验因素

  • 趋势性:长期保持增长或者下降。

另一种时序的分析方法是频域分析,下图展示的就是某个时间序列的频域(frequency domain),反映的是序列频率的变化,横坐标是信号的频率,纵坐标是信号的振幅或能量等物理量。频域分析有个重要的概念叫做谱密度,其核心思想是:信号是由少数主频叠加而成的。因此往往在时序层面难以分析时间序列变化的内在规律,会将时序通过FFT等手段转变为频域以及采用小波变换等方法进行辅助分析。

图片

上述这一思想在其他领域也会频繁被使用,例如将时间序列进行主成分分解等。

时间序列预测模型,常用的机器学习模型主要包括以下3类:ARIMA,Prophet,LGB。这3类模型的优缺点如下:

(1)ARIMA

①优点

  • 简单易行,可解释性强;

  • 数据量要求低;

  • 计算速度较快,可以对每个站在线拟合推理;

②缺点

  • 仅支持单变量;

  • 无法特征工程;

  • 准确率低;

③适用场景:基于统计学方法,项目初期冷启动

(2)Prophet

①优点

  • 简单易行,可解释性强;

  • 数据量要求低;

  • 加入先验知识(节假日);

  • 计算速度更快,可以对每个站在线拟合推理;

②缺点

  • 仅支持单变量;

  • 无法特征工程;

  • 准确率较低;

③适用场景:项目初期迭代

(3)LGB

①优点

  • 准确率较高;

  • 简单易行,可解释性强;

  • 支持批量预测,计算速度更快;

②缺点

  • 迭代模型等于迭代特征,但是迭代特征存在瓶颈;

  • 类别特征利用不充分;

③适用场景:项目中期迭代

3.深度学习模型

前文提到,机器学习的可操作性以及模型效果都是有限的,会遇到瓶颈,因此引入深度学习模型

① 深度学习模型架构

时序预测任务所涉及到的CNNs、RNNs和Transformers等模型都属于生成模型,具有统一的架构(unified architecture),这样的架构有两个重点部分,一个是Embedding引擎部分,另一个是编码器-解码器部分,如下图所示:

  • TCN模型的编码器和解码器主要是1D卷积网络;

  • CRNN模型的编码器和解码器主要是1D卷积网络和RNN网络;

  • Informer模型的编码器和解码器主要是Transformer网络;

  • DCN模型的编码器和解码器主要是2D卷积网络;

2. 时序预测痛点:

一个是节假日时间不固定问题,另一个是时间先验问题。

  • Temporal EmbeddingTemporal Embedding主要用来解决两个问题,一个是节假日时间不固定问题,另一个是时间先验问题。

1. 对于第一个节假日不固定问题,我们的节假日包括阳历节日农历节日;根据序列的时间周期可以拆分成小时、天、周、月、年等常规周期;

对于节假日时间的对齐方式,包括硬对齐和软对齐两种方式。

  1. 硬对齐主要指序列按照周、月、年等方式进行序列对齐,
  2. 软对齐主要是指将序列进行傅里叶变换(时序->频域),找到序列的 主频,借助序列的频域信息进行对齐

图片

2. 对于第二个时间先验问题,如下图所示,预测的时间数据已知,但是 其它相关输入变量 未知,这就造成了输入数据的维度不一致

图片

对于上述问题,通过填充 未知的其他变量 保证 输入数据的 维度一致,并根据位置的标记 区分 已知变量未知变量,最终可以得到输出的预测变量。

图片

2. 卷积模块设计经验

DCN部分中卷积层的设计,首先面临如下的思考:假设输入序列长度等于L,第i个卷积层的卷积核大小等于2i+1,步长等于1,需要多少卷积层?

这里涉及到两个概念:

  • 因果卷积

  • 时间序列本身存在因果关系,即在某一时间点t,只能获取历史信息,而无法获取未来信息;

  • 使用下图所示的单边卷积,用来保证序列的时间因果关系。

图片

  • 感受野

  • 感受野主要是指将一个特征点映射回到原始输入,所覆盖的范围

  • 需要保证卷积神经网络可以覆盖到 输入时间序列的长度范围

图片

  • 感受野可以通过下图的表格计算,得到的n就是需要设置的卷积层数

    • 第i个卷积层的卷积核大学: 2i+1

    • 感受野: i^2+i+1

图片

确定了卷积层的层数,将卷积层通过残差层子模块,像搭积木一样连接成整体的网络模块。

图片

4.模型融合

模型融合方面,有三个问题值得思考:

  • 加法还是减法?

    • 减法 主要包括残差、GBDT、Shortcut等;

    • 加法 主要包括stacking等方法

  • 分类还是回归?

    • 传统的预测一般是回归问题

    • 类问题往往会涉及概率问题,通过投票选择可以获得一定的信息;

  • 向上、向下还是躺平?

    • 使用基模型进行预测,可通过强化学习对预测效果进行反馈与激励,引导模型自主学习。

http://www.shuangfujiaoyu.com/news/45735.html

相关文章:

  • 网站404页面做晚了google下载
  • 河南住房和城乡建设厅官网某网站seo策划方案
  • 网站规划和布局潍坊网站建设平台
  • 北京新浪网站制作公司排名优化怎么做
  • 重庆石柱网站设计公司天津seo
  • ppt 做的最好的网站有哪些推广类软文案例
  • flash网站什么意思百度关键词推广价格
  • 深圳高端网站建设电话南京seo顾问
  • 大良营销网站建设价格网络培训心得体会总结
  • 免费建站网站一级大录像不卡网页链接
  • 有哪些好的网站项目全自动引流推广软件app
  • ps做网站的草图日本疫情最新数据
  • 如何在网上建设一个公司网站百度一下百度搜索百度
  • 企业网站 源码 开源帮忙推广的平台
  • 平台网站模板 优帮云seo具体是什么
  • 自己做的网站被封了社群推广平台
  • web站点优化b站视频推广网站
  • 安卓做视频网站世界最新新闻
  • 用什么网站做海报 知乎网页制作模板的网站
  • 全面的微信开发优化大师下载安装
  • 网站qq访客抓取网络营销环境分析包括哪些内容
  • 只会前端可以做动态网站吗账户竞价托管费用
  • wordpress只有vip会员下载开封搜索引擎优化
  • 天元建设集团有限公司网站重庆seo霸屏
  • 网站建设多少钱一个平台开电商需要多少钱
  • 手机网站网页开发教程代运营一个月多少钱
  • 做720效果的还有哪个网站软文素材
  • 专门做电商的网站有哪些推广竞价的公司有哪些
  • html5网站模板怎么修改网络平台宣传方式有哪些
  • 在手机上怎么制作网站吗关键词优化app