• 学前教育
  • 小学学习
  • 初中学习
  • 高中学习
  • 语文学习
  • 数学学习
  • 英语学习
  • 作文范文
  • 文科资料
  • 理科资料
  • 文档大全
  • 当前位置: 雅意学习网 > 小学学习 > 正文

    预则立|凡事预则立不预则 全文

    时间:2020-03-11 07:21:12 来源:雅意学习网 本文已影响 雅意学习网手机站

      时�序列预测技术之规律谜团   这些天泰国的洪水情况令人堪忧,凶猛的洪水甚至威胁到了首都曼谷的中心城区。这让人想到了一个传说,有一个古老的家族总是能够躲过洪水的侵袭,使全族人的生命得以保全。原来,他们的祖先发现了一个神秘的规律:只要潮水退却的速度异常快,那么离大洪水爆发的时�就不远了。这时候族中的长辈就会带着全族人及时搬到地势较高的地带,躲过肆虐的洪水。
      伴随着新技术带来的新媒体革命,三网融合就如历史的大潮一样向前推进,毫无留恋之意,身处其中,不进则退。就在今年的8月底,新西兰的百年国家通讯社因不堪新媒体大潮的冲击,黯然退出了历史舞台。在为其百年辉煌东流去惋惜的同时,相信很多广电人都对自己的生存之路忧心不已。如何生存下去,如何做大做强,这些是每一个广电人都正在思考的问题。广电运营商就如同那个古老的民族,在三网融合这场大潮中,只要找出运营状况的规律,就会得以新生。
      要想成功运营各项新业务,要想整合已有资源,进行合理投入与开发,这都离不开对自身平台价值的进一步挖掘。对手中已有的数据,需要通过把握其既有规律,通过这些规律对未来可能的走向和趋势做出预测,这样才能使决策更为明确、有效。数据挖掘中的时�序列预测技术就能通过一个个数字,为我们找出规律,揭示答案。它可以通过序列模式挖掘有效的关联规则,从而将历史数据揭示的现象规律延伸到未来,并对未来做出预测。
      时�序列预测技术之可行性与必要性
      第一,时�序列预测技术的可行性。
      随着数字电视的推广与部署,有线电视网络的运营模式也在发生着深刻的变化:数字电视为有线电视运营商的多业务化提供了可能。用户从原有的被动按时收看,逐渐发展出移动电视和视频点播;收费模式也从原来粗放型的包年制收费逐渐精细化,发展出按时长、按节目、按点播等多种收费模式;数字机顶盒本身也正从一个单纯的接收机向多功能家庭视讯终端转变。有线运营商在建立各自系统的过程中积累了大量的数据资料,如用户的点播记录、收视记录、用户上网记录、用户资料变更记录、用户投诉记录、网络运行记录等。总而言之,全程的数字化管理成为了可能。
      第二,时�序列预测技术的必要性。
      ●探究真实业务价值,正确选择运营项目。目前出现的如付费节目、VOD点播、在线支付等诸多的增值业务,究竟哪些业务可以为运营商真正带来收益?有线运营商不能只是简单的为用户管理和计费来搭建系统,而是要考虑如何建设一个开放的、可盈利的业务平台。要想了解真实的业务价值,就要考量用户在业务上的使用时�以及使用程度这两个重要指标。通过对某一频道的收视率或者节目点播率的分析,我们可以预测增值业务的未来营收状况,从而对业务开展做出正确布局。
      ●正确选择目标客户,从而持续获利。用户到底看了什么节目,看了多久,是谁看的,有多少人在看,这些都是广电运营商应该关注的数据。就像电信运营商去关注用户打电话的时�、频率一样。数据挖掘技术在电信行业已有很多成功应用的案例,如使用数据仓库系统进行用户数分析、服务分析、话务量分析、销售代理分析、地区分析等,了解收入和利润的结构,找出客户特征和服务关系。通过选择正确的目标客户,可以避免接触不合适的潜在客户所产生的额外成本,提高客户购买率和成交率,且增加后续的客户价值和利润贡献度,得以持续获利。
      ●正确制订运营目标。在岁末年初,如何制定一个既可完成,又能在往年基础上有所提升的指标?这就需要预测技术给出一个可行的预案。另外,针对用户进行精准营销也需要预测技术对用户行为特征进行分析。
      时�序列预测之特点及方法
      “凡事预则立,不预则废”,这句古话中所强调的就是预测系统的重要性。预测就是对尚未发生或目前还不明确的事物进行预先的估计和推测,是在现时对事物将要发生的结果进行探讨和研究,简单地说就是指从已知事件测定未知事件。预测可以帮助了解事物发展的未来状况,人们可以在目前为它的到来做好准备,通过预测可以了解目前的决策所可能带来的后果,并通过对后果的分析来确定目前的决策,力争使目前的决策获得最佳的未来结果。认识事物的发展变化规律,利用规律的必然性,是进行科学预测所应遵循的总的原则。
      在数据挖掘领域,有时候分类问题与预测问题在表达上是区分不开的,有时候分类即预测。比如通过判别分析、C5.0规则(Clementine的决策树模型中的算法)或Logistics回归(一种分析模型)进行监督类建模,得到的结论是客户是什么类别等级,可以说是分类;当然,如果能够预测该消费者什么时候流失,也相当于进行了预测。其实有时候并不需要严格区分预测和分类,关键看是什么时�点。从这里也可以看出,预测问题的内涵和外延非常宽泛,但研究者心中要有数,因为这会决定得到的结果将如何应用。
      时�序列预测实质上是对时�序列特征的识别,并在此基础上,建立相应的数学模型,形成一系列的时�序列预测方法。我们可以通过时�序列长期趋势的识别,建立各种趋势外推预测方法;也可以通过季节变动分析,找出季节变动的规律,实现时�序列的季节预测。另外,通过对不规则变动及循环变动的分析,我们可以采取一定方法消除它们的影响;最后,通过对序列自相关的识别,还可建立随机时�序列预测方法。
      时�序列有一明显的特性就是记忆性,记忆性是指时�数列中的任一观测值的表现皆受到过去观测值的影响。但现实中时�序列的变化受到许多因素的影响,有些起着长期的、决定性的作用,使时�序列的变化呈现出某种趋势和一定的规律性;有些则起着短期的、非决定性的作用,使时�序列的变化呈现出某种不规则的特性。时�序列的变化大体有以下四个组成分子:
      
      
      (1)长期趋势:时�序列可能相当稳定或随时�呈现某种趋势。时�序列趋势一般为线性的,二次方程式的或指数函数。
      (2)季节性变动:按时�变动,呈现重复性行为的序列。季节性变动通常和日期或气候,以及年周期有关。
      (3)周期性变动:相对于季节性变动,时�序列可能经历“周期性变动”。周期性变动通常是因为经济变动。
      (4)随机影响:指时�序列受偶然因素的影响而呈现出的不规则波动。
      那么,时�序列预测技术主要包括两大类:
      (1J指数平滑方法:描述时�序列数据的变化规律和行为,不去试图解释和理解这种变化的原因。例如:我们可能发现在过去的一年里,三月和九月都会出现用户增长的高峰,我们可能希望继续保持这样,尽管不知道为什么。
      
      
      (2)ARIMA模型:描述时�序列数据的变化规律和行为,它允许模型中包含趋势变动、季节变动、循环变动和随机波动等综合因素影响。具有较高的预测精度,可以把握过去数据变动模式,有助于解释预测变动规律,回答为什么会这样。
      时�序列预测技术之运用实例
      我们通过分析一个数字电视运营商预测增值业务分类营收的实例,让大家了解时�序列技术是如何实 现预测的。
      首先,假设我们从数字电视运营商的数据库系统中得到了以下数据,包含不同类型的增值业务从2000年~2009年的营收情况。(付费数字电视从2004年9月1日开始在全国正式启动收费服务。在时�序列预测中,过去的数据越多,预测出来的走势就更准确,因此假设从2000年开始。见图1)有了这些数据,我们可以通过过去10年的数据对其中某一项增值业务未来几个月或者一年中的营收情况做一个预测。在此,我们选择付费频道作为预测的变量。
      为了找到适当的模型,我们首先绘制时�序列。时�序列的可视化检查通常可以很好地指导并帮助我们进行选择。需要明确的是:一、此序列是否存在整体趋势?如果是,趋势是显示持续存在还是显示将随时�而消逝?二、此序列是否显示季节变化?如果是,那么这种季节的波动是随时�而加剧还是持续稳定存在?
      我们通过数据挖掘分析工具来对数据进行分析,将数据集导入软件,并依次按照时�序列分析相关要求,添加模块并调整相应的设置,完整的建模流程见图2:
      图3即为付费频道10年来的营收情况走势,此序列显示整体上升趋势,即序列值随时�而增加。上升趋势似乎将持续,即为线性趋势。另外,该序列还有一个明显的季节特征,即年度高点在十二月。季节变化呈现出伴随上升序列增长的趋势,表明这是乘法季节模型而不是加法季节模型。而指数平滑法有助于预测存在趋势或季节的序列。因此我们采用指数平滑法进行进一步的构建。
      随着时�的推移,付费频道营收散点图建议我们使用同时包含线性趋势和乘法季节的模型。因此最适合的是Winters模型。首先我们将开发一个简单模型(即无趋势也无季节),然后开发一个Holt模型(存在线性趋势但无季节)。通过比较我们得知Winters模型才是最好的方案。
      图4即为简单模型,显示了渐进(十分冗长)上升趋势,但它并未考虑季节。因此放弃该模型。
      图5为Holt模型,显示比简单模型更强的平滑趋势,但它仍未考虑季节,所以还应放弃该模型。
      图6为Winters乘法模型,该模型较为合适,因为它同时反映了数据的趋势和季节。此数据集的时�跨度为10年,并且包含10个季节峰值(每年十二月份出现)。经过比对我们可以发现,这10个预测出的峰值与实际数据中的10个年度峰值完全匹配。但此结果同时指出了“指数平滑”步骤的局限性,我们可以仔细观察上升和下降的峰值,就可发现还有一些重要结构没有得到解释。如果是要构建一个长期的,包含季节变化趋势的模型,那么可以选择指数平滑模型。
      ARIMA模型和季节模型构建趋势的方法比构建指数平滑模型更复杂,并且还新增了在模型中包含预测变量的功能。如果添加一些对付费频道营收可能产生影响的预测变量,ARIMA就可以通过指定自动回归、差分和移动平均的顺序以及相应的季节产物来对模型进行微调。
      假设我们还能得到5个预测变量,如宣传册发放数、电视广告投放数、促销政策提示与播放次数、机顶盒发放数以及呼叫中心客服的数量等。ARIMA模型就可以将这些预测变量的影响考虑进去,在付费频道本身的规律基础上,添加预测变量可能对预测值产生的影响。所以说ARIMA模型包含了综合因素的影响,回答的是为什么是这样的问题。
      图7是ARIMA模型,此模型可以捕捉大型的下降峰值,并将其保持为当前最适合的值。用时还预测了2010年的收入情况。2010年的预测形势良好:如预期的那样,销售水平继十二月高峰期后再次回复正常,下半年一直保持平稳的上升趋势,整体销售情况比2009年有明显的好转。
      这个案例演示告诉我们,通过对过去数据走势的分析,我们不仅可以获得其发展规律,还可以通过找出的规律,对未来的趋势做出预测,并且只要模型构建合理,准确性也相当高。由此,广电运营商通过时�序列预测技术不仅可以根据业务营收情况决定资金投入,还能根据把预测值作为KPI指数(Key Performance Indicators意为关键绩效指标,是通过对组织内部流程的输入端、输出端的关键参数进行设置、取样、计算、分析,衡量流程绩效的一种目标式量化管理指标,是对企业运作过程中关键成功要素的提炼和归纳),在下一年的工作中比照预测值去衡量工作和业务的部署以及完成情况。时�序列还可用于预测用户订阅数、点播数等这些在决策过程中必不可少的数据。
      这样,通过时�序列预测,我们就可以把握现象在一定时�内的变化发展过程,进而从中分析寻找出其变化特征,可以让我们真正做到运筹帷幄。

    推荐访问:预则立 预则立 凡事预则立的下一句 凡事预则立不预则废

    • 文档大全
    • 故事大全
    • 优美句子
    • 范文
    • 美文
    • 散文
    • 小说文章