资料库 使用算法预测选举:与drew linzer聊天

使用算法预测选举:与drew linzer聊天

Anonim

Drew将于1月30日至31日在拉斯维加斯举行的大数据创新峰会上发表演讲:http://analytics.theiegroup.com/bigdata-lasvegas,以及来自美国奥巴马,百思买,LinkedIn,《纽约时报》,诺基亚,Bitly,Barnes&Nobles,沃尔玛实验室等等。


注册链接:http://bit.ly/Zs3wms


这次采访由乔治·希尔(George Hill)进行,并发表在《大数据创新》杂志上。


您的预测是什么样的反应?


大部分的反应都集中在研究民意测验的人与流行的专家和评论员的“直觉”预测之间的准确性差异上。 在选举日,像我这样的数据分析员,内特·西尔夫(纽约时报FiveThirtyEight博客),西蒙·杰克曼(斯坦福大学和赫芬顿邮报)和山姆·王(普林斯顿选举联合会)都将奥巴马的连任机会定在90%以上,并且正确地预见到了这一点。 332票对奥巴马来说是最有可能的结果。 同时,卡尔·罗夫(Karl Rove),乔治·威尔(George Will)和史蒂夫·福布斯(Steve Forbes)等专家表示,罗姆尼将获胜-在某些情况下很容易。 这引起了人们对“量化制胜利”的谈论,我希望这种胜利将延续到未来的选举中。


您如何评估预测中使用的算法?


我的预测模型从6月开始估算了竞选活动的每一天的州投票结果和最终选举人票。 我希望对这些预测的评估尽可能公正,客观-如果错误的话,请不要给我任何回旋余地。 因此,在大选前大约一个月,我在自己的网站上发布了一套八个评估标准,一旦知道结果,便会使用这些标准。 事实证明,该模型运行良好。 它在整个夏天预测,奥巴马将赢得除印第安纳州和北卡罗来纳州之外的所有2008年州,即使在9月份对奥巴马的支持稍有增加之后,但在第一次总统辩论后就有所下降之后,奥巴马的预测几乎没有改变。


独立分析师和营销团队在整个营销活动中使用的数据量巨大,这对2016年的数据使用量有何影响?


2012年的竞选活动证明,可以管理,信任和成功地将多种多样的定量信息源成功地用于各种目的。 我们的局外人能够提前预测选举结果。 在竞选活动中,在选民定位,意见追踪,筹款和选民投票方面取得了巨大进步。 既然我们知道这些方法都行得通,那么我认为已经没有回头路了。 我希望记者和竞选评论员会在2016年更加认真地进行调查汇总。尽管奥巴马和民主党目前似乎在竞选技术上占有优势,但如果共和党人赶不上赶上,我会感到惊讶。


您是否认为此数据驱动型营销活动的成功意味着营销活动经理现在需要既是分析师又是战略家?


竞选经理可能不必自己是分析师,但他们应该对如何利用数据和技术发挥自己的优势有更大的了解。 竞选活动一直使用调查研究来制定策略和衡量选民情绪。 但是现在有一系列其他强大的工具可供使用:社交网站,选民数据库,移动智能手机和电子邮件营销,仅举几例。 这是轮询方法和统计意见建模的最新进展。 现在,美国竞选政治正在发生许多创新。


您设法在6个月前预测了选举结果,您认为使用分析技术准确预测结果的现实最大时限是什么?


大约四到五个月后,科学就可以让我们立即前进。 甚至推动了一点。 在此之前,民意测验还不足以告知最终结果:太多人不确定或尚未开始关注竞选活动。 一旦我们超出了大约4-5个月的范围,已证明与选举结果相关的历史经济和政治因素也开始失去其预测能力。 幸运的是,这仍然为竞选活动提供了充足的时间来制定战略并就如何分配资源做出决策。

使用算法预测选举:与drew linzer聊天