问:
新的机器学习功能如何使财务数据的股票文档挖掘成为可能?
A:机器学习和AI令人兴奋的新领域之一是,科学家和工程师正在着手各种方法来使用全新类型的资源来预测库存移动和投资成果。 这是金融界的巨大变革者,将以非常深刻的方式彻底改变投资策略。
计算语言学是扩展这类股票研究的基础思想之一,它涉及自然语言的建模。 专家们正在研究如何使用文本文件(从SEC文件到股东函件再到其他外围的基于文本的资源),以增强或优化股票分析或开发全新的分析。
免费下载: 机器学习及其重要性 |
重要的免责声明是,只有通过神经网络,机器学习和自然语言分析方面的全新进步,才能使所有这些成为可能。 在ML / AI出现之前,计算技术大多使用线性编程来“读取”输入。 文本文档过于结构化,无法使用。 但是随着最近几年自然语言分析的进步,科学家发现可以“挖掘”自然语言以获得可量化的结果,换句话说,可以用某种方式计算出的结果。
一些最好的证据和最有用的例子来自网上的各种论文和博士论文。 在2016年4月发表的题为《机器学习和计算语言学在金融经济学中的应用》的论文中,Lili Gao解释了特定于公司SEC文件,股东电话和社交媒体消息挖掘的相关过程。
高写道:“从非结构化和高维文本数据中提取有意义的信号并非易事。” “但是,随着机器学习和计算语言技术的发展,可以完成文本文档任务的处理和统计分析,并且统计文本分析在社会科学中的许多应用已被证明是成功的。” 从高对抽象的建模和校准的讨论中,整个开发文档显示了这类分析中的某些细节的工作原理。
活跃项目的其他来源包括GitHub项目简介之类的页面,以及该IEEE资源,专门讨论如何从“ Twitter情绪分析”中获取有价值的财务信息。
最重要的是,这些新的NLP模型的使用正在推动使用各种文本文档的快速创新,不仅用于财务分析,还用于其他类型的前沿发现,这模糊了传统上在“语言”和“语言”之间建立的界限。 “数据。”
