目录:
定义-Web挖掘是什么意思?
Web挖掘是使用数据挖掘技术和算法通过从Web文档和服务,Web内容,超链接和服务器日志中提取信息来直接从Web提取信息的过程。 Web挖掘的目标是通过收集和分析信息来查找Web数据中的模式,以便深入了解趋势,行业和一般用户。Techopedia解释了Web挖掘
Web挖掘是数据挖掘的一个分支,专注于以万维网作为主要数据源,包括其所有组件,从Web内容到服务器日志,再到介于两者之间的所有内容。 从Web挖掘的数据的内容可能是网页要包含的事实的集合,并且可能由文本,结构化的数据(例如列表和表格)甚至图像,视频和音频组成。
Web挖掘的类别:
- Web内容挖掘-这是从网页和Web文档的内容中挖掘有用信息的过程,这些内容主要是文本,图像和音频/视频文件。 该学科中使用的技术已从自然语言处理(NLP)和信息检索中大量汲取。
- Web结构挖掘-这是通过使用图论来分析网站的节点和连接结构的过程。 可以从中获得两点:一个关于网站与其他网站的连接方式的结构以及关于每个页面如何连接的网站本身的文档结构。
- Web使用情况挖掘-这是从服务器日志中提取模式和信息以了解用户活动的过程,其中包括用户来自何处,多少点击了网站上的哪些项目以及网站上进行的活动的类型。
