R语言网页爬虫

2024-01-23 02:20•Java教程•阅读 1184

R 是统计计算和数据分析的利器。给定一个数据集，利用前几章介绍到的 R 中灵活的

数据结构或高性能计算，我们可以很方便地进行数据转换、建模和数值分析。

一般来说，商业数据库会将数据以表格的形式很好地组织起来，便于使用。然而，情

况并非总是如此合意，输入数据集也并非总是立即可得。有时，我们需要自己收集数据。

对于很多研究领域而言，网页内容是一个重要的数据源。为了从互联网上收集（抓取或收

取）数据，我们需要适当的技术和工具。本章将会介绍网络爬虫的基本知识和工具，包括：