当前位置：宝阳读书小站 > 计算机类 > 正文

《网络爬虫全解析：技术、原理与实践》-罗刚

2024-07-13 分类：计算机类 () 评论(0)

《网络爬虫全解析：技术、原理与实践》-罗刚

内容简介:

本书介绍了如何开发网络爬虫。内容主要包括开发网络爬虫所需要的Java语法基础和网络爬虫的工作原理，如何使用开源组件HttpClient和爬虫框架Crawler4j抓取网页信息，以及针对抓取到的文本进行有效信息的提取。为了扩展抓取能力，本书介绍了实现分布式网络爬虫的关键技术。__eol__另外，本书介绍了从图像和语音等多媒体格式文件中提取文本信息，以及如何使用大数据技术存储抓取到的信息。最后，以实战为例，介绍了如何抓取微信和微博，以及在电商、医药、金融等领域的案例应用。其中，电商领域的应用介绍了使用网络爬虫抓取商品信息入库到网上商店的数据库表。医药领域的案例介绍了抓取PubMed医药论文库。金融领域的案例介绍了抓取股票信息，以及从年报PDF文档中提取表格等。

下载地址:

此站大部分下载链接失效了，以后只在新的网站更新维护。新的电子书网址：https://www.mq59.com

[ARFormslite id=100]

赞(0) 打赏

免责声明：本站所有资源来源于互联网，仅供个人学习交流，网站本身不存储任何相关资源文件，如资源下载链接侵犯到版权方，请发送邮件到1401211620@qq.com，站长核实后会第一时间移除，谢谢!
请于下载后24小时内删除，不允许用于商业用途，否则法律问题自行承担。

相关推荐

宝阳读书小站-mobi+epub+azw3+pdf电子书免费下载

联系我们关于我们

客服微信ceyilmy
复制微信号
QQ咨询
回顶部