干货 Tips Rules & Tips
1. 遵守中国大陆相关法律法规
2. 本版还在调整当中

如何用 Python 爬取网页内容?

查看: 5523|回复: 5
1
薛定小饿猫 发表于 2018-10-31 09:22:10
本帖最后由 撩月 于 2018-10-31 09:42 编辑

请问如何用 Python 抓取网页上的有效内容,并自动填入 Excel?比如有时候要统计某家公司的涉诉情况,但是打开裁判文书网一看,判决书多达几百份,一份份看费时费力,如何实现用程序爬取原被告、法院、时间、判决金额、诉讼费等内容并填入 Excel?
小荷有香气 发表于 2018-10-31 11:11:09
推荐 Web Scraper插件,这个爬虫软件,不需要写代码就可以爬取简单的网页。百度“web scraper 教程” 就可以。
赵云007 发表于 2018-10-31 09:39:26
不同网站不一样,必须来个网站 看看
撩月 发表于 2018-10-31 09:41:32
这得是系统学习下 Python 爬虫和数据自动化处理的相关知识了,不是给你扔个工具你马上就可以用的
 楼主| 薛定小饿猫 发表于 2018-10-31 14:48:06
小荷有香气 发表于 2018-10-31 11:11
推荐 Web Scraper插件,这个爬虫软件,不需要写代码就可以爬取简单的网页。百度“web scraper 教程” 就可 ...

谢谢!我先试一下
 楼主| 薛定小饿猫 发表于 2018-10-31 14:49:01
撩月 发表于 2018-10-31 09:41
这得是系统学习下 Python 爬虫和数据自动化处理的相关知识了,不是给你扔个工具你马上就可以用的 ...

嗯,会系统的学,然后实现更多的用法,目前主要是为了方便统计数据
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

虫部落 陕ICP备14001577号-1川公网安备 51019002003015号联系我们FAQ关于虫部落免责声明虫部落生存法则蛙先知 - AI 玩家社区 🚧

Build with for "make search easier" Copyright © 2013-2024. Powered by Discuz! GMT+8, 2024-5-4 20:43

快速回复 返回顶部 返回列表