摸鱼 生活 Rules & Tips
1. 遵守中国大陆相关法律法规
2. 推崇善意、理性的交流方式
3. 反对无病呻吟
4. 不要轻易对他人的选择下定义
5. 反对性别、种族、职业等歧视
6. 发帖留联系方式请加密 Base64
7. 提倡独立思考,反对无脑跟风

关于爬虫,没有用过爬虫,如果我想用爬虫爬取数据,能不能做到

查看: 5966|回复: 9
1
飞流 发表于 2023-7-29 22:40:13
能不能随便爬数据呢?
应该怎么操作?
望虫友指点迷津
星辰无生 发表于 2023-8-17 10:03:29
八爪鱼确实比较简单基础,但是模拟人工翻页抓取的模式,抓取比较慢,昨天我跑了八个小时,才抓了10万条数据(动态网页,每页只显示20条数据),然后我也学过点python,最近在学抓包,推荐一下Fiddler抓包工具,这个工具很强,教程如下
https://www.cnblogs.com/GeekerJun/p/16259224.html
顺溜 发表于 2023-7-30 23:53:29
八爪鱼也行,网上有教程
tgwl 发表于 2023-7-30 08:14:47
如要爬取网页数据,用python+bs4就足够了,bs4看看文档足矣上手
羚芈 发表于 2023-7-30 10:32:58
如果你的意思是不会 Python 等软件,那么 Excel 可以抓取数据,表格类型得到的结果格式也规整;还有很多数据采集器,比如后羿采集器,简单点选即可抓取。基础的爬虫差不多能满足,教程网上也有不少。
 楼主| 飞流 发表于 2023-7-30 21:17:29
羚芈 发表于 2023-7-30 10:32
如果你的意思是不会 Python 等软件,那么 Excel 可以抓取数据,表格类型得到的结果格式也规整;还有很多数 ...

好,多谢
王昼 发表于 2023-8-17 09:39:30
八爪鱼,高中信息老师教的就是这个,零基础傻瓜式使用方式
 楼主| 飞流 发表于 2023-8-17 21:20:35
星辰无生 发表于 2023-8-17 10:03
八爪鱼确实比较简单基础,但是模拟人工翻页抓取的模式,抓取比较慢,昨天我跑了八个小时,才抓了10万条数据 ...

多谢多谢我试试
柚子 发表于 2023-8-17 22:27:01
网上有很多爬虫教程,可以搜索自学,爬虫入门不难,学点python基础就可以很快上手。
xyy 发表于 2024-4-16 10:39:40
星辰无生 发表于 2023-8-17 10:03
八爪鱼确实比较简单基础,但是模拟人工翻页抓取的模式,抓取比较慢,昨天我跑了八个小时,才抓了10万条数据 ...

谢谢
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

虫部落 陕ICP备14001577号-1川公网安备 51019002003015号联系我们FAQ关于虫部落免责声明虫部落生存法则社区广场RSS

Build with for "make search easier" Copyright © 2013-2025. Powered by Discuz! GMT+8, 2025-6-20 17:48

快速回复 返回顶部 返回列表