干货 Tips Rules & Tips
1. 遵守中国大陆相关法律法规
2. 本版还在调整当中

奇技淫巧! 怎么快速找到缺少的那页 pdf ?

查看: 1659|回复: 8
2
yufeiflynn 发表于 2024-8-13 11:15:37
https://f.ws28.cn/f/etudcbzfdt6 复制链接到浏览器打开

这个是 pdf,自带得有底部页码,但是中间少了一页,大家有什么方法快速定位到吗?我已经通过一页页对找到了,但是探索精神不止,希望看到精彩的回答
莉莉特 发表于 2024-8-13 17:06:31
莉莉特 发表于 2024-8-13 17:05
先取原页码的中位数134,定位发现页码一致,于是缩小范围到134-267之间,再用同样的方法操作几次就锁定了, ...

数学知识忘光了,经朋友提醒知道这是数学里的“二分法”
莉莉特 发表于 2024-8-13 17:05:11
先取原页码的中位数134,定位发现页码一致,于是缩小范围到134-267之间,再用同样的方法操作几次就锁定了,缺P210。
 楼主| yufeiflynn 发表于 2024-8-13 17:14:55
莉莉特 发表于 2024-8-13 17:06
数学知识忘光了,经朋友提醒知道这是数学里的“二分法”

我试试
 楼主| yufeiflynn 发表于 2024-8-13 17:17:37
莉莉特 发表于 2024-8-13 17:06
数学知识忘光了,经朋友提醒知道这是数学里的“二分法”

就是多试了几次,也是相对比较简单的方法了
Ease 发表于 2024-8-14 11:37:53
因为这是图片类型的PDF,所以不能通过查找文字的方式来查找页码。
量少的话人工用二分法。
量大的话不能用人眼看了,将PDF导出为一张张图片,再将各图片裁剪剩页码,再识别图片中的文字,再提取页码,判断页码从哪里开始不连续。
 楼主| yufeiflynn 发表于 2024-8-14 12:00:49
Ease 发表于 2024-8-14 11:37
因为这是图片类型的PDF,所以不能通过查找文字的方式来查找页码。
量少的话人工用二分法。
量大的话不能用 ...

对,二分法其实挺好用的
cress2002 发表于 2024-8-17 09:17:34
先转换图片pdf至文字docx,考验你的OCR武器库,之后把docx扔给ai,让它帮识别,注意这个AI必须支持长文本。
这是通解,二分法面对缺失多页,就难以招架了。
 楼主| yufeiflynn 发表于 2024-8-19 09:09:11
cress2002 发表于 2024-8-17 09:17
先转换图片pdf至文字docx,考验你的OCR武器库,之后把docx扔给ai,让它帮识别,注意这个AI必须支持长文本。 ...

确实,相对来说,二分法挺适用这个问题的
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

虫部落 陕ICP备14001577号-1川公网安备 51019002003015号联系我们FAQ关于虫部落免责声明虫部落生存法则社区广场

Build with for "make search easier" Copyright © 2013-2024. Powered by Discuz! GMT+8, 2024-10-8 05:38

快速回复 返回顶部 返回列表