搜索 AI Search Rules & Tips
1. 遵守中国大陆相关法律法规
2. 请勿滥用 AI 答案作为跟帖
3. 推荐:Free ChatGPT List
4. AI 作品:〈云游博物馆〉

代理文档提取,超越传统 OCR 文本提取:通过视觉上下文实现智能文档理解

查看: 955|回复: 1
CloseAI 发表于 2025-2-28 11:29:01
PDF 文件通过布局、图表、图形等直观地表示信息,而不仅仅是文本。而目前文本推理模型对上传的 PDF 文档中复杂表格的提取和理解能力不足。

LandingAI  推出的代理文档提取(Agentic Document Extraction)与传统的 OCR 和大多数专注于提取文本的 PDF 到文本方法不同,代理方法从包含文本、表格、图片、图表和其他信息的复杂文档中提取结构化信息。API 以分层格式返回提取的数据并精确定位每个元素的准确位置。

image-61.webp

在线体验:https://va.landing.ai/demo/doc-extraction

产品才上线,目前还只能上传最多两页(最大 50MB)。

工作中有这方面需求的虫友可以关注下这类 AI 产品。
青烟白发 发表于 2025-3-8 08:51:43
为什么你的头像能动?
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

虫部落 陕ICP备14001577号-1川公网安备 51019002003015号联系我们FAQ关于虫部落免责声明虫部落生存法则社区广场RSS

Build with for "make search easier" Copyright © 2013-2025. Powered by Discuz! GMT+8, 2025-5-2 05:52

快速回复 返回顶部 返回列表