文字识别页面当前能做什么？

当前提供图片转文字和 PDF 文字识别两类在线 OCR 能力，适合提取截图、扫描件、拍照图片和 PDF 中的文字内容。

这里支持视频 OCR 或表格识别吗？

不支持。当前页面只围绕图片转文字和 PDF 文字识别两个方向，不提供视频 OCR、语音 OCR、表格识别或开放 API。

OCR 识别结果可以直接复制吗？

可以。子工具页会直接展示识别出的文本内容，便于复制、校对和下载整理。

先选你要识别的文件类型

如果你手里是截图、拍照图片或扫描图片，就进图片转文字；如果是 PDF 文件，就进 PDF 文字识别。两页都会直接给出可复制的文本结果。

🖼️

图片转文字

上传图片后在线提取文字，适合截图、扫描件和拍照文字识别

适合截图、拍照图片、扫描件、海报、表单截图

→

📄

PDF文字识别

上传 PDF 后在线识别全文文字，支持分页查看和文本下载

适合合同、报告、扫描版 PDF、资料汇总

→

OCR 文字识别入口

文字识别

这里聚焦两类最常见的在线 OCR 需求：图片转文字，以及 PDF 文字识别。你上传文件后，页面会直接展示可复制文本，适合整理截图内容、扫描件文字、拍照资料和 PDF 文档内容。

OCR文字识别图片转文字提取图片文字 PDF文字识别在线OCR

2 类高频 OCR 工具 图片转文字、PDF 文字识别分开处理，输入更清楚

结果直接可复制 不是只给下载文件，页面里会直接显示识别文本

适合办公与资料整理 把截图、扫描 PDF 和拍照资料里的文字快速提出来

哪些场景适合用在线文字识别

核心不是“炫技识别”，而是把你原本不方便复制的文字快速变成可编辑文本

截图内容整理

聊天截图、系统提示、课程截图、公众号图片里的文字往往无法直接复制。图片转文字能把这些内容先提出来，再继续整理、归档或摘录。

扫描件二次编辑

合同扫描件、拍照件、纸质资料扫描图看得到却改不了。OCR 能先把正文提出来，后续再复制进文档做编辑或检索。

PDF 文档摘录重点

当 PDF 是扫描版或图片型页面时，普通复制经常拿不到正文。PDF 文字识别更适合把多页内容抽出来，再按页校对和摘录。

资料录入与归档

票据、表单、活动海报、课堂笔记照片等内容，先做 OCR 再整理到 Excel、文档或知识库，效率通常比手打高得多。

怎么选图片转文字还是 PDF 文字识别

先看你手里的源文件类型，再看结果是否需要按页理解

源文件是单张图片

如果是 JPG、PNG、截图、拍照图片或扫描图，优先用图片转文字。它更适合快速拿到一张图里的正文内容。

源文件是 PDF

如果是多页 PDF、扫描版 PDF 或导出的资料包，优先用 PDF 文字识别。它会围绕多页文档输出全文和分页结果。

先看清晰度再识别

无论是图片还是 PDF，模糊、倾斜、遮挡和压缩痕迹都会影响识别效果。先选更清晰的源文件，结果通常会更稳。

识别后记得人工校对

OCR 非常适合“先提取、后整理”，但对表格、章印、手写体、复杂排版和生僻字仍可能出现误差，重要内容建议再校对一遍。

为什么这里不做成一个大而全的 OCR 页

把不同输入混在一起，往往会让操作和结果都变得更混乱

图片和 PDF 分开更好用

图片 OCR 更像单文件快速提取，PDF OCR 更像文档型任务。分开后文件限制、提示文案和结果展示都更清楚。

结果区更贴近实际任务

图片页聚焦一段可复制正文；PDF 页则更关注全文和分页结果。如果放在一个表单里，结果区很容易变成四不像。

能力边界更明确

这里当前只做图片转文字和 PDF 文字识别，不顺带承诺视频 OCR、表格识别、公式识别或 API 服务，避免用户预期失真。

更适合长期扩展

如果以后真的要加表格 OCR 或票据识别，也应该作为新的独立产品能力来规划，而不是继续把所有方向塞进同一个入口里。

常见问题

先把用户最容易误会的边界说清楚

在线文字识别现在支持哪些方向？ ▼

当前只提供两类正式能力：图片转文字，以及 PDF 文字识别。它们分别对应单张图片 OCR 与多页 PDF OCR 的高频需求。

这里是不是也支持视频 OCR、语音 OCR 或表格识别？ ▼

不是。当前页面没有这些能力，也不会在文案里暗示已经上线。你在这里看到的就是当前正式可用的范围。

OCR 结果能直接复制吗？ ▼

可以。图片转文字页和 PDF 文字识别页都会直接展示识别文本，你可以在页面里复制，也可以下载导出的文本结果。

为什么品牌词很多，这里却不做成竞品导航？ ▼

因为这个专题的核心任务是“帮你把文件里的文字提出来”，不是做扫描王、夸克扫描王、百度 OCR 或 Tesseract 的聚合介绍。品牌词只会作为选择工具时的补充语境，而不是页面主任务。