图片文字识别

基于 Tesseract OCR 引擎，支持多语言识别与多格式导出

0 已处理图片

10+ 支持语言

95%+ 识别准确率

支持 PNG, JPG, JPEG, BMP, TIFF, WEBP 格式

最大文件大小: 16MB

识别语言

识别灵敏度: 30

10 - 宽松
识别更多，可能有误 70 - 严格
精确识别，可能遗漏

提示：根据图片清晰度调整此值，识别效果不佳时可降低灵敏度

图像预处理

使用指南

建议语言选择「中英文混合」，灵敏度 25-40，预处理用「自适应阈值」。

建议灵敏度 45-60，预处理尝试「全局二值化」，可提升干净背景下的识别稳定性。

建议先尝试「降噪处理」，灵敏度 20-35；如有漏字可适当降低灵敏度。

1. 为什么识别结果为空或很少？: 可能是图片过于模糊、文字太小或背景干扰较多。可以尝试降低灵敏度，或切换预处理模式（自适应阈值/降噪/二值化）。
2. 识别出来的文字顺序不对怎么办？: 复杂版式（表格、多列排版）可能影响行顺序。可尝试更清晰的截图、裁剪到正文区域，或用更严格的灵敏度减少噪声文字块。
3. 支持哪些图片格式和大小？: 支持 PNG、JPG、JPEG、BMP、TIFF、WEBP；单张图片最大 16MB。
4. 上传的图片会被保存吗？: 识别过程需要在服务端临时处理图片文件。处理完成后会按后端策略清理临时文件；如涉及隐私内容，建议先对敏感信息打码后再上传。

本工具用于从图片中提取文字内容，适合截图、扫描件、拍照文档等场景。识别引擎为 Tesseract OCR，可在不同语言与预处理策略之间切换，以适配不同的图片质量。

提示：如果是手机拍照文件，优先保证文字清晰、对焦准确、光照均匀，并尽量裁剪掉无关背景，可明显提升识别效果。