适用于Firefox用户的高效OCR扩展
OCR - 图像阅读器是一个为网络开发和IT专业人士设计的Firefox扩展。该工具添加了一个方便的工具栏按钮,使用户能够选择活动窗口中的特定区域,以使用其先进的光学字符识别(OCR)功能捕获和识别文本。基于强大的 tesseract.js 库,它支持超过100种语言,并具有自动文本方向和脚本检测功能。
该扩展离线操作,确保没有服务器端交互,从而增强隐私和性能。首次使用时,可能需要几分钟下载必要的训练数据,但由于缓存,后续使用会更快。该工具特别适用于从图像、PDF文件、PowerPoint幻灯片或具有受限内容的网页中提取文本。它还包括一个进度条,以告知用户OCR处理时间。