OCR 服务接口文档

版本: 1.1.1 (Update)

外网 Base URL: https://qd.zhaopinzao8dian.com/ocr-api
内网 Base URL: http://127.0.0.1:9001

支持格式: 图片 (JPG/PNG), PDF, Excel (.xlsx / .xls), PPT (.pptx / .ppt)

通用响应结构

所有接口请求成功均返回如下 JSON 结构:

{
  "code": 200,                // 业务状态码 (200成功, 500错误)
  "data": "识别出的文本内容...", // 具体的文本结果
  "cost_time_ms": 150.5,      // 处理耗时 (毫秒)
  "msg": ""                   // 错误信息 (仅出错时存在)
}

1. 文件上传识别

POST /ocr

通过 `multipart/form-data` 表单上传本地文件进行识别。

请求参数 (Form-Data)

参数名 类型 必填 说明
file File 二进制文件流。
支持:图片, PDF, Excel(.xlsx/.xls), PPT(.pptx/.ppt)

CURL 示例 (内网)

curl -X POST -F "file=@/path/to/old_data.xls" http://127.0.0.1:9001/ocr

响应示例

{
  "code": 200,
  "data": "--- Sheet: Sheet1 ---\n这里是Excel中的文本内容...",
  "cost_time_ms": 320.5
}

2. URL 网络文件识别

POST /ocr/url

提交一个可访问的文件链接,服务自动下载并识别。

请求头 (Headers)

请求参数 (JSON Body)

参数名 类型 必填 说明
url String 完整的下载链接 (需以 http/https 开头)

CURL 示例 (内网)

curl -X POST -H "Content-Type: application/json" \
     -d '{"url": "https://example.com/legacy_slides.ppt"}' \
     http://127.0.0.1:9001/ocr/url

⚠️ 注意事项