API для распознавания сканированных документов (OCR API) — это инструменты, которые позволяют извлекать текст из изображений (картинок jpeg), PDF-файлов и сканированных документов в машинный формат. Они используют алгоритмы машинного обучения и компьютерного зрения для распознавания текста.
| Метод | POST |
|---|---|
| URL | /api/recognize |
| Параметр | Тип | Обязательный | Описание | По умолчанию | Пример |
|---|---|---|---|---|---|
content |
body | Да | "base64 encoded image (обязательный)" | - | - |
mimeType |
body | Да | "image/jpeg" или "PDF" | "image/jpeg" |
"image/jpeg" |
model |
body | Да | "passport" или "page" или "license_car" | "passport" |
"passport" |
languageCodes |
body | Нет | ["ru", "en"] | ["ru", "en"] |
["ru", "en"] |
Для использования этого API отправьте запрос на:
POST /api/recognize
Обязательно укажите ваш API ключ в заголовке:
X-API-Key: ваш_api_ключ
Или в параметре URL:
/api/recognize?api_key=ваш_api_ключ&content=-&mimeType="image/jpeg"&model="passport"&languageCodes=["ru", "en"]
{
"result": {
"textAnnotation": {
"fullText": "Распознанный текст с изображения",
"pages": [
{
"property": {},
"width": 800,
"height": 600,
"blocks": [
{
"boundingBox": {},
"lines": [
{
"boundingBox": {},
"words": [
{
"boundingBox": {},
"text": "Распознанный",
"confidence": 0.99
}
]
}
]
}
]
}
]
}
}
}
{
"result": []
}
{
"error": "Invalid base64 content"
}