SplitCheck
Вернуться к статьям
Технологии

AI в распознавании чеков: как это работает

9 декабря 2025
7 минут чтения

Когда вы загружаете фото чека в SplitChek, за считанные секунды получаете список товаров с ценами. Но как это работает? Разбираемся в технологиях OCR и AI-парсинга.

Что такое OCR?

OCR (Optical Character Recognition)

Технология оптического распознавания текста. Превращает изображение с текстом в машиночитаемые символы.

OCR используется везде: от сканирования документов до распознавания номеров автомобилей. В случае с чеками задача сложнее — нужно не просто “прочитать” текст, но и понять его структуру.

Этапы обработки чека

1

Предобработка изображения

Выравнивание, удаление шумов, повышение контраста. Помятый или смятый чек “разглаживается” алгоритмически.

2

OCR распознавание

Мы используем Yandex Cloud Vision API — один из лучших движков для русского текста. Точность распознавания — до 99% на качественных фото.

3

AI-парсинг структуры

Нейросеть DeepSeek анализирует текст и выделяет: названия товаров, количество, цены за единицу, итоговые суммы, НДС.

4

Валидация и исправление

Проверяем математику: сумма позиций должна сходиться с итогом. Если нет — AI пытается найти и исправить ошибку.

Почему нужен AI, а не просто OCR?

Чистый OCR выдаёт “сырой” текст. Вот пример:

МАГНИТ КОСМЕТИК
ИНН 7728601190
Кассир Светлана
--------------------------------
Шампунь Head&Shoulders    299.90
Зуб.паста Колгейт         89.90
Мыло хоз. 72%      x2     45.90
                   ИТОГО: 435.70
НДС 20%:                   72.62
--------------------------------

OCR “увидит” этот текст, но не поймёт:

  • ❌ Что “x2” означает количество 2 штуки
  • ❌ Что 45.90 — это цена за единицу, а не за две
  • ❌ Что строка “ИТОГО” — это не товар
  • ❌ Что “НДС” не нужно включать в позиции

Вот тут вступает AI

Языковая модель “понимает” структуру чека и корректно парсит данные в структурированный формат с полями: название, количество, цена, сумма.

Сложности с чеками

Чеки — один из самых сложных типов документов для распознавания:

📸 Качество фото

Мятые чеки, блики, тени, низкое разрешение

🔤 Шрифты

Термопечать со временем выцветает, буквы “плывут”

📐 Форматы

Каждая сеть магазинов имеет свой формат чека

✂️ Сокращения

“Кур.гр. б/к охл” = Куриная грудка без кости охлаждённая

Наш технологический стек

Yandex Cloud Vision — OCR движок
DeepSeek AI — парсинг структуры
Асинхронная обработка — быстрый отклик интерфейса

Советы для лучшего распознавания

  1. 1
    Хорошее освещение

    Избегайте теней и бликов

  2. 2
    Весь чек в кадре

    Не обрезайте края и итоговую сумму

  3. 3
    Расправьте чек

    Складки усложняют распознавание

  4. 4
    Контрастный фон

    Положите чек на однотонную поверхность

Попробуйте сами!

Загрузите фото чека и посмотрите, как AI распознает его за секунды.

Загрузить чек