AI в распознавании чеков: как это работает
Когда вы загружаете фото чека в SplitChek, за считанные секунды получаете список товаров с ценами. Но как это работает? Разбираемся в технологиях OCR и AI-парсинга.
Что такое OCR?
OCR (Optical Character Recognition)
Технология оптического распознавания текста. Превращает изображение с текстом в машиночитаемые символы.
OCR используется везде: от сканирования документов до распознавания номеров автомобилей. В случае с чеками задача сложнее — нужно не просто “прочитать” текст, но и понять его структуру.
Этапы обработки чека
Предобработка изображения
Выравнивание, удаление шумов, повышение контраста. Помятый или смятый чек “разглаживается” алгоритмически.
OCR распознавание
Мы используем Yandex Cloud Vision API — один из лучших движков для русского текста. Точность распознавания — до 99% на качественных фото.
AI-парсинг структуры
Нейросеть DeepSeek анализирует текст и выделяет: названия товаров, количество, цены за единицу, итоговые суммы, НДС.
Валидация и исправление
Проверяем математику: сумма позиций должна сходиться с итогом. Если нет — AI пытается найти и исправить ошибку.
Почему нужен AI, а не просто OCR?
Чистый OCR выдаёт “сырой” текст. Вот пример:
МАГНИТ КОСМЕТИК
ИНН 7728601190
Кассир Светлана
--------------------------------
Шампунь Head&Shoulders 299.90
Зуб.паста Колгейт 89.90
Мыло хоз. 72% x2 45.90
ИТОГО: 435.70
НДС 20%: 72.62
--------------------------------OCR “увидит” этот текст, но не поймёт:
- ❌ Что “x2” означает количество 2 штуки
- ❌ Что 45.90 — это цена за единицу, а не за две
- ❌ Что строка “ИТОГО” — это не товар
- ❌ Что “НДС” не нужно включать в позиции
Вот тут вступает AI
Языковая модель “понимает” структуру чека и корректно парсит данные в структурированный формат с полями: название, количество, цена, сумма.
Сложности с чеками
Чеки — один из самых сложных типов документов для распознавания:
📸 Качество фото
Мятые чеки, блики, тени, низкое разрешение
🔤 Шрифты
Термопечать со временем выцветает, буквы “плывут”
📐 Форматы
Каждая сеть магазинов имеет свой формат чека
✂️ Сокращения
“Кур.гр. б/к охл” = Куриная грудка без кости охлаждённая
Наш технологический стек
Советы для лучшего распознавания
- 1Хорошее освещение
Избегайте теней и бликов
- 2Весь чек в кадре
Не обрезайте края и итоговую сумму
- 3Расправьте чек
Складки усложняют распознавание
- 4Контрастный фон
Положите чек на однотонную поверхность
