БЫСТРОЕ И ВЫСОКОТОЧНОЕ ПРЕОБРАЗОВАНИЕ ХАФА С ВЫЧИСЛИТЕЛЬНОЙ СЛОЖНОСТЬЮ Θ(wh log3 w) ДЛЯ ОБРАБОТКИ ПРЯМОУГОЛЬНЫХ ИЗОБРАЖЕНИЙ ПРОИЗВОЛЬНОГО РАЗМЕРА

Обложка
  • Авторы: Казимиров Д.Д1,2,3, Николаев Д.П3,4
  • Учреждения:
    1. Институт проблем передачи информации им. А.А. Харкевича РАН
    2. Московский государственный университет им. М.В. Ломоносова
    3. ООО «Смарт Энджинс Сервис»
    4. Федеральный исследовательский центр «Информатика и управление» РАН
  • Выпуск: Том 61, № 4 (2025)
  • Страницы: 41-58
  • Раздел: Обработка изображений
  • URL: https://medbiosci.ru/0555-2923/article/view/363551
  • DOI: https://doi.org/10.7868/S3034583925040032
  • ID: 363551

Цитировать

Полный текст

Открытый доступ Открытый доступ
Доступ закрыт Доступ предоставлен
Доступ закрыт Только для подписчиков

Аннотация

Преобразование Хафа (ПХ) является ключевым инструментом цифровой обработки изображений, применяемым в широком спектре научных задач – от распознавания документов до компьютерной томографии. Алгоритмические реализации ПХ традиционно оцениваются по двум параметрам: вычислительной сложности и точности, которая определяется как ошибка аппроксимации непрерывных прямых дискретными, формируемыми в ходе выполнения алгоритма. Быстрые алгоритмы ПХ (БПХ) с оптимальной линейно-логарифмической вычислительной сложностью хорошо изучены – примером является классический алгоритм Брейди – Ёна, применимый исключительно к изображениям с линейными размерами, равными степеням двойки. Его обобщения, такие как алгоритм FHT2DT, позволяют обрабатывать прямоугольные изображения произвольного размера, но точность реализуемого ими ПХ низкая, причем она уменьшается при увеличении размера обрабатываемого изображения. Существуют также алгоритмы ПХ, сохраняющие ограниченную сверху ошибку аппроксимации для изображений любого размера. Они обеспечивают более высокую точность, но их вычислительная сложность приближается к кубической, что делает их малопригодными при обработке больших изображений. В настоящей статье предложен алгоритм FHT2SP, сочетающий скорость, близкую к оптимальной, с высокой точностью. Алгоритм характеризуется вычислительной сложностью вида Θ(wh log3 w) при обработке изображений размера w × h. При этом предложенный алгоритм гарантирует ортотропную ошибку аппроксимации непрерывных прямых не более λ + 1/2, независимо от размера изображения и регулируемую управляющим метапараметром λ ∈ (0; 1]. В статье представлена сводная таблица экспериментальных результатов, которая может служить практическим ориентиром для выбора значения метапараметра λ с целью обеспечения баланса между точностью и вычислительной сложностью.

Об авторах

Д. Д Казимиров

Институт проблем передачи информации им. А.А. Харкевича РАН; Московский государственный университет им. М.В. Ломоносова; ООО «Смарт Энджинс Сервис»

Email: d.kazimirov@smartengines.com
Москва, Россия; Москва, Россия; Москва, Россия

Д. П Николаев

ООО «Смарт Энджинс Сервис»; Федеральный исследовательский центр «Информатика и управление» РАН

Email: d.p.nikolaev@smartengines.com
Москва, Россия; Москва, Россия

Список литературы

  1. Hough P.V.C. Machine Analysis of Bubble Chamber Pictures // Proc. 2nd Int. Conf. on High-Energy Accelerators and Instrumentation (HEACC 1959). CERN, Geneva, Switzerland. Sept. 14–19, 1959. P. 554–558.
  2. Rahmdel P.S., Comley R., Shi D., McElduff S. A Review of Hough Transform and Line Segment Detection Approaches // Proc. 10th Int. Conf. on Computer Vision Theory and Applications (VISAPP 2015). Berlin, Germany. Mar. 11–14, 2015. V. 2. P. 411–418. https://doi.org/10.5220/0005268904110418
  3. Hassanein A.S., Mohammad S., Sameer M., Ragab M.E. A Survey on Hough Transform, Theory, Techniques and Applications, https://arxiv.org/abs/1502.02160 [cs.CV], 2015.
  4. Mukhopadhyay P., Chaudhuri B.B. A Survey of Hough Transform // Pattern Recognit. 2015. V. 48. № 3. P. 993–1010. https://doi.org/10.1016/j.patcog.2014.08.027
  5. Алиев М.А., Николаев Д.П., Сараев А.А. Построение быстрых вычислительных схем настройки алгоритма бинаризации Ниблэка // Тр. ИСА РАН. 2014. Т. 64. №3. С. 25–34.
  6. Saha S., Basu S., Nasipuri M., Basu D. A Hough Transform Based Technique for Text Segmentation // J. Comput. 2010. V. 2. № 2. P. 134–141.
  7. Ershova D., Gayer A., Sheshkus A., Arlazarov V.V. An Ultra-lightweight Approach for Machine Readable Zone Detection via Semantic Segmentation and Fast Hough Transform // Document Analysis and Recognition – ICDAR 2024 (Proc. 18th Int. Conf. Athens, Greece. Aug 30 – Sept. 4, 2024. Part IV). Lect. Notes Comput. Sci. V. 14807. Cham: Springer, 2024. P. 359–374. https://doi.org/10.1007/978-3-031-70546-5_21
  8. Безматерных П.В. Нормализация изображения текста с помощью быстрого преобразования Хафа // ИТиВС. 2024. № 4. С. 3–16. https://doi.org/10.14357/20718632240401
  9. Li H., Ma Y., Bao H., Zhang Y. Probabilistic Hough Transform for Rectifying Industrial Nameplate Images: A Novel Strategy for Improved Text Detection and Precision in Difficult Environments // Appl. Sci. 2023. V. 13. № 7. P. 4533 (16 pp.). https://doi.org/10.3390/app13074533
  10. Polevoy D., Gilmanov M., Kazimirov D., Chukalina M., Ingacheva A., Kulagin P., Nikolaev D. Tomographic Reconstruction: General Approach to Fast Back-Projection Algorithms // Mathematics. 2023. V. 11. №23. P. 4759 (37 pp.). https://doi.org/10.3390/math11234759
  11. Polevoy D.V., Kazimirov D.D., Chukalina M.V., Nikolaev D.P. Complexity-Preserving Transposition of Summing Algorithms: A Data Flow Graph Approach // Probl. Inf. Transm. 2024. V. 60. № 4. P. 344–362. https://doi.org/10.1134/S0032946024040057
  12. Polevoy D., Kazimirov D., Gilmanov M., Nikolaev D. No Reproducibility, No Progress: Rethinking CT Benchmarking // J. Imaging. 2025. V. 11. № 10. P. 344 (36 pp.). https://doi.org/10.3390/jimaging11100344
  13. Sheshkus A.V., Chirvonaya A.N., Matveev D.M., Nikolaev D.P., Arlazarov V.L. Vanishing Point Detection with Direct and Transposed Fast Hough Transform Inside the Neural Network // Компьютерная оптика. 2020. Т. 44. № 5. С. 737–745. https://doi.org/10.18287/2412-6179-CO-676
  14. Zhao K., Han Q., Zhang C.-B., Xu J., Cheng M.-M. Deep Hough Transform for Semantic Line Detection // IEEE Trans. Pattern Anal. Mach. Intell. 2021. V. 44. № 9. P. 4793–4806. https://doi.org/10.1109/TPAMI.2021.3077129
  15. Brady M.L., Yong W. Fast Parallel Discrete Approximation Algorithms for the Radon Transform // Proc. 4th Annu. ACM Symp. on Parallel Algorithms and Architectures (SPAA’92). San Diego, California, USA. June 29 – July 1, 1992. P. 91–99. https://doi.org/10.1145/140901.140911
  16. Kazimirov D.D., Rybakova E.O., Gulevskiy V.V., Terekhin A.P., Limonova E.E., Nikolaev D.P. Generalizing the Brady–Yong Algorithm: Efficient Fast Hough Transform for Arbitrary Image Sizes // IEEE Access. 2025. V. 13. P. 20101–20132. https://doi.org/10.1109/ACCESS.2025.3534405
  17. Khanipov T. Computational Complexity Lower Bounds of Certain Discrete Radon Transform Approximations, https://arxiv.org/abs/1801.01054 [cs.CC], 2018.
  18. Карпенко С.М., Ершов Е.И. Исследование свойств диадического паттерна быстрого преобразования Хафа // Пробл. передачи информ. 2021. Т. 57. № 3. С. 102–111. https://doi.org/10.31857/S0555292321030074
  19. Smirnov G., Karpenko S. Analyzing Deviations of Dyadic Lines in Fast Hough Transform, https://arxiv.org/abs/2311.10064 [cs.CV], 2023.
  20. Nikolaev D., Ershov E., Kroshnin A., Limonova E., Mukovozov A., Faradzhev I. On a Fast Hough/Radon Transform as a Compact Summation Scheme over Digital Straight Line Segments // Mathematics. 2023. V. 15. № 15. P. 3336 (22 pp.). https://doi.org/10.3390/math11153336
  21. Khanipov T.M. Ensemble Computation Approach to the Hough Transform, https://arxiv.org/abs/1802.06619 [cs.CC], 2018.
  22. G´omez-C´ardenes ´O., Marichal-Hern´andez J.G., Phillip L¨uke J., Rodr´ıguez-Ramos, J.M. Central and Periodic Multi-Scale Discrete Radon Transforms // Appl. Sci. 2021. V. 11. № 22. P. 10606 (27 pp.). https://doi.org/10.3390/app112210606
  23. Rosenfeld A. Digital Straight Line Segments // IEEE Trans. Comput. 1974. V. 23. № 12. P. 1264–1269. https://doi.org/10.1109/T-C.1974.223845
  24. Brady M.L. A Fast Discrete Approximation Algorithm for the Radon Transform // SIAM J. Comput. 1998. V. 27. № 1. P. 107–119. https://doi.org/10.1137/S0097539793256673
  25. Kazimirov D., Nikolaev D., Rybakova E., Terekhin A. Generalization of Brady–Yong Algorithm for Fast Hough Transform to Arbitrary Image Size // Proc. 5th Symp. on Pattern Recognition and Applications (SPRA 2024). Istanbul, Turkey. Nov. 11–13, 2024. Proc. SPIE. V. 13540. P. 67–72.
  26. Kazimirov D.D., Nikolaev D.P. Fast Hough Transform with Linear-Log-Cubed Computational Complexity for High-Accuracy Processing of Arbitrary-Shaped Images // Probl. Inf. Transm. 2025. V. 61. № 3 (to appear).
  27. Kazimirov D.D., Nikolaev D.P., Rybakova E.O., Terekhin A.P. Efficient In-Place Hough Transform Algorithm for Arbitrary Image Sizes // Probl. Inf. Transm. 2024. V. 60. № 4. P. 363–391. https://doi.org/10.1134/S0032946024040069
  28. Shepp L.A., Logan B.F. The Fourier Reconstruction of a Head Section // IEEE Trans. Nucl. Sci. 1974. V. 21. № 3. P. 21–43. https://doi.org/10.1109/TNS.1974.6499235
  29. IITP Vision Lab., adrt: Approximate Discrete Radon Transform, GitHub repository https://github.com/iitpvisionlab/adrt; Python Package Index (PyPI) https://pypi.org/project/adrtlib. Accessed 2025-05-09.

Дополнительные файлы

Доп. файлы
Действие
1. JATS XML

© Российская академия наук, 2025

Согласие на обработку персональных данных с помощью сервиса «Яндекс.Метрика»

1. Я (далее – «Пользователь» или «Субъект персональных данных»), осуществляя использование сайта https://journals.rcsi.science/ (далее – «Сайт»), подтверждая свою полную дееспособность даю согласие на обработку персональных данных с использованием средств автоматизации Оператору - федеральному государственному бюджетному учреждению «Российский центр научной информации» (РЦНИ), далее – «Оператор», расположенному по адресу: 119991, г. Москва, Ленинский просп., д.32А, со следующими условиями.

2. Категории обрабатываемых данных: файлы «cookies» (куки-файлы). Файлы «cookie» – это небольшой текстовый файл, который веб-сервер может хранить в браузере Пользователя. Данные файлы веб-сервер загружает на устройство Пользователя при посещении им Сайта. При каждом следующем посещении Пользователем Сайта «cookie» файлы отправляются на Сайт Оператора. Данные файлы позволяют Сайту распознавать устройство Пользователя. Содержимое такого файла может как относиться, так и не относиться к персональным данным, в зависимости от того, содержит ли такой файл персональные данные или содержит обезличенные технические данные.

3. Цель обработки персональных данных: анализ пользовательской активности с помощью сервиса «Яндекс.Метрика».

4. Категории субъектов персональных данных: все Пользователи Сайта, которые дали согласие на обработку файлов «cookie».

5. Способы обработки: сбор, запись, систематизация, накопление, хранение, уточнение (обновление, изменение), извлечение, использование, передача (доступ, предоставление), блокирование, удаление, уничтожение персональных данных.

6. Срок обработки и хранения: до получения от Субъекта персональных данных требования о прекращении обработки/отзыва согласия.

7. Способ отзыва: заявление об отзыве в письменном виде путём его направления на адрес электронной почты Оператора: info@rcsi.science или путем письменного обращения по юридическому адресу: 119991, г. Москва, Ленинский просп., д.32А

8. Субъект персональных данных вправе запретить своему оборудованию прием этих данных или ограничить прием этих данных. При отказе от получения таких данных или при ограничении приема данных некоторые функции Сайта могут работать некорректно. Субъект персональных данных обязуется сам настроить свое оборудование таким способом, чтобы оно обеспечивало адекватный его желаниям режим работы и уровень защиты данных файлов «cookie», Оператор не предоставляет технологических и правовых консультаций на темы подобного характера.

9. Порядок уничтожения персональных данных при достижении цели их обработки или при наступлении иных законных оснований определяется Оператором в соответствии с законодательством Российской Федерации.

10. Я согласен/согласна квалифицировать в качестве своей простой электронной подписи под настоящим Согласием и под Политикой обработки персональных данных выполнение мною следующего действия на сайте: https://journals.rcsi.science/ нажатие мною на интерфейсе с текстом: «Сайт использует сервис «Яндекс.Метрика» (который использует файлы «cookie») на элемент с текстом «Принять и продолжить».