Використання багатошарової LSTM-нейромережі в процесі розпізнавання друкованих текстів

Автор(и)

DOI:

https://doi.org/10.31866/2617-796X.5.1.2022.261305

Ключові слова:

нейронні мережі, навчання нейронних мереж, розпізнавання образів, система розпізнавання друкованих текстів

Анотація

Метою статті є дослідження, аналіз і розгляд загальних проблем та перспектив щодо розробки систем розпізнавання друкованих текстів на основі використання нейронних мереж.

Методами дослідження є методи семантичного аналізу основних понять цієї предметної сфери (системи розпізнавання друкованих текстів). Розглянуто підходи до розробки та функціонування систем розпізнавання на основі нейромереж.

Новизною проведеного дослідження є розробка власного підходу до розпізнавання текстів на основі нейронних мереж, результати якого використано під час розробки власної системи розпізнавання друкованих текстів.

Висновки. У роботі розглянуто відомі погляди щодо розпізнавання образів на прикладі друкованих текстів, проаналізовано сучасні підходи з використанням нейромереж та їх навчанням. Ураховуючи результати проведеного аналізу, ухвалено рішення щодо розробки системи розпізнавання мов друкованих текстів з використанням нейромереж, що навчаються.

Біографії авторів

Костянтин Ткаченко, Державний університет інфраструктури та технологій

Кандидат економічних наук, доцент кафедри інформаційних технологій та дизайну

Олексій Зуєнко, Державний університет інфраструктури та технологій

Бакалавр, кафедра інформаційних технологій та дизайну

Посилання

Alekseev, P.P. and Kviatkovskaia, I.Iu., 2021. Primenenie neironnykh setei dlia raspoznavaniia printcipialnykh uslovno-graficheskikh elektricheskikh oboznachenii [The use of neural networks for the recognition of fundamental conventional graphic electrical symbols]. Vestnik Astrakhanskogo gosudarstvennogo tekhnicheskogo universiteta. Seriia: Upravlenie, vychislitelnaia tekhnika i informatika, [online] 2, pp.47-56. Available at: <http://www.mathnet.ru/links/57f0ef0c3d69c2f4645481ceae10f0f4/vagtu669.pdf> [Accessed 25 April 2022].

Bengio, Y., 2009. Learning deep architectures for AI. Foundations and Trends in Machine Learning, 2, pp.1-127.

Bengio, Y., LeCun, Y. and Hinton G. 2015. Deep Learning. Nature, 521. pp.436-444.

Burlieiev, O., Vasylenko, O. and Ivanenko, R., 2021. Efektyvnist vykorystannia shtuchnykh neironnykh merezh v ekonomitsi [Efficiency of use of artificial neural networks in economy]. Ekonomika ta suspilstvo, [online] 31. Available at: <https://doi.org/10.32782/2524-0072/2021-31-27> [Accessed 22 April 2022].

Gers, F., Schraudolph, N. and Schmidhuber, J. 2002. Learning precise timing with LSTM recurrent networks. Journal of Machine Learning Research, 3, pp.115-143.

Girshick, R., 2015. Fast R-CNN. Computer Vision and Pattern Recognition, [online] Available at: <https://arxiv.org/abs/1504.08083> [Accessed 22 April 2022].

Goodfellow, I.J., Pouget-Abadie, J., Mirza, M., Xu, B., Warde-Farley, D., Ozair, S., Courville, A. and Bengio, Y., 2014. Generative Adversarial Networks. Cornell University, [online] 10 June. Available at: <https://arxiv.org/pdf/1406.2661.pdf> [Accessed 25 April 2022].

Leshchynskyi, O.L. and Ishchenko, A.O., 2017. Vykorystannia neiromerezh u protsesi intelektualnoho (klasternoho) analizu danykh [The use of neural networks in the process of intelligent (cluster) data analysis]. Ekonomika ta suspilstvo, [online] 11, pp.578-581. Available at: <https://economyandsociety.in.ua/journals/11_ukr/93.pdf> [Accessed 23 April 2022].

Markova, S.V. and Zhigalov, K.Iu., 2017. Primenenie neironnoi seti dlia sozdaniia sistemy raspoznavaniia izobrazhenii [Application of a neural network to create an image recognition system]. Fundamentalnye issledovaniia, [online] 8 (1), pp.60-64. Available at: <http://www.fundamental-research.ru/ru/article/view?id=41621> [Accessed 25 April 2022].

Oleinik, A., Zybina, E. and Oleinik, E., 2020. Obzor Reshenii Neironnykh Setei Primeniaemykh dlia Raspoznavaniia Obrazov [Overview of Neural Network Solutions Applied to Pattern Recognition]. In: Informatsiini systemy ta tekhnolohii IST-2020 [Information systems and technologies IST-2020]. 9th International Scientific and Technical Conference. Kharkiv, Ukraine, [online] November 17-20, 2020, pp.128-131. Kharkiv: Madrid Printing House. Available at: <https://openarchive.nure.ua/bitstream/document/16163/1/IST-2020-128-131.pdf> [Accessed 25 April 2022].

Schmidhuber, J., 2015. Deep Learning in Neural Networks: An Overview. Neural Networks, 61, pp.85-117.

Stavytskyi, O.V. and Mozolevska, M.O., 2017. Vykorystannia neironnykh merezh dlia prohnozuvannia u finansovii sferi [The use of neural networks for forecasting in the financial sector]. Aktualni problemy ekonomiky ta upravlinnia, [online] 11. Available at: <http://ape.fmm.kpi.ua/article/view/102584> [Accessed 23 April 2022].

Subbotin, S.O., Oliinyk, A.O. and Oliinyk, O.O., 2009. Neiteratyvni, evoliutsiini ta multyahentni metody syntezu nechitkolohichnykh i neiromerezhnykh modelei [Non-iterative, evolutionary and multiagent methods of synthesis of fuzzy and neural network models]. Zaporozhye: ZNTU.

What are Recurrent Neural Networks. [online] Available at: <https://www.ibm.com/cloud/learn/recurrent-neural-networks> [Accessed 22 April 2022].

Zheng, Y., Meng, Y. and Jin, Y., 2011. Object Recognition using Neural Networks with Bottom-up and Top-down Pathways. Neurocomputing, 74, pp.3158-3169.

##submission.downloads##

Опубліковано

2022-06-30

Як цитувати

Ткаченко, К., & Зуєнко, О. (2022). Використання багатошарової LSTM-нейромережі в процесі розпізнавання друкованих текстів. Цифрова платформа: інформаційні технології в соціокультурній сфері, 5(1), 199–215. https://doi.org/10.31866/2617-796X.5.1.2022.261305

Номер

Розділ

Електронні ресурси та інформаційно-комунікаційні технології