Семантичний аналіз текстів природною мовою: онтологічний підхід
DOI:
https://doi.org/10.31866/2617-796X.7.2.2024.317726Ключові слова:
природномовний текст, лінгвістичний аналіз природномовного тексту, семантичний аналіз природномовного тексту, онтологія, предметна область, база знань, онтографАнотація
Розвиток інформаційних (інтелектуальних) систем навчання, систем електронного документообігу, веб-орієнтованих систем, що працюють з текстовою інформацією природною мовою, призвів до збільшення обсягів навчального контенту та/або масивів оброблених повнотекстових документів. Все це вимагає нових засобів організації доступу до інформації, багато з яких слід віднести до інтелектуальних систем обробки знань. Одним із ефективних підходів до ідентифікації та обробки сенсу навчального контенту (і/або текстових документів) є використання онтологій.
Метою статті є дослідження, аналіз різних підходів до визначення семантичного наповнення текстів природною мовою, розгляд існуючих концепцій аналізу текстів і перспектив використання запропонованого онтологічного підходу до семантичного аналізу текстів природною мовою.
Методами дослідження є методи семантичного аналізу основних понять аналізованої предметної галузі (семантичного анаізу текстів природньої мовою). У статті розглядається підхід до лінгвістичного аналізу текстів, що базується на онтологічному моделюванні.
Новизною дослідження є застосування запропонованого онтологічного підходу до семантичного аналізу текстів природною мовою для визначення сенсу (семантики) текстової інформації, яка використовується в інтелектуальних системах різних класів.
Висновок дослідження, проведеного у статті, полягає в наступному: запропоновано онтологічний підхід до семантичного аналізу тексту природної мови, до його завдань та методів. Використання запропонованого підходу до аналізу текстів приводить до розуміння семантичного аналізу як єдиної тріади: <Онтологія – Текст – Значення>. Для ефективного та коректного вилучення знань у роботі пропонується використовувати багаторівневу онтологію. Результатом взаємодії конкретного тексту природної мови з онтологією є онтологічний сенс – сукупність взаємопов’язаних підграфів онтографа.
Онтологічний зміст витягується з онтографа за допомогою семантичного аналізатора. Діалоговий процесор досліджує синтаксичне дерево розбору речення (зв’язного елемента тексту природної мови) і на основі заданого запитання знаходить фрагмент у тексті, який є відповіддю на запитання. Комп’ютерне розуміння (в інформаційних чи інтелектуальних системах) тексту природної мови досягається, зокрема, за рахунок: занурення тексту в єдине середовище знань – онтологію; формальне представлення сенсу (семантики) в базі знань відповідної системи; можливість операцій над онтологічним змістом.
Запропонований підхід може бути використаний для створення інтелектуальних сховищ інформації, які працюють в єдиному середовищі знань.Запропонований підхід до семантичного, аналізу текстів природною мовою зосереджений на автоматичному вилученні метаданих із текстів різної природи (наприклад, текстового документа, Інтернет-контенту, навчального контенту відповідних онлайн-курсів, опису комп’ютерних та настільних ігор). При подальшому розвитку запропонованого підходу він може використовуватися в системах автоматичного реферування наукових публікацій, змістовної інтерпретації мультимедійного контенту, навчання та тестування (в тому числі з елементами візуального відображення інформації та елементами гейміфікації).
Посилання
Atzeni, M., Atzori, M., 2018. Translating natural language to code: an unsupervised ontology based approach. . In: IEEE First International Conference on Artificial Intelligence and Knowledge Engineering (AIKE-2018). Laguna Hills, California, USA, 26-28 September 2018. Laguna Hills, pp.1-8. [online] Avialable at: <https://ieeexplore.ieee.org/xpl/conhome/8526512/proceeding> [Accessed 08 October 2024].
Maulud, D.H., Zeebaree, S.R.M., Jacksi ,K., Sadeeq, M.A.M., Sharf ,K.H., 2021. A State of Art for Semantic Analysis of Natural Language Processing. Oubahan Academc Journal, 1(2), pp. 21-28. https://doi.org/10.48161/qaj.v1n2a44 [online] Avialable at: <https://www.researchgate.net/publication/350521473_A_State_of_Art_for_Semantic_Analysis_of_Natural_Language_Processing> [Accessed 08 October 2024].
Tkachenko, К., 2024. Using of NLP Methods in Intelligent Educational System. Digital platform: Information technologies in sociocultural sphere, 7(1), pp. 80-96. https://doi.org/10.31866/2617-796X.7.1.2024.307009
Li, W., 2020. Analysis of Semantic Comprehension Algorithms of Natural Language Based on Robot’s Questions and Answers. In: IEEE International Conference on Advances in Electrical Engineering and Computer Applications (AEECA-2020). pp. 1021-1024.
Тkachenko, O., Тkachenko, O., Тkachenko, К., 2020. Designing Complex Intelligent Systems on the Basis of Ontological Models. In: CMIS-2020: Third International Workshop on Computer Modeling and Intelligent Systems. Zaporozhye, Ukraine, 27 April-1 May 2020. Zaporozhye, pp. 266-277.
Semantic Analysis: Definition and Use Cases in Natural Language Processing, n.d. [online] Avialable at: <https://datascientest.com/en/semantic-analysis-definition-and-use-cases-in-natural-language-processing> [Accessed 08 October 2024].
Sowa, J.F., 2002. Concepts in Lexicon: Introduction. Architectures for Intelligent Systems. IBM Systems Journal, 41(3), pp. 331-349.
Palagin, A., Gladun, V., Petrenko, N., Velychko, V., Sevruk, A., Mikhailyuk, A., 2008. Informational model of natural language processing. International Journal Information Technologies & Knowledge, 2(1), pр. 5-6.
Mochalova, A.V., Mochalov, V.A., 2016. Mathematical model of an ontological-semantic analyzer using basic ontological-semantic patterns. In: Proceedings of 15th Mexican International Conference on Artificial Intelligence, pp. 53-66.
Fu, R. et al., 2014. Learning semantic hierarchies via word embeddings. In: Proceedings of the 52nd Annual Meeting of the Association for Computational Linguistics, 1, pp. 1199-1209.
Eremin, E., 2008. About ontology application to the description of syllabus. International Journal Information Technologies & Knowledge, 2(5), pр. 449-454.
Gavrilova, T.A., Voinov, A.V., 2007. The cognitive approach to the creation of ontology. Automatic Documentation and Mathematical Linguistics, 4 (12), pp. 59-64.
Gladun, V., Velychko, V., Svyatogor, L., 2009. Hierarchical three-level ontology for text processing. International Journal Information Technologies & Knowledge, 3(4), рр. 303-311.
Lanin, V., 2015. Integration of ontology resources into open format documents for semantic indexing. International Journal «Information Technologies & Knowledge, 9(4), рр. 389-397.
Sanfilippo, E.M., 2018. Feature-based product modelling: an ontological approach. International Journal of Computer Integrated Manufacturing, 31 (11), pp.1097-1110.
List, C., 2018. Levels: descriptive, explanatory, and ontological. LSE Research Online. [online] Avialable at: <http://eprints.lse.ac.uk/87591/1/List_Levels%20descriptive_2018.pdf> [Accessed 07 October 2024].
Gelfert, A., 2017. The Ontology of Models, In: Magnani, L. and Bertolotti, T. eds. Springer Handbook of Model-Based Science. Springer, pp. 5-23.
Lytvyn, V., Vysotska, V., Dosyn, D., Lozynska, O. and Oborska, O., 2018. Methods of Building Intelligent Decision Support Systems Based on Adaptive Ontology. In: IEEE Second International Conference on Data Stream Mining & Processing (DSMP). Lviv, Ukraine, 21-25 August 2018. Lviv, pp. 145-150.
Hermann, K.M., Kocisky, T., Grefenstette, E., Espeholt, L., Kay, W., Suleyman, M., Blunsom, P., 2015. Teaching machines to read and comprehend. Advances in Neural Information Processing Systems. 28, pp. 1684-1692. [online] Avialable at: <https://proceedings.neurips.cc/paper_files/paper/2015/file/afdec7005cc9f14302cd0474fd0f3c96-Paper.pdf> [Accessed 07 October 2024].
##submission.downloads##
Опубліковано
Як цитувати
Номер
Розділ
Ліцензія
Авторське право (c) 2024 Костянтин Ткаченко
Ця робота ліцензується відповідно до Creative Commons Attribution 4.0 International License.
Автори зберігають авторські права на статтю та одночасно надають журналу право його першої публікації на умовах ліцензії Creative Commons Attribution License, яка дозволяє іншим особам вільно поширювати опубліковану статтю з обов’язковим посиланням на її авторів та першу публікацію.
Журнал дозволяє авторам зберігати авторські права і права на публікації без обмежень.
Автор опублікованої статті має право поширювати інформацію про неї та розміщувати посилання на роботу в електронному репозитарії установи.