Intellectual Technology for Extraction and Verification of Numerical and Textual Data in Multi-Connected Multi-Stage Geoinformation Systems
DOI:
https://doi.org/10.31649/1997-9266-2025-182-5-51-60Keywords:
Artificial Intelligence, Knowledge Base, Model, Information System, Dataset, Monitoring, Water Resources, EcosystemAbstract
The article is devoted to solving the problem of increasing the volume and level of reliability of information regarding the state of elements of multi-connected multi-stage geographic information systems (GIS) using information and intellectual technologies, which is especially relevant when monitoring the state of these objects. To solve the problem, numerical and textual data from various sources (reports, cadasters, publications in the media and social networks, etc.) are used, which were bound and verified to the elements of the GIS taking into account spatial -temporal metadata. The criterion of topological observability is applied as a measure of the completeness of knowledge for the verification of numerical data in texts.
For the first time, a method of verification of numerical data in texts using a knowledge base is proposed, the completeness of which is assessed using the criterion of topological observability, which makes it possible to assess the completeness and accuracy of the extracted information. The method of forming user queries to a large language model and RAG architecture has been improved by binding embeddings to spatial objects and temporal boundaries, which provides an opportunity to more accurately find information relevant to the user, taking into account the established spatial-temporal restrictions. The georeferencing method has been further developed, which automatically selects relevant facts in texts and more accurately compares these facts with descriptions of water bodies. The integrated technology has been proposed that combines these methods — automated extraction of numerical and text facts from various sources, their spatial-temporal binding to GIS elements and formalized verification in order to reduce information uncertainty and improve the quality of digital twins for decision support. An example of the application of this technology is given on the example of the task of analyzing the state of the water body of the Southern Bug River basin. The study showed that the reliability index of news about water pollution can be increased from 0.3 to approximately 0.99, i.e. 3.3 times.
References
В. Б. Мокін, І. В. Варчук, і Є. М. Крижановський, Інформаційна технологія аналізу та оптимізації топологічної спостережуваності багатозв’язних геоінформаційних систем, моногр. Вінниця, Україна: ВНТУ, 2019, 121 с. ISBN 978-966-641-765-0.
В. Б. Мокін, В. Г. Сторчак, Є. М. Крижановський, О. В. Гавенко, і В. Ю. Балачук. Інформаційні технології автоматизації обробки параметрів геоінформаційних систем з геометричними мережами, моногр. Вінниця: ВНТУ, 2014, 196 с. ISBN: 978-966-641-946-3.
Zeiler Michael, Modeling our World, ESRI: Redlands, USA, 1999, 202 p.
National Hydro Network. User Guide Series. Creating a Geometric Network in ArcGIS using NHN Data. Edition 1.0.
Комп’ютеризовані регіональні системи державного моніторингу поверхневих вод: моделі, алгоритми, програми, моногр., В. Б. Мокін, Ред. Вінниця, Україна: вид-во ВНТУ “Універсум–Вінниця”, 2005, 315 с.
«Водний Кодекс України,» Відомості Верховної Ради (ВВР), 1995, № 24, ст. 189, введений в дію Постановою ВР № 214/95-ВР від 06.06.95) [Електронний ресурс]. Режим доступу: http://zakon2.rada.gov.ua/laws/show/213/95-%D0%B2%D1%80 .
Водна стратегія України на період до 2050 року. Розпорядженням Кабінету Міністрів України від 9 грудня 2022 р. № 1134-р. [Електронний ресурс]. Режим доступу: https://zakon.rada.gov.ua/laws/show/1134-2022-%D1%80#Text .
Водна Рамкова Директива ЄС 2000/60/ЄС. Основні терміни та їх визначення. Київ, 2006. 240 с.
Розпорядження Кабінету Міністрів України від 1 листопада 2024 р. № 1078-р «Про затвердження планів управління річковими басейнами Вісли, Дністра та Південного Бугу на 2025—2030 роки.» https://zakon.rada.gov.ua/laws/show/1078-2024-%D1%80#Text .
В. Б. Мокін, і М. В. Дратований, Наука про дані: машинне навчання та інтелектуальний аналіз даних, електр. навч. посіб. комбінованого (локального та мережевого) використання. Вінниця, Україна: ВНТУ, 2024, 258 с. [Електронний ресурс]. Режим доступу: https://docs.vntu.edu.ua/card.php?id=8163 .
В. Б. Мокін, К. О. Бондалєтов, І. М. Штельмах, О. В. Слободянюк, «Автоматичне видобування знань з екологічних звітів з прив’язкою до часу та до просторових координат масивів вод,» Вісник Вінницького політехнічного інституту, вип. 3, с. 101-110, Черв. 2025, https://doi.org/10.31649/1997-9266-2025-180-3-101-110 .
Vitalii B. Mokin, et al., “Information measuring systems with mobile devices for identification of air pollution parameters caused by transport,” Proc. SPIE 10031, Photonics Applications in Astronomy, Communications, Industry, and High-Energy Physics Experiments, 2016, 1003128 (September 28, 2016), https://doi.org/10.1117/12.2249202 .
Vitalii Mokin, Іlona Varchuk, Kostiantyn Bondaletov, and Olena Slobodianiuk, “Method for Analyzing and Optimizing the Topologic Observability of Cognitive Maps of Complex Spatially Distributed Systems,”in Conference Proceedings 2017 IEEE First Ukraine Conference on Electrical and Computer Engineering (Ukrcon) May 29 – June 2, 2017 Kyiv, pp. 865-869. https://doi.org/10.1109/UKRCON.2017.8100371 .
В. Б. Мокін, К. О. Бондалєтов, Г. В. Горячев, і Д. Ю. Дзюняк, «Універсальна інформаційно-вимірювальна система оперативного екологічного моніторингу з використанням мобільних пристроїв,» Вісник Вінницького політехнічного інституту, № 5 (122), с. 116-122, 2015.
В. Б. Мокін, Д. Ю Дзюняк, К. О. Бондалєтов, і В. В. Олійник, «Метод і технологія моніторингу стану атмосферного повітря за допомогою універсальної інформаційно-вимірювальної системи з використанням мобільних пристроїв,» Наукові праці Вінницького національного технічного університету, № 4, 2015. [Електронний ресурс]. Режим доступу: http://praci.vntu.edu.ua/index.php/praci/article/view/456/454 .
A. Halterman, “Mordecai 3: A Neural Geoparser»,” arXiv, 2023, [Electronic resource]. Available: https://arxiv.org/pdf/2303.13675 .
Hanwen Zheng, et al., “A Comprehensive Survey on Document-Level Information Extraction,” in Proceedings of the Workshop on the Future of Event Detection (FuturED), 2024, pp. 58-72, USA: Association for Computational Linguistics, [Electronic resource]. Available: https://aclanthology.org/2024.futured-1.6.pdf .
J. Dagdelen, et al., “Structured information extraction from scientific text with large language models,” Nature Commun, no. 15, 1418, 2024. https://doi.org/10.1038/s41467-024-45563-x .
D. Dessí, et al., “CS-KG 2.0: A Large-scale Knowledge Graph of Computer Science,” Scientific Data, no. 12, 964, 2025. https://doi.org/10.1038/s41597-025-05200-8 .
Haoran Luo, et al., “Text2NKG: Fine-Grained N-ary Relation Extraction for N-ary relational Knowledge Graph Construction,” Advances in Neural Information Processing Systems 37 (NeurIPS), 2024. [Electronic resource]. Available: https://proceedings.neurips.cc/paper_files/paper/2024/hash/Abstract-Conference.html . Accessed: 06.06.2025.
R. Bommasani, et al. “On the Opportunities and Risks of Foundation Models,”Computer Science, Machine Learning, 2021. [Electronic resource]. Available: https://arxiv.org/abs/2108.07258 .
Vitalii Mokin, Іlona Varchuk, Kostiantyn Bondaletov, and Olena Slobodianiuk, “Method for Analyzing and Optimizing the Topologic Observability of Cognitive Maps of Complex Spatially Distributed Systems,” Conference Proceedings 2017 IEEE First Ukraine Conference on ELECTRICAL AND COMPUTER ENGINEERING (UKRCON) May 29 – June 2, 2017 Kyiv. pp. 865-869. https://doi.org/10.1109/UKRCON.2017.8100371 .
K. Bondalietov, and V. Mokin, “Notation System for Comparing and Synthesis of Intelligent Key Phrase Extraction Methods for Ontological Models in Information Systems,” in Information and Communication Technologies and Sustainable Development. ICT&SD 2022, S. Dovgyi, O. Trofymchuk, V. Ustimenko, L Globa,. Eds., Lecture Notes in Networks and Systems, vol. 809. Springer, Cham, 2023. https://doi.org/10.1007/978-3-031-46880-3_11 .
В. Б. Мокін, К. О. Бондалєтов, Є. М. Крижановський, і В. О. Караваєв, «Метод аугментації текстів про стан масивів вод на основі інтелектуальної прив’язки до багатозв’язних геоінформаційних систем іменованих сутностей,» Вісник Вінницького політехнічного інституту, № 3, с. 55-65, Черв. 2023. https://doi.org/10.31649/1997-9266-2023-168-3-55-65 .
К О. Бондалєтов, В. Б. Мокін, Є. М. Крижановський, і В.О. Караваєв, «Розроблення інтелектуальної веб-системи з інформацією про екологічні проблеми та природоохоронні заходи у масивах вод басейну р. Південний Буг WISEST-SBB,» Актуальні проблеми та перспективи розвитку фундаментальних, прикладних, загальнотехнічних та безпекових наук, в Матеріали IV всеукр. науково-практ. конф. пам’яті акад. Акад. наук вищ. освіти, проф. А. В. Касперського, Київ, 27 черв. 2024, с. 6-12. https://kztdop.ipf.npu.edu.ua/?view=article&id=244 .
A. Gelman, J. B. Carlin, H. S. Stern, D. B. Dunson, A. Vehtari, and D. B. Rubin, Bayesian Data Analysis, Third Edition, 2013.[Electronic resource]. Available: https://sites.stat.columbia.edu/gelman/book/ .
Vinbazar, «Біля Ладижина у Південному Бузі загинуло риби на 270 тисяч гривень,» Всі Новини Вінниці. Vinbazar.com. [Електронний ресурс]. Режим доступу: https://vinbazar.com/news/podiyi/bilya-ladijina-u-pivdennomu-buzi-zaginulo-ribi-na-270tisyach-griven .
Downloads
-
pdf (Українська)
Downloads: 47
Published
How to Cite
Issue
Section
License

This work is licensed under a Creative Commons Attribution 4.0 International License.
Authors who publish with this journal agree to the following terms:
- Authors retain copyright and grant the journal right of first publication.
- Authors are able to enter into separate, additional contractual arrangements for the non-exclusive distribution of the journal's published version of the work (e.g., post it to an institutional repository or publish it in a book), with an acknowledgment of its initial publication in this journal.
- Authors are permitted and encouraged to post their work online (e.g., in institutional repositories or on their website) prior to and during the submission process, as it can lead to productive exchanges, as well as earlier and greater citation of published work (See The Effect of Open Access).