НИКИФОРОВ
Владимир Олегович
д.т.н., профессор
doi: 10.17586/2226-1494-2015-15-1-155-162
УДК 007:681.512.2
СЕРВИСЫ ПОЛНОТЕКСТОВОГО ПОИСКА В РАСПРЕДЕЛЕННОЙ ИНФОРМАЦИОННОЙ СРЕДЕ (ПРОЕКТ HUMANITARIANA)
Читать статью полностью
Ссылка для цитирования: Ляпин С.Х., Куковякин А.В., Мбого И.А., Толстикова И.И., Чугунов А.В. Cервисы полнотекстового поиска в распределенной информационной среде (проект Humanitariana) // Научно-технический вестник информационных технологий, механики и оптики. 2015. Том 15. № 1. С. 155–162
Аннотация
Постановка проблемы. Обосновывается возможность использования сервисов полнотекстового поиска как в уни- версальных, так и специализированных (по ресурсной базе) электронных библиотеках для извлечения и анализа кон- текстного знания в гуманитарных дисциплинах. В этой связи описываются архитектура и сервисы виртуального ин- формационно-ресурсного центра для извлечения знаний из гуманитарных текстов, создаваемого в рамках проекта «Humanitariana». Рассматривается функциональная интеграция ресурсов и сервисов полнотекстового поиска в рас- пределенной децентрализованной среде, организованной в архитектуре Интернет/Интранет под управлением кли- ентского (пользовательского) браузера, обращающегося к множеству независимых серверов. Описан алгоритм осу- ществления распределенного полнотекстового запроса.
Методы. Используется методика сочетания частотно-ранжированных и абзацно-ориентированных полнотекстовых запросов: первые используются для предварительного анализа предметной области произведения или их совокупно- сти (экспликация «вертикального» контекста, или макроконтекста), вторые – для экспликации «горизонтального» контекста, или микроконтекста в рамках авторского абзаца. При этом результаты частотно-ранжированных запросов используются для составления абзацно-ориентированных запросов. Результаты. Приведены результаты текстологических исследований по темам: «проблема факта в русской филосо- фии», «проблема одиночества в русской философии и культуре». По совокупной ресурсной базе объемом около 2500 полнотекстовых ресурсов по каждой из тем эксплицировано и кратко описано около 50 фрагментов контекстного знания с целью дальнейшего его экспертного изучения. Практическая значимость. Предлагаемая технология (сервисы продвинутого полнотекстового поиска в распреде- ленной информационной среде) может быть использована для информационной поддержки гуманитарных исследо- ваний и гуманитарного образования, для функциональной интеграции ресурсов и сервисов различных организаций, для проведения междисциплинарных исследований.
Благодарности. Работа выполнена при поддержке гранта Российского гуманитарного научного фонда (грант РГНФ № 14-03-12017). Выражаем благодарность Университету ИТМО (Санкт-Петербург) за возможность использования своей информаци- онно-телекоммуникационной инфраструктуры, а также ООО «Константа» (Архангельск) за предоставление специа- лизированного прикладного программного обеспечения – многофункциональной информационной системы T-Libra с сервисами продвинутого полнотекстового поиска
Список литературы
1. Fagan J.C. The effects of reference, instruction, database searches, and ongoing expenditures on full-text article requests: an exploratory analysis // Journal of Academic Librarianship. 2014. V. 40. N 3–4. P. 264– 274. doi: 10.1016/j.acalib.2014.04.002
2. Hadersbeck M., Pichler A., Fink F., Gjesdal Ø.L. Wittgenstein's nachlass: WiTTFind and wittgenstein advanced search tools (WAST) // Proc. 1st Int. Conf. on Digital Access to Textual Cultural Heritage, DATeCH 2014. Madrid, Spain, 2014. P. 91–96. doi: 10.1145/2595188.2595202
3. Юдина Т.Н., Богомолова А.В. УИС РОССИЯ: онтология предметной области «государственное управление» // Труды XIV Всероссийской конференции «Интернет и современное общество» (IMS- 2011). Санкт-Петербург, Россия, 2011. С. 225–230.
4. Heeks R., Santos R. Understanding Adoption of e-Government: Principals, Agents and Institutional Dualism [Электронный ресурс]. Режим доступа: www.sed.manchester.ac.uk/idpm/research/publications/wp/igovernment/igov_wp19.htm. Яз. англ. (дата об- ращения 30.11.2014).
5. Мбого И.А., Чугунов А.В. Электронная коллекция «Электронное государство»: технологические ас- пекты // Труды XV Всероссийской объединенной конференции «Интернет и современное общество». Санкт-Петербург, 2012. С. 345–347.
6. Ляпин С.Х., Куковякин А.В. Сервисы полнотекстового поиска как инструмент повышения цитируемо- сти научных работ и рейтинга ВУЗа // Труды XX Всероссийской научно-методической конференции Телематика'2013. Санкт-Петербург, 2013. Т. 1. С. 15–17.
7. Ляпин С.Х. Электронная полнотекстовая библиотека для поддержки социогуманитарных исследова- ний // Труды XX Всероссийской научно-методической конференции Телематика'2013. Санкт- Петербург, 2013. Т. 2. С. 317–318.
8. Ляпин С.Х. Сервисы электронной полнотекстовой библиотеки для образования, науки и культуры // Научная периодика: проблемы и решения. 2013. № 2(14). C. 9–17.
9. Ляпин С.Х., Куковякин А.В. Электронная полнотекстовая библиотека для поддержки аналитической и исследовательской деятельности // Труды XVI Всероссийской объединенной конференции «Интернет и современное общество» (IMS-2013). Санкт-Петербург, 2013. C. 163–170.
10.Ляпин С.Х. Как пройти в распределенную библиотеку? // Современная наука: актуальные проблемы теории и практики. Серия: Гуманитарные науки. 2012. № 7–8. С. 17–21.
11. Metasearch Engine [Электронный ресурс]. Режим доступа: http://en.wikipedia.org/wiki/Metasearch_engine, свободный. Яз англ. (дата обращения 30.11.2014).
12. T-Libra 6.7 [Электронный ресурс]. Режим доступа: http://demo.tlibra.ru (дата обращения 30.11.2014).
13.Ляпин С.Х. Тексты, контексты, концепты: использование современных систем полнотекстового поис- ка для философских исследований (на материале русской философии) [Электронный ресурс]. Режим доступа: http://www.losev-library.ru/index.php?pid=6872, свободный. Яз. рус. (дата обращения 30.11.2014).
14. Таненбаум Э., ван Стеен М. Распределенные системы. Принципы и парадигмы. СПб.: Питер, 2003. 877 с.
15. Жижимов О.Л., Мазов Н.А. Модель распределенной информационной системы Сибирского отделе- ния РАН на базе протокола Z39.50 // Электронные библиотеки. 1999. Т. 2. № 2. С. 12.
16. Максимов Н.В., Сысойкина М.А. О реализации электронной библиотеки с использованием протоко- лов HTTP и Z39.50 // Электронные библиотеки. 2002. Т. 5. № 1. С. 4.