doi: 10.17586/2226-1494-2015-15-1-155-162


УДК 007:681.512.2

СЕРВИСЫ ПОЛНОТЕКСТОВОГО ПОИСКА В РАСПРЕДЕЛЕННОЙ ИНФОРМАЦИОННОЙ СРЕДЕ (ПРОЕКТ HUMANITARIANA)

Ляпин С.Х., Куковякин А.В., Мбого И.А., Толстикова И.И., Чугунов А.В.


Читать статью полностью 
Язык статьи - русский

Ссылка для цитирования: Ляпин С.Х., Куковякин А.В., Мбого И.А., Толстикова И.И., Чугунов А.В. Cервисы полнотекстового поиска в распределенной информационной среде (проект Humanitariana) // Научно-технический вестник информационных технологий, механики и оптики. 2015. Том 15. № 1. С. 155–162

Аннотация



Постановка проблемы.
Обосновывается возможность использования сервисов полнотекстового поиска как в уни- версальных, так и специализированных (по ресурсной базе) электронных библиотеках для извлечения и анализа кон- текстного знания в гуманитарных дисциплинах. В этой связи описываются архитектура и сервисы виртуального ин- формационно-ресурсного центра для извлечения знаний из гуманитарных текстов, создаваемого в рамках проекта «Humanitariana». Рассматривается функциональная интеграция ресурсов и сервисов полнотекстового поиска в рас- пределенной децентрализованной среде, организованной в архитектуре Интернет/Интранет под управлением кли- ентского (пользовательского) браузера, обращающегося к множеству независимых серверов. Описан алгоритм осу- ществления распределенного полнотекстового запроса.


Методы.
Используется методика сочетания частотно-ранжированных и абзацно-ориентированных полнотекстовых запросов: первые используются для предварительного анализа предметной области произведения или их совокупно- сти (экспликация «вертикального» контекста, или макроконтекста), вторые – для экспликации «горизонтального» контекста, или микроконтекста в рамках авторского абзаца. При этом результаты частотно-ранжированных запросов используются для составления абзацно-ориентированных запросов. Результаты. Приведены результаты текстологических исследований по темам: «проблема факта в русской филосо- фии», «проблема одиночества в русской философии и культуре». По совокупной ресурсной базе объемом около 2500 полнотекстовых ресурсов по каждой из тем эксплицировано и кратко описано около 50 фрагментов контекстного знания с целью дальнейшего его экспертного изучения. Практическая значимость. Предлагаемая технология (сервисы продвинутого полнотекстового поиска в распреде- ленной информационной среде) может быть использована для информационной поддержки гуманитарных исследо- ваний и гуманитарного образования, для функциональной интеграции ресурсов и сервисов различных организаций, для проведения междисциплинарных исследований. 


Ключевые слова: полнотекстовый поиск, экспликация контекстного знания, «горизонтальный» контекст, «вертикальный» контекст, функциональная интеграция ресурсов, децентрализованная распределенная среда, metasearch engine

Благодарности. Работа выполнена при поддержке гранта Российского гуманитарного научного фонда (грант РГНФ № 14-03-12017). Выражаем благодарность Университету ИТМО (Санкт-Петербург) за возможность использования своей информаци- онно-телекоммуникационной инфраструктуры, а также ООО «Константа» (Архангельск) за предоставление специа- лизированного прикладного программного обеспечения – многофункциональной информационной системы T-Libra с сервисами продвинутого полнотекстового поиска

Список литературы

1. Fagan J.C. The effects of reference, instruction, database searches, and ongoing expenditures on full-text article requests: an exploratory analysis // Journal of Academic Librarianship. 2014. V. 40. N 3–4. P. 264– 274. doi: 10.1016/j.acalib.2014.04.002

2. Hadersbeck M., Pichler A., Fink F., Gjesdal Ø.L. Wittgenstein's nachlass: WiTTFind and wittgenstein advanced search tools (WAST) // Proc. 1st Int. Conf. on Digital Access to Textual Cultural Heritage, DATeCH 2014. Madrid, Spain, 2014. P. 91–96. doi: 10.1145/2595188.2595202

3. Юдина Т.Н., Богомолова А.В. УИС РОССИЯ: онтология предметной области «государственное управление» // Труды XIV Всероссийской конференции «Интернет и современное общество» (IMS- 2011). Санкт-Петербург, Россия, 2011. С. 225–230.

4. Heeks R., Santos R. Understanding Adoption of e-Government: Principals, Agents and Institutional Dualism [Электронный ресурс]. Режим доступа: www.sed.manchester.ac.uk/idpm/research/publications/wp/igovernment/igov_wp19.htm. Яз. англ. (дата об- ращения 30.11.2014).

5. Мбого И.А., Чугунов А.В. Электронная коллекция «Электронное государство»: технологические ас- пекты // Труды XV Всероссийской объединенной конференции «Интернет и современное общество». Санкт-Петербург, 2012. С. 345–347.

6. Ляпин С.Х., Куковякин А.В. Сервисы полнотекстового поиска как инструмент повышения цитируемо- сти научных работ и рейтинга ВУЗа // Труды XX Всероссийской научно-методической конференции Телематика'2013. Санкт-Петербург, 2013. Т. 1. С. 15–17.

7. Ляпин С.Х. Электронная полнотекстовая библиотека для поддержки социогуманитарных исследова- ний // Труды XX Всероссийской научно-методической конференции Телематика'2013. Санкт- Петербург, 2013. Т. 2. С. 317–318.

8. Ляпин С.Х. Сервисы электронной полнотекстовой библиотеки для образования, науки и культуры // Научная периодика: проблемы и решения. 2013. № 2(14). C. 9–17.

9. Ляпин С.Х., Куковякин А.В. Электронная полнотекстовая библиотека для поддержки аналитической и исследовательской деятельности // Труды XVI Всероссийской объединенной конференции «Интернет и современное общество» (IMS-2013). Санкт-Петербург, 2013. C. 163–170.

10.Ляпин С.Х. Как пройти в распределенную библиотеку? // Современная наука: актуальные проблемы теории и практики. Серия: Гуманитарные науки. 2012. № 7–8. С. 17–21.

11. Metasearch Engine [Электронный ресурс]. Режим доступа: http://en.wikipedia.org/wiki/Metasearch_engine, свободный. Яз англ. (дата обращения 30.11.2014).

12. T-Libra 6.7 [Электронный ресурс]. Режим доступа: http://demo.tlibra.ru (дата обращения 30.11.2014).

13.Ляпин С.Х. Тексты, контексты, концепты: использование современных систем полнотекстового поис- ка для философских исследований (на материале русской философии) [Электронный ресурс]. Режим доступа: http://www.losev-library.ru/index.php?pid=6872, свободный. Яз. рус. (дата обращения 30.11.2014).

14. Таненбаум Э., ван Стеен М. Распределенные системы. Принципы и парадигмы. СПб.: Питер, 2003. 877 с.

15. Жижимов О.Л., Мазов Н.А. Модель распределенной информационной системы Сибирского отделе- ния РАН на базе протокола Z39.50 // Электронные библиотеки. 1999. Т. 2. № 2. С. 12.

16. Максимов Н.В., Сысойкина М.А. О реализации электронной библиотеки с использованием протоко- лов HTTP и Z39.50 // Электронные библиотеки. 2002. Т. 5. № 1. С. 4. 



Creative Commons License

This work is licensed under a Creative Commons Attribution-NonCommercial 4.0 International License
Информация 2001-2024 ©
Научно-технический вестник информационных технологий, механики и оптики.
Все права защищены.

Яндекс.Метрика