doi: 10.17586/2226-1494-2015-15-6-1081-1087


УДК 004.043

ИССЛЕДОВАНИЕ АКТУАЛЬНЫХ СПОСОБОВ ПУБЛИКАЦИИ ОТКРЫТЫХ НАУЧНЫХ ДАННЫХ В СЕТИ

Муромцев Д.И., Леманн Й., Семерханов И.А., Навроцкий М.А., Ермилов И.С.


Читать статью полностью 
Язык статьи - русский

Ссылка для цитирования: Муромцев Д.И., Леманн Й., Семерханов И.А., Навроцкий М.А., Ермилов И.С. Исследование актуальных способов публикации открытых научных данных в сети // Научно-технический вестник информационных технологий, механики и оптики. 2015. Том 15. № 6. С. 1081–1087.

Аннотация
Предмет исследования. Приведен обзор программных средств и технологий публикации открытых данных в сети Интернет в машиночитаемых форматах в контексте данных университетов, образовательных и исследовательских организаций, научных лабораторий. Выполнен анализ наиболее часто используемых форматов публикации, включая не только такие популярные форматы, как pdf, csv, excel, но и форматы Семантического Веба, например, RDF. Рассмотрены способы публикации научных данных в семантических форматах на примере импорта и конвертации информации из базы данных университета. Методы. Описаны методы публикации открытых научных данных в сети, состоящие из набора преобразований исходных массивов данных к конечному семантическому представлению. Показаны этапы преобразований, включая выгрузку данных из реляционной базы данных, отображение (маппинг) данных на онтологическую модель (схему) и генерацию массива RDF-триплетов, соответствующего исходному фрагменту базы данных. Приведено описание популярных систем публикации открытых данных, таких как CKAN, VIVO и другие. В качестве основной системы хранения и публикации данных рассмотрена система OpenLinkVirtuoso. Дано описание модели данных RDF в качестве способа представления открытых данных Университета ИТМО. Основные результаты. Приведено описание способов публикации открытых научных даных, показаны их недостатки. Для демонстрации работоспособности предложенного способа публикации открытых данных университета разработан программный прототип, доступный в сети Интернет. Приведен пример использования системы. Практическая значимость. Внедрение предложенного подхода позволит значительно повысить эффект от публикации открытых данных университетов для использования этих данных другими приложениями, например, приложениями поиска информации об образовательной деятельности и результатах исследований, анализа научной деятельности университетов и их научных подразделений.

Ключевые слова: онтологии, RDF, связанные открытые данные, интеграция данных, публикация данных, virtuoso, sparql.

Список литературы

1. Keßler C., D'Aquin M., Dietze S. Linked data for science and education // Semantic Web. 2013. V. 4. N 1. P. 1–2. doi: 10.3233/SW-120091
2. Larsen P.O., von Ins M. The rate of growth in scientific publication and the decline in coverage provided by Science Citation Index // Scientometrics. 2010. V. 84. N 3. P. 575–603. doi: 10.1007/s11192-010-0202-z
3. Das S., Sundara S., Cyganiak R. R2RML: RDB to RDF Mapping Language [Электронный ресурс]. Режим доступа: http://www.w3.org/TR/r2rml/, свободный. Яз. англ. (дата обращения 06.05.2015).
4. Sjaevelandet M.G., Lian E.H., Horrocks I. Publishing the Norwegian Petroleum Directorate's FactPages as semantic web data // Lecture Notes in Computer Science. 2013. V. 8219. N 2. P. 162–177. doi: 10.1007/978-3-642-41338-4_11
5. Rodriguez J.B. et al. R2O, an extensible and semantically based database-to-ontology mapping language // Proc. 2nd Workshop on Semantic Web and Databases. 2004. V. 3372. P. 1069–1070.
6. VirtuosoUniversalServer [Электронный ресурс]. Режим доступа: http://www.w3.org/wiki/VirtuosoUniversalServer, свободный. Яз. англ. (дата обращения 21.01.2015).
7. Leinberger M., Scheglmann S., Lammel R., Staab S., Thimm M., Viegas E. Semantic web application development with LITEQ // Lecture Notes in Computer Science. 2014. V. 8797. P. 212–227.
8. Heath T., Bizer C. Linked Data: Evolving the Web into a Global Data Space. 1st ed. Morgan & Claypool Publ., 2011. 136 p. doi: 10.2200/S00334ED1V01Y201102WBE001
9. Microsoft Academic Search [Электронный ресурс]. Режим доступа: http://academic.research.microsoft.com, свободный. Яз. англ. (дата обращения: 20.08.2015).
10. Devare M., Corson-Rikert J., Caruso B., Lowe B., Chiang K., McCue J. Connecting people, creating a virtual life sciences community // D-Lib Magazine. 2007. V. 13. N 7. P. 1082–9873. doi: 10.1045/july2007-devare
11. Krafft D.B., Cappadona N.A., Caruso B., Corson-Rikert J., Devare M., Lowe B. VIVO: Enabling national networking of scientists // Proc. Web Science Conference. Raleigh, USA, 2010. V. 2010. P. 1310–1313.
12. Nonaka I., Takeuchi H. The Knowledge-Creating Company: How Japanese Companies Create the Dynamics of Innovation. NY: Oxford University Press, 1995. 304 p.
13. Groza T., Handschuh S., Clark T., Shum S.B., de Waard A. A Short Survey of Discourse Representation Models [Электронный ресурс]. Режим доступа: http://ceur-ws.org/Vol-523/Groza.pdf, свободный. Яз. англ. (дата обращения 20.08.2015).
14. Groza T., Handschuh S., Moller K., Decker S. SALT - Semantically annotated LaTeX for scientific publications // Lecture Notes in Computer Science. 2007. V. 4519. P. 518–532.
15. de Waard A., Breure L., Kircz J.G., van Oostendorp H. Modeling Rhetoric in Scientific Publications [Электронный ресурс]. Режим доступа: http://www.researchgate.net/publication/46680525_Modeling_Rhetoric_in_Scientific_Publications, свободный. Яз. англ. (дата обращения: 20.08.2015).
16. Sernadela P., van der Horst E., Thompson M., Lopes P., Roos M., Oliveira J.L. A nanopublishing architecture for biomedical data // Proc. 8th Int. Conf. on Practical Applications of Computational Biology and Bioinformatics, PACBB. Salamanca, Spain, 2014. V. 294. N 6. P. 277–284. doi: 10.1007/978-3-319-07581-5_33
17. Saleem M., Khan Y., Hasnain A., Ermilov I., Ngonga Ngomo A.-C. A fine-grained evaluation of SPARQL endpoint federation systems // Semantic Web Journal. 2015. V. 6. N 6. doi: 10.3233/SW-150186
 



Creative Commons License

This work is licensed under a Creative Commons Attribution-NonCommercial 4.0 International License
Информация 2001-2024 ©
Научно-технический вестник информационных технологий, механики и оптики.
Все права защищены.

Яндекс.Метрика