doi: 10.17586/2226-1494-2019-19-2-299-305


УДК 519.816

КРИТЕРИИ СООТВЕТСТВИЯ ТЕКСТА НАУЧНОМУ СТИЛЮ 

Блеес Э.И., Заславский М.М.


Читать статью полностью 
Язык статьи - русский

Ссылка для цитирования:
Блеес Э.И., Заславский М.М. Критерии соответствия текста научному стилю // Научно-технический вестник информационных технологий, механики и оптики. 2019. Т. 19. № 2. С. 299–305. doi: 10.17586/2226-1494-2019-19-2-299-305


Аннотация
Приведены результаты экспериментального исследования критериев соответствия текста научному стилю. Исследованы показатель повторений в текстовом документе ключевых слов и фраз, процентное соотношение стоп-слов и общего числа слов в тексте, отклонение графика частоты слов в тексте от идеального графика по Ципфу. Исследование проведено с применением сценария, проверяющего текст по нескольким критериям. В результате экспериментального исследования на выборке из 2500 статей, опубликованных в источниках ВАК/РИНЦ, получены распределения значений критериев, которые проверены на нормальность по нескольким критериям, а также на корреляцию между собой. В результате анализа этих данных получены и математически обоснованы пороговые значения критериев, которые применены на тестовой выборке, состоящей из бакалаврских работ студентов СПбГЭТУ «ЛЭТИ», псевдонаучной статьи «Корчеватель», технических статей из интернет-сообщества «Хабр», «Капитала» Карла Маркса и ряда текстов, не относящихся к научному стилю. Сформулировано необходимое, но не достаточное условие соответствия статьи научному стилю.

Ключевые слова: научный стиль, анализ текста, закон Ципфа, автоматизация рецензирования научных статей

Список литературы
  1. Демидова А.К. Пособие по русскому языку: научный стиль, оформление научной работы. М.: Русский язык, 1991. 201 c.
  2. Кириллова О.В. и др. Методические рекомендации по подготовке и оформлению научных статей в журналах, индексируемых в международных наукометрических базах данных. М.: АНРИ, 2017. 144 c.
  3. Davis H. Search Engine Optimization. O'Reilly Media, 2006. 48 p.
  4. Newman M.E.J. Power laws, Pareto distributions and Zipf's law // Contemporary Physics. 2005. V. 46. N 5. P. 323–351. doi: 10.1080/00107510500052444
  5. Lelu A. Jean-Baptiste Estoup and the origins of Zipf's law: a stenographer with a scientific mind (1868-1950) // Boletín de Estadística e Investigación Operativa. 2014. V. 30. N 1. P. 66–77.
  6. Блеес Э.И., Андросов В.Ю. Автоматизация процесса проверки текста на соответствие научному стилю // Современные технологии в теории и практике программирования: материалы научно-практической конференции студентов, аспирантов и молодых ученых. 2018. С. 118–121.
  7. Dong X.L. et al. Knowledge-based trust: Estimating the trustworthiness of web sources // Proceedings of the VLDB Endowment. 2015. V. 8. N 9. P. 938–949.doi: 10.14778/2777598.2777603
  8. Исполняемый сценарий, получающий выборку статей [Электронный ресурс]. Режим доступа: https://github.com/EduardBlees/Master-s-thesis/blob/master/script/leninka_scrapper.py, свободный (дата обращения: 20.12.2018).
  9. Boeing G., Waddell P. New insights into rental housing markets across the United States: Web scraping and analyzing craigslist rental listings // Journal of Planning Education and Research. 2017. V. 37. N 4. P. 457–476.doi: 10.1177/0739456x16664789
  10. Shapiro S.S., Wilk M.B. An analysis of variance test for normality (complete samples) // Biometrika. 1965. V. 52. N 3/4. P. 591–611. doi: 10.2307/2333709
  11. Kolmogorov A. Sulla determinazione empirica di una lgge di distribuzione // Inst. Ital. Attuari. Giorn. 1933. V. 4. P. 83–91.
  12. Anderson T.W., Darling D.A. Asymptotic theory of certain "goodness of fit" criteria based on stochastic processes // The Annals of Mathematical Statistics. 1952. V. 23. N 2. P. 193–212.doi: 10.1214/aoms/1177729437
  13. Гмурман Б.Е. Теория вероятностей и математическая статистика. Москва: Высшаяшкола, 2003. 478 с.
  14. Cumming G. Replication and p intervals: p values predict the future only vaguely, but confidence intervals do much better // Perspectives on Psychological Science. 2008. V. 3. N 4. P. 286–300. doi: 10.1111/j.1745-6924.2008.00079.x
  15. Исполняемый сценарий, рассчитывающий математические критерии распределений [Электронный ресурс]. Режимдоступа: https://github.com/EduardBlees/Master-s-thesis/blob/ master/ script/results/testDistribution.py, свободный. Яз. англ. (дата обращения: 20.12.2018).
  16. Sci Py Module for Python [Электронный ресурс]. Режим доступа: https://scipy.org, свободный. Яз. англ. (дата обращения: 20.12.2018).
  17. Wheeler D.J. et al. Understanding Statistical Process Control. SPC Press, 1992. 406 p.
  18. Easton V.J., McColl J.H. Statistics glossary [Электронный ресурс]. Режим доступа: https://stats.gla.ac.uk/steps/ glossary/ index.html, свободный. Яз. англ. (дата обращения: 20.12.2018).
  19. Жуков М.С. Корчеватель: алгоритм типичной унификации точек доступа и избыточности [Электронный ресурс]. 2008. Режим доступа: https://e-lub.net/annuals/ratu.htm (дата обращения: 20.12.2018).
  20. Stribling J., Aguayo D., Krohn M. Rooter: A methodology for the typical unification of access points and redundancy // Journal of Irreproducible Results. 2005. V. 49. N 3. P. 5.
  21. Моё разочарование в софте [Электронный ресурс]. Режим доступа: habr.com/post/423889/, свободный. Яз. рус. (дата обращения:20.12.2018).
  22. Наши с вами персональные данные ничего не стоят [Электронный ресурс]. Режим доступа: https://habr.com/post/423947/, свободный. Яз. рус. (дата обращения: 20.12.2018).
  23. Рассказ о том, как я ворую номера кредиток и пароли у посетителей ваших сайтов [Электронный ресурс]. Режим доступа: https://habr.com/post/346442/, свободный. Яз. рус. (дата обращения: 20.12.2018).
  24. Трехмерный движок на формулах Excel для чайников [Электронный ресурс]. Режим доступа: https://habr.com/post/353422/, свободный. Яз. рус. (дата обращения: 20.12.2018).


Creative Commons License

This work is licensed under a Creative Commons Attribution-NonCommercial 4.0 International License
Информация 2001-2024 ©
Научно-технический вестник информационных технологий, механики и оптики.
Все права защищены.

Яндекс.Метрика