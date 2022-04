К вопросу о пересмотре показателей публикационной активности и возможности создания суверенных баз данных научного цитирования

Власти ввели мораторий на учет публикаций российских ученых в зарубежных научных журналах и их участия в международных конференциях [1], Минобрнауки активно собирает предложения по созданию национальной системы оценки результативности научных исследований и разработок [2] и вариантам создания новой базы данных научного цитирования.

На мой взгляд, целью никогда не могут стать показатели как таковые, ведь они нужны не просто так. Поэтому смотрела бы на ситуацию шире, поставив во главу угла не оценку, а создание условий, в которых к российским ученым возрастет доверие. Новые показатели публикационной активности и суверенная база данных научного цитирования могут в этом деле помочь, но, как говорится, не оценками едиными жив ученый… Вела бы параллельно два процесса: думала бы о показателях и базах, а заодно реализовывала бы усилия, нацеленные на выстраивание новой нормальности.

Новая нормальность подразумевает, что научные статьи пишутся не для отчетов, что имеет значение репутация ученого, этичное поведение в сфере науки целесообразно, есть ответственность за нарушения академической честности — подложные ученые степени и публикации рассматриваются как элемент коррупции в рамках статей УК РФ: служебный подлог (статья 292 УК РФ), мошенничество (статья 159 УК РФ), нецелевой расход бюджетных средств (статья 285.1 УК РФ).

Начать можно с амнистии: нарушители академической честности сохранят свои должности (кроме руководителей сферы науки и образования), но отказываются от ученых степеней. Это серьезным образом снизит наукометрическую нагрузку и разного рода искажения в экспертном поле, упростит работу с университетами (пока в руководстве есть люди с доказанной академической бесчестностью, сложно поверить в реальные, а не номинальные перемены).

Перспективными представляются «штрафы» за нарушения академической честности, при расчете показателей делала бы автоматический пересчет рейтинга в пользу того, у кого текст недобросовестно заимствован.

Важно разработать несколько НПА (нормативно-правовых актов), например, запрещающих работу журналов-хищников, покупное, приписное авторство и иные устойчивые нарушения норм этики научных публикаций; запрещающих рекламу недобросовестных академических практик (покупное авторство, написание текстов на заказ, публикации «под ключ» и т. п.).

Сфокусировала бы внимание на развитии института экспертизы и рецензирования, формировании корпуса экспертов (с привлечением низовых инициатив).

Представляется важным учесть, что наметившийся отказ от международного сотрудничества повлечет увеличение нагрузки на отечественные издания. Это означает, что должен быть пересмотрен статус научного редактора, в отрасль необходимо привлечь молодых специалистов и обеспечить адекватную заработную плату.

Уместно обязать распоряжения Минобрнауки к общественной экспертизе (чтобы не повторилась ситуация, когда за нарушения и мошенничество массово выдаются надбавки, а добросовестное оказывается нецелесообразным).

А теперь про суверенную базу данных. По моим ощущениям, пора все-таки слезть с лошади, которая умерла. Не стоит строить очередной «Хирш», пусть и на базе «государственной системы научно-технической информации, обеспечивающей централизованную обработку и децентрализованное использование научно-технической информации». Мы уже знаем наверняка, почему это не работает.

При этом оптимистично отмечу, что суверенная база может быть реализована в новой логике, отличающей ее от конкурентов, то есть стать флагманской. Например, ее можно сделать с использованием инструментов ИИ (искусственного интеллекта). Это хороший шанс сформировать базу с нуля, сделав менее уязвимой и более адекватной современному миру и его возможностям.

Что может дать ИИ? Например, «обратный» вариант разработки индекса. С помощью группы экспертов по ряду отраслей или направлений отбираются действительно важные авторы и публикации, затем ИИ на базе этой выборки анализирует их публикации, цитирования — и строит модель, которая будет давать некоторый индекс уже на базе неизвестной заранее методики (методику построит ИИ).

При разработке показателей публикационной активности и суверенной базы данных научного цитирования учитывала бы следующее:

Важно проанализировать параметры, заложенные в существующие индексы, провести адекватный отбор необходимых показателей. Провести проработку и учет новых показателей для создания математической модели индекса, в том числе полноценно принять во внимания обзоры и исследования по данной теме, например [3]. Проверить параметры на устойчивость к мошенничеству. Обеспечить совместимость созданного индекса с существующими (иначе это будет не совсем внятная система, повисшая «в вакууме»).

Алгоритм оценки должен быть динамическим. В противном случае он не защищен от мошенничества (симулировать необходимые параметры под статистическую оценку совершенно не трудно, в итоге мы видим, что на настоящий момент имеет место не поощрение научной деятельности, а поощрение лучших мошеннических практик).

Подсчет индекса — это работа с динамически быстро изменяемой системой (постоянно возникают новые направления, данные, важные изобретения в совершенно различных областях, при этом часть прежне важных данных быстро устаревает), это должно быть учтено при разработке базы данных. Надо помнить, что речь идет не об одном индексе, а о системе индексов, включающей оценку не только статей, но и авторов, академических изданий, научных направлений, рецензентов. В научных публикациях все они неразрывно связаны, невозможно построить полноценную систему анализа, опираясь на мониторинг лишь одного из них.

Важна опция рейтингования журналов и издательств, в которых цитировались статьи авторов.

Рецензирование (экспертные заключения для журналов должны учитываться и иметь свой вес при оценке репутации ученого).

Работа с «шумами» в информационном смысле (по Шеннону) — необходима опция фильтрации: исключение дублирующих публикаций и т. д. Это даст возможность, например, для анализа корпуса соавторов с целью выявления «покупного соавторства».

Каталогизация: чтобы поддерживать актуальность сведений, надо новые публикации (и старые, возможно, тоже) каталогизировать, то есть относить к тем или иным областям научных знаний. Важные разработки идут на стыках научных дисциплин и возникает сложная задача: куда отнести публикацию? Пример — радиометрия с использованием радиоактивного материала в медицине (это и ядерная физика, и медицина).

Учитывать размывание границ между техническими и «гуманитарными» дисциплинами. Пример — генетический анализ в медицине, археологии и истории (пути миграций), т. е. необходима возможность относить материалы сразу к нескольким категориям.

Важно заложить адекватные параметры оценки цитирования авторами из смежных научных дисциплин. Таким образом, ученые, работающие на стыке нескольких дисциплин, могут получить более высокие показатели.

Индекс должен позволять «измерять» важность публикаций для конкретной страны или отрасли, для оценки вложений ресурсов в это направление.

Подсчет индекса — это «большие данные». Нужны полноценные поисковые системы со статистической обработкой.

Поддержка множества языков (как минимум основные европейские и азиатские).

Анализ и проработка корреляции между существующими индексами и новым для возможности проверки оценочных характеристик публикаций и учета исторических данных.

Связь с актуальностью научного направления: если проводить измерения наибольшего количества новых патентов или исследований в том или ином направлении (например, резкий рост исследований и новых материалов при открытии графена), то можно связать индекс цитирования с актуальностью с точки зрения инноваций.

Реализация возможности рейтингования материалов экспертами (из «белого» корпуса экспертов), т. е. опция саморегулирования академической среды.

Интеграция с базой ретрагированных статей.

Интеграция с сервисами депонирования.

Возможность публикации и учета препринтов.

Несмотря на кажущуюся сложность, мы вполне можем наметить план действий для создания такой суверенной базы:

Создание списков источников данных, на основе которых будет разрабатываться индекс (на первых этапах в основу отечественной базы данных могут быть заложены издания из RSCI, «белые» списки НИУ ВШЭ, ядро РИНЦ).

Создание математического аппарата построения индекса.

Определение объемов обрабатываемых данных в динамике, требований к подобной системе и т. д.

Построение «пилота» для одного или нескольких языков и регионов, либо научных направлений, отладка системы.

Постепенное развертывание с добавлением источников данных для глобального охвата.

Анна Кулешова, канд. социол. наук, председатель Совета по этике научных публикаций,

член Комиссии РАН по противодействию фальсификации научных исследований

1. forbes.ru/society/459835-vlasti-vveli-moratorij-na-ucet-statej-rossijskih-ucenyh-v-zarubeznyh-zurnalah

2. minobrnauki.gov.ru/press-center/news/? ELEMENT_ID=48219

3. Saarela M., Kärkkäinen T., Lahtonen T., Rossi T. Expert-based versus citation-based ranking of scholarly and scientific publication channels // Journal of Informetrics. Volume 10. Issue 3. 2016. P. 693–718. DOI: 10.1016/j.joi.2016.03.004

