Взаимосвязь показателей цитирования российских учёных

Статья сокращена по просьбе редакции специально для «Советского физика». Редакция выражает авторам глубокую признательность за понимание. Полная версия статьи опубликована в «Вестнике РАН» за 2014 год (том 84, N 3, стр. 28-38).

В научной практике цитирование опубликованных ранее работ традиционно служило подтверждением преемственности выполненного исследования и помогало выразить мнение автора (авторов) о предшественниках и современниках, работавших и работающих над той же проблематикой или в той же области знания. Однако функции института цитирования этим не ограничиваются. Уже более 100 лет цитирование научных работ одновременно используется в качестве удобного и мощного инструмента саморекламы, а также поддержки своих коллег-единомышленников и борьбы с конкурентами и оппонентами. Замалчивание работ и результатов, полученных «соперниками», успешно применялось и применяется для того, чтобы помешать им быть услышанными другими членами научного сообщества.

В настоящей статье мы рассматриваем особенности и закономерности цитирования российских учёных в последние десятилетия, представив выводы, сделанные на основании проведённого нами наукометрического описания.

В силу нашей профессиональной принадлежности изученный материал преимущественно касается работ по неорганической химии и технологии неорганических материалов. Однако отдельные – более краткие – изыскания аналогичного типа в иных разделах естественных наук (физике, органической химии и др.) привели нас к сходным качественным и количественным результатам. Предлагаемое ниже описание не лишено исключений, но эти исключения не опровергают наших обобщений.

Данные по каждому из учёных в настоящей работе персонально не идентифицированы, но мы всегда будем рады в частном порядке ответить на личные вопросы заинтересованных читателей с соблюдением всех разумных требований конфиденциальности по отношению к остальным лицам, чьи показатели цитируемости были использованы в нашей статье.

В последние годы для оценки эффективности научной деятельности конкретного учёного широко применяется индекс цитирования, предложенный в 2005 г. Джорджем Хиршем и получивший название «Индекс Хирша» (h-индекс). Хирш ввёл свой индекс в качестве более простой и эффективной альтернативы наукометрическим параметрам (например, общему числу опубликованных работ учёного, суммарному или среднему количеству цитирований/упоминаний всех его статей и т.п.), использовавшимся до того времени в повседневной практике. Он предложил приписывать численное значение параметра h человеку, у которого h публикаций процитировано не менее h раз. Практика использования индекса Хирша достаточно быстро привела к пониманию границ его применимости. В частности, выяснилось, что корректно пользоваться h-индексом для сравнения результатов деятельности учёных можно, во-первых, лишь в отношении специалистов в одной и той же отрасли или, в крайнем случае, в смежных отраслях знания; во-вторых, сравнения должны производиться для близких временных интервалов.

Несмотря на критику, индекс Хирша обладает компактностью и информативностью и широко используется как дополнение к экспертным оценкам эффективности научной работы. Именно поэтому нам представляется необходимым ещё раз рассмотреть проблему зависимости индекса Хирша от иных библиометрических параметров, не используя при этом логически сомнительных и статистически случайных моделей в силу искусственного характера последних и их несоответствия реальной практике цитирования и/или самоцитирования научных работ.

В настоящей работе мы использовали сведения из базы данных Web of Science о 60 учёных, активно работающих (или работавших в конце ХХ – начале XXI в.) в физике, химии, науках о материалах и нанотехнологии, представляющих в основном Россию и, в несколько меньшей степени, Западную Европу и США. Выбор базы данных осуществлялся с учётом не только сложившейся репутации этого информационного продукта, но и присутствием в Web of Science библиографических данных, относящихся к более широкому временному периоду, чем данные, представленные в Scopus, Google Scholar и продуктах Chemical Abstracts Services. Полученные данные проверялись на отсутствие вкладов однофамильцев и/или идентичных публикаций, в том числе одних и тех же статей, опубликованных на разных языках. При анализе индивидуальных библиометрических данных мы учитывали общее количество научных публикаций No, число процитированных статей х0 и количество цитирований опубликованных статей того или иного автора N. Мы не делали различия между цитированиями и самоцитированиями в силу практической сложности формирования надёжных критериев такого различия. Общее число учтённых статей No колебалось от 31 до 1299, число цитирований работ N – от 31 до 20 379, индекс Хирша – от 3 до 66.

Попытки обнаружить корреляции между h-индексом и общим числом публикаций No или общим числом процитированных статей х0 не привели к успеху (см. полный вариант статьи).

Однако, для зависимости индекса Хирша от общего числа цитирований данного автора N коэффициент корреляции оказался равен 0.98: точки хорошо ложатся на кривую h = 0.56N0.48 (рис. 1).

Рис.1. Зависимость величины индекса Хирша от общего числа цитирований N

Рис.2. Оценка индекса Хирша. Данные для П.П. Фёдорова (май 2013 г.). hactual =24, h’estimated = 21.97.

Полученная корреляция связана с тем, что ранжированная зависимость числа цитирований i-статьи от её порядкового номера для конкретного автора, как правило, удовлетворительно описывается функцией y = ax–n,где n ~ 0.8. Тогда оцененное значение индекса Хирша h' получается как пересечение y = ax–n с функцией y=x, то есть (рис. 2):

Общее число цитирований данного автора N может быть оценено как

где x0 – порядковый номер первой статьи, цитированной хотя бы один раз, тогда

Принимая h ≈ bx0 (рис. 2) и подставляя x0 в предыдущее уравнение, получаем окончательную формулу:

Таким образом, проведённая оценка с использованием простой модели удивительно хорошо согласуется с эмпирической формулой.

Дополнительный анализ полученного результата позволил выявить следующие особенности. Во-первых, полнота выборки существенно не влияет на установленную корреляцию: данные, выбранные из Google Scholar и Scopus, хотя и заметно отличаются от данных Web of Science как по общим показателям цитируемости, так и по цитируемости отдельных статей, демонстрируют ту же зависимость. Во-вторых, с течением времени фигуративная точка, отражающая библиометрическоие показатели конкретного учёного, движется по той же кривой, точнее, движение точки носит ступенчатый характер ввиду целочисленного значения h, однако при этом незначительно отклоняется от сглаживающей кривой h = 0.56N0.48.

Правда, необходимо отметить, что в исследованной выборке имели место исключения – выбросы, связанные с наличием у определённого автора небольшого количества высокоцитируемых публикаций («автор одной хорошей статьи»).

Полученные результаты также показывают, что с ростом значения индекса Хирша hi нарастают трудности с дальнейшим повышением этого показателя. Среднее количество цитирований, необходимое для увеличения индекса Хирша на единицу, выражается формулой ΔN = (2/α2)h +1 ≈ 8h.

Данная корреляция устойчива к национальной принадлежности учёных. Тем не менее, при сопоставлении данных российских и зарубежных специалистов складывается вполне отчётливое впечатление, что при эквивалентных научных достижениях значения индекса Хирша западных специалистов существенно превосходят значения, которых достигает h-индекс у отечественных учёных. Действительно, во многих случаях при примерно одинаковом качестве научных исследований отечественные работы цитируются намного реже иностранных.

Эта проблема имеет две составляющие: сложность цитирования неанглоязычных работ, опубликованных в российских журналах, и цитирование публикаций российских учёных в международных журналах. Наблюдение за публикациями иностранных авторов в международных и национальных (особенно китайских) изданиях однозначно показывает, что зарубежные специалисты действительно читают российские статьи самым тщательным образом, но при этом избегают их цитировать. Здесь следует иметь в виду, что если бы российские работы были слабыми и ошибочными, их бы опровергали, но для этого их всё равно надо было бы упоминать. Поэтому можно сделать вывод, что отсутствие ссылок на российские источники, скорее всего, связано с недостаточной интегрированностью российских учёных в международное научное сообщество. Помимо этого, следует отметить особенности российских публикаций, обусловленные традициями и стилем написания, затрудняющими их цитирование. Зачастую имеют место сухое и краткое изложение полученных результатов, плохо написанное вступление, не хватает развёрнутого обсуждения результатов и иногда даже не все следствия из них представлены полно, не делается акцент на новизну, не учитывается необходимость излагать некоторые положения подробнее, а иногда и используя более простой язык. Авторы не умеют убедить, заинтересовать читателя, представить тематику своего исследования в привлекательном виде, в их работах полностью отсутствует такая составляющая, как самореклама. Отсутствие чётких, обоснованных выводов, детального анализа рассматриваемых данных, представления сделанных заключений и выведенных формул в логической последовательности, словесного пояснения смысла полученных уравнений серьёзно затрудняют восприятие российских статей не только обычным читателем, но и специалистом. В условиях информационного переизбытка подобные публикации, немодные по форме, отличающиеся пропуском очевидного, а значит, избыточного на взгляд авторов содержания, требуют для своего усвоения немалой работы мысли и потому редко получают заслуженное количество цитирований. (Заметим, что мы ни в коем случае не идеализируем качество публикаций в международных журналах, но разбор их особенностей выходит за рамки данной статьи.)

Что касается российских журналов, которые переводятся на английский язык, то, как правило, они представлены в базах данных в оригинальном русском и в переводном английском вариантах разобщённо. Это приводит к путанице при цитировании, которое зачастую делится между двумя вариантами одной и той же статьи, что затрудняет их нормальную библиометрическую обработку.

В последние годы наблюдается очевидное снижение уровня российских журналов. Это касается общего числа и качества статей и обусловлено в первую очередь далёким от оптимального состоянием российской науки в целом. Существенный вклад в такое снижение вносит и организация редакционной подготовки публикаций. Зачастую в российских журналах требуется только одна рецензия на статью, что повышает риск публикации низкокачественных работ. В то же время срок от получения редакцией статьи до её выхода в свет в российских периодических изданиях неоправданно велик (не месяцы, но годы!). Серьёзный негативный фактор – слабый интерес главных редакторов некоторых ведущих изданий к вверенным им журналам. Кроме того, редакции не проявляют должной активности в объективном отражении журналов в международных базах данных, включая постоянное отслеживание цитирования, заполнение пропусков, исправление ошибок, а также грамотную политику, направленную на включение российских периодических изданий в соответствующие информационные продукты. Добавим, что в ряде журналов не используется такой необходимый атрибут современных публикаций, как номер Digital Object Identifier (DOI).

Что касается публикаций отечественных учёных в зарубежных изданиях, то здесь следует выделить следующие трудности: языковой барьер, стиль изложения, различия в понимании исторического вклада тех или иных учёных в соответствующую область знания (зарубежная историография во многих случаях категорически не совпадает с российской). Однако главное осложняющее обстоятельство заключается в том, что ведущие международные издания фактически закрыты для российских учёных.

Существующая ныне практика международных научных публикаций и их цитирования основывается на устоявшемся согласии по поводу сложившейся иерархии: большие начальники от науки или лица, ассоциированные с теми или иными институтами, печатают сами себя в определённых ими же «статусных» периодических изданиях, заставляя остальных поддерживать этот порядок цитированием их «начальственных» статей в публикациях, размещаемых в журналах второго и третьего ряда.

За исключением весьма редких случаев, когда среди авторов статей, размещаемых в наиболее цитируемых зарубежных изданиях, присутствуют только российские специалисты, подавляющее большинство публикаций принадлежит:

● авторам с двумя или более адресами, только один из которых российский;

● авторам, участвующим в статьях с чрезмерно большим числом авторов – от 10 и более;

● авторам, публикующимся в соавторстве с заграничными коллегами, которые проталкивали статьи в журналы с высоким импакт-фактором.

Сплошь и рядом имеет место ситуация, когда статья не доходит до рецензирования, а сразу отклоняется менеджером из аппарата редакции. Иными словами, в последние годы единоличные редакторские действия заменили заранее обещанное, широко объявленное и гарантированное рецензирование “peer review”. Фактически произошло возвращение к публикационной практике первой половины ХХ в.

Выводы и рекомендации. Количество цитирований и, в конечном счёте, производный от этого фактора индекс Хирша – не показатель качества отдельной работы учёного, совокупности его работ или его научного уровня. Ссылаться могут и на ошибочные статьи. Индекс Хирша даже не всегда – знак важности, значимости и/или влияния. Наиболее адекватная интерпретация этого индекса – как критерия известности и разрекламированности работы (при всех тонкостях в различии между использованными выше терминами). В таком понимании не заложено негативное отношение к этому показателю. Просто нужно правильно понимать природу библиометрической информации и грамотно ею пользоваться.

Увеличить индекс Хирша и/или индекс цитирования можно, разумеется, только одним-единственным способом – исключительно за счёт цитирования. Именно поэтому ещё с конца XIX в. существовала научная политика «себя и своих цитируем, остальных игнорируем». Такое отсутствие дискуссии с оппонентом или открытого состязания с конкурентом является следствием подхода к научной деятельности как к игре с нулевой суммой. Один из примеров реализации такого подхода – целенаправленное непечатание и нецитирование работ конкурентов, например, российских авторов. Корни данного явления глубоки, возникло оно много десятилетий тому назад, и упоминания о неадекватном цитировании российских статей можно легко найти в современной наукометрической литературе. Заниженное цитирование научных работ отечественных авторов должно преодолеваться, но, разумеется, не посредством действий, нарушающих научную этику ради увеличения цитируемости, индекса Хирша и других библиометрических показателей. Достаточно, на наш взгляд, скорректировать существующую ныне культуру цитирования.

Широко распространённый в российской научной практике традиционный подход к цитированию можно охарактеризовать как минимализм. Он включает в себя ряд принципов:

● цитирование только необходимого минимума литературных источников;

● создание «исчерпывающей» подборки упоминаемой литературы, когда авторы зачастую избегают ссылок на смежные области;

● использование преимущественно книг, а не периодики;

● отказ от использования цитирования в качестве маркетингового оружия, в сочетании с настойчивым упоминанием тех зарубежных коллег, которые принципиально игнорируют самих авторов.

Ввиду перечисленных особенностей для изменения подхода к цитированию научной литературы мы бы хотели предложить:

● перейти к сбалансированной политике цитирования своих коллег;

● скорректировать стиль текстов, перейдя от расплывчатого, в общих словах изложения к работам утвердительного стиля, написанным чётким и ясным языком;

● публиковаться в высокоцитируемых журналах и на английском языке;

● отдавать предпочтение журналам реферируемым в Web of Science;

● с учётом исторической перспективы публиковаться в китайских журналах, но только в тех, статьи которых реферируются в “Chinese Science Citation Database”;

● не забывать о грамотном цитировании собственных работ: самоцитирование может быть весьма успешной рекламой достижений автора и тем самым привлекать внимание коллег к его работам, вызывая, как следствие, увеличение числа упоминаний его статей;

● отслеживать полноту и правильность упоминания собственных работ.

Редакциям же для поднятия импакт-фактора готовящихся их силами периодических изданий стоило бы печатать обзоры, особенно получающие сейчас широкое распространение мини-обзоры, а также практиковать экспресс-публикации сообщений с расширенными материалами научных конференций.

В целом мы надеемся, что проведённое нами изыскание будет способствовать более объективному пониманию особенностей использования научного цитирования и количественных библиометрических показателей, включая индекс Хирша. Знание состояния проблемы позволит наметить и осуществить меры, направленные на изменение создавшейся ситуации, как для отдельных учёных, так и в масштабе всего сектора российских научных периодических изданий.

П.П. Фёдоров, А.И. Попов