SCIgen
Материал из Википедии — свободной encyclopedia
SCIgen — компьютерная программа, генерирующая случайный текст, напоминающий научную статью, содержащую иллюстрации, графики и примечания. Заявленное назначение: «автоматически генерировать тезисы для конференций, подозреваемых в низком цензе приёма».
SCIgen | |
---|---|
Тип | Генератор текста |
Разработчики | Jeremy Stribling, Max Krohn, Dan Aguayo |
Написана на | Perl |
Операционные системы | Linux, FreeBSD |
Репозиторий | github.com/strib/scigen |
Лицензия | GNU GPL |
Сайт | pdos.csail.mit.edu/scige… |
В 2005 году «статья» Rooter: A Methodology for the Typical Unification of Access Points and Redundancy была принята к публикации (без рецензирования статьи) WMSCI[англ.] и авторы были приглашены на конференцию[1]. Авторы рассказали о мистификации на своём сайте, в результате чего конференция WMSCI лишилась финансовой поддержки со стороны IEEE.
Позже созданные с помощью программы «статьи» были приняты к публикации на конференциях IPSI-BG[2] и International Symposium of Interactive Media Design[3]. Студент из Ирана под псевдонимом Мосалла Нежад подал такую статью в журнал Applied Mathematics and Computation, где её приняли, но успели изъять до печати после объяснения, что это была мистификация[4].
В 2014 году только издательства Springer и IEEE удалили 120 «научных» статей, сгенернированных SCIgen и опубликованных в их научных журналах с 2008 по 2013 годы. Публикации программы попали на 30 различных научных конференций[5]. В апреле 2010 года автор SCIgen сгенерировал 102 фальшивые статьи и опубликовал их от имени вымышленного автора Айка Анткаре (англ. Ike Antkare). Публикации попали в базу Google Scholar, а индекс цитирования для Анткаре вскоре вырос до 94 баллов, что сделало виртуального персонажа на тот момент 21-м по цитируемости учёным в мире[6].
В 2021 году было опубликовано исследование 243 статей SCIgen, опубликованных в академической литературе. Они обнаружили, что статьи SCIgen составляют 75 статей на миллион статей (<0,01 %) по информатике, и что была рассмотрена лишь небольшая часть обнаруженных статей[7].