Военная операция на Украине, 29 мар 2023, 05:00

«Ленинка» займется сохранением данных о спецоперации из Telegram

«Ленинка» запустила пилотный проект по сохранению данных о спецоперации из интернета. Сейчас разрабатываются методика отбора источников и система фильтрации материалов. Хранить планируют статьи из интернета и телеграм-каналов
Читать в полной версии
Фото: Станислав Красильников / ТАСС

Российская государственная библиотека (РГБ или «Ленинка») инициировала пилотный проект по сохранению архивов наиболее значимой информации о спецоперации, распространяемой в интернете. Об этом РБК рассказал глава РГБ Вадим Дуда.

Историческую и социальную значимость проекта Дуда аргументирует необходимостью сохранить для ученых будущего точные и достоверные сведения о текущих геополитических событиях. «Когда к нам приходят исследователи, которые пишут о Великой Отечественной войне, им доступен некий документальный фонд, посвященный этому периоду: есть огромное количество газет, как отечественных, так и зарубежных, — объясняет глава РГБ. — Пожелтевшая газетная полоса может быть очень точно атрибутирована, и работающий с ней ученый знает, что никто на этой полосе не изменил ни одну запятую». Однако сейчас «99% информации распространяется в интернете» и не попадает на печатные носители, отмечает Дуда. В этом случае у ученых нет гарантий того, что даже архивные версии web-страниц СМИ и постов в телеграм-каналах не будут подвержены изменениям.

На текущем этапе специалисты «Ленинки» разрабатывают методику отбора источников информации, а также систему фильтров публикуемых материалов, отмечает Дуда. Сохранению будут подлежать статьи из интернет-СМИ и влияющих на массовую аудиторию телеграм-каналов. «Я против идеи выкачивания всего, что есть в интернете, — объясняет глава РГБ. — Нужен очень осмысленный подход к тому, что было на самом деле значимым и оказало влияние на людей. Мы понимаем, что количество информационных источников за последние лет 20 увеличилось по экспоненте. В этом диком информационном потоке есть очень небольшое количество квантов информации, которые оставили какой-то след и изменили мнение сообщества. Именно их и надо научиться искать, фильтровать и сохранять в неизменном виде».

Комплектование базы данных, по замыслу авторов пилота, должно идти по гибридной модели. То есть часть информации, которая будет подлежать сохранению, отберут с помощью нейросетей, еще часть — в ручном режиме. Сведением полученных архивов займутся библиографы.

Презентация проекта запланирована на лето 2024 года. Сейчас РГБ занимается решением организационных вопросов по пилоту: созданием проектного офиса, утверждением дорожной карты проекта и формированием экспертного совета, который будет определять критерии и механику отбора сохраняемой информации.

Полноценная реализация проекта может потребовать изменения действующего законодательства, признает Дуда. Это в первую очередь касается сохранения материалов телеграм-каналов и последующего предоставления к ним публичного доступа. «За это нас могут попросту засудить, — объясняет глава РГБ. — Поэтому надо создавать определенную технологическую и нормативную базу, чтобы это все можно было законно сохранять».

Оценивать пилот, как уточняет глава «Ленинки», будет профильное Министерство культуры. Однако в поддержке со стороны министерства Дуда не сомневается: «Дело не в политике, на самом деле, а в очень спокойном, холодном, нейтральном подходе к тому, что мы не можем допустить искажения истории. Если мы этого не сделаем, кто-то ее перепишет за нас, и сделает это в электронном виде».

Pro
Как в России обслуживают офисные компьютеры после ухода западных вендоров
Pro
Хижина по цене шато. Почему туризм в России останется лишь для богатых
Pro
Новый ИИ инженера Суцкевера. Что известно о проекте выходца из OpenAI
Pro
«Критическая точка». Почему Европе угрожает долговой кризис
Pro
Как нанороботы помогают людям жить дольше
Pro
Цифровые двойники городов: как они устроены и зачем нужны
Pro
65% паролей взломают путем перебора за минуту. Как не попасть в это число
Pro
Против агрегаторов заводят уголовные дела. Что будет с этим рынком