Пользователи Steam всё-таки нашли списки с запрещёнными словами. Есть и те, за которые могут забанить

Пост опубликован в блогах iXBT.com, его автор не имеет отношения к редакции iXBT.com
| Мнение | Игры

На днях пользователи Steam обратили внимание на то, что в файлах торговой площадки есть текстовые файлы, предназначенные для фильтрации сообщений. Правда на эти документы датируются осенью 2020 года. То есть, этим данным уже 3 года! Из этого можно сделать предположение, что они обновляются в реальном времени без отображения последней редактуры, либо не обновлялись вовсе. Я решил быстренько глянуть что там такого интересного и преподнести это вам.

Источник: steam.ru

Итак! Все данные разделены на 3 категории:

  • filter_banned_*язык* — слова, за которые можно забанить аккаунт;
  • filter_clean_*язык* — разрешенные слова, использование которых в определённых контекстах может вызвать вопросы при проверке;
  • filter_profanity_*язык* — слова, не являющиеся основанием для бана, но будут подвергаться цензуре. В основном, здесь представлены нецензурные выражения.

Под каждую категорию у Valve заготовлено по 29 текстовых документов, каждый из которых содержит в себе слова для определённого языка. Некоторые из этих файлов вообще пустые, а другие, наоборот, готовы похвастаться настолько обширным словарным запасом, что могут превзойти все остальные 28 документов.

Вот так выглядит список японских слов, за которые можно получить бан. И да, я ничего не редактировал!

Ещё одной особенностью этих списков является то, что модераторы стараются выявлять зашифрованные оскорбления.

Просмотрев все эти файлы, я обратил внимание на следующие моменты:

  • Наиболее богатым на сквернословие оказался польский язык. Valve нашла у них 6 843 матерных слова. Только по словам, за которые можно заработать бан он оказался лишь на втором месте;
  • Наибольшее количество запрещённых слов оказалось в индонезийском языке. Модераторы внесли в список 354 слова;
  • К тому же, модераторы стараются следить за активностью «недоброжелателей», которые стараются использовать «шифровки» в виде оскорблений. Некоторые из них вносятся в списки, но что они значат — неизвестно;

n+([ehiy]+|ay|ey|io|[il]+)[bgq$]+h?(a+|aer|a+h+|a+r+|e+|ea|eoa|e+r+|ie|ier|let|lit|o|or|r+|u|uh|uhr|u+r+|ward|y+)s*

Если я правильно понял, то это оскорбление как-то связано с темнокожими людьми.

  • Русский язык оказался намного беднее индонезийского и польского языков как в оскорблениях, так и в мате. В нашем языке модераторы нашли лишь 116 слов, за которые можно забанить аккаунт и ещё 1 987 слов, которые будут подвергаться режиму цензуры;
  • Для украинского языка были сделаны отдельные языковые фильтры. Вот только они делят с нами одни и те же места в топе т.к. украинские наборы слов являются полной копией русских фильтров. В списках полностью отсутствуют характерные украинские слова и выражения.

Если у вас есть желание взглянуть на эти списки, то знайте, что все эти 3 года данные находились в папке «Steam/resourse» и вряд ли переедут куда-то в ближайшее время. В ней же есть картинки отображением звёзд для оценивания пользовательских работ, функциональные иконки, локализация самой площадки и многое другое, что связано с дизайном и функционалом площадки Гейба Ньюэлла.

PCДругойДругая
Автор не входит в состав редакции iXBT.com (подробнее »)
Об авторе
Высказываю непопулярное мнение на популярные (и не очень) темы. YouTube: https://youtube.com/@danya_shepard?si=TC5lhQGbPffAf5HD

8 комментариев

L
Чёт я не понял. Я не совсем те слова ожидал встретить в русском списке…
DanyaShepard
Читайте внимательнее название файлов. Это Clean-фильтр. Я мог бы вставить списки с матами и оскорблениями, но тогда модерация iXBT не пропустила бы блог. А так, там по всем трём фильтрам наборы одинаковые.
S
Что-то я не понял, это слова, которые проверяются в чатах и рецензиях? А почему тогда эти списки находятся в локальных ресурсах? Что, если вручную отредактировать эти файлы, то списки фильтруемых слов реально поменяются?
DanyaShepard
Не задумывался об этом, но скорее всего, это повлияет только на работу Вашего фильтра и не более. К тому же это не отменяет того, что за эти слова можно будет получить бан или то, что они будут зацензурены у других людей.
UPD: Проверил. Файлы спокойно выпиливаются при включенном стиме, но цензура не убирается. К тому же эти файлы быстро восстанавливаются, когда делайте полный перезапуск. В процессе запуска он проверяет наличие всех файлов и догружает чего не хватает. А ещё Steam откатывает все изменения, которые были сделаны в файлах.
S
Тогда, скорее всего, эти файлы просто кэшируют содержимое сервера, а их нетронутость наверное проверяется по хэшу. На этих файлах экономия конечно копеечная, но, если это общий подход для целой кучи разных данных, то смысл есть.
DOK
«Наиболее богатым на сквернословие оказался польский язык. Valve нашла у них 6 843 матерных слова»
шта? у них кроме «курвы» нет больше ничего
Korzh
Вы просто не умеете его готовить :)
LaNocheOscura
Самое интересное в filter_profanity_english
167 позиций, из них 87 на русском языке.

Добавить комментарий

Сейчас на главной

Новости

Публикации

Страна, которая строит крылья для Boeing: почему Япония так и не смогла создать собственный пассажирский авиалайнер

Япония — одна из ведущих технологических держав мира, страна, которая производит высокоточные компоненты для практически всех современных пассажирских самолётов Boeing и Airbus. Однако,...

Обзор TWS наушников Realme Buds Air7 Pro: аудиофильский кодек, встроенный ИИ-переводчик и 10 часов на одном заряде

Realme давно научилась делать устройства, которые выглядят и ощущаются дороже своей цены. Buds Air7 Pro — наглядное тому подтверждение. Это не бюджетная «затычка для звонков» и не...

Как мошенники берут кредиты через старые SIM-карты и забытые счета — и почему это опасно

В последние годы все чаще появляются истории, когда человек неожиданно узнает о кредите, который он никогда не оформлял. Иногда это происходит спустя месяцы или даже годы после того, как был утерян...

Закрывает все вопросы к налобному фонарю: обзор Wurkkos HD17

Не за горами уже лето и активности на природе до ночи. Начинаю подбирать себе свет для лесных походов, сплавов на каяке и поездок на электровелосипеде, перепробовал уже много фонарей, в одном мало...

Как зарегистрировать аккаунт PlayStation (PSN) в 2026 году

Ранее уже публиковал материал на эту тему, но тогда упустил некоторые важные нюансы. В этой инструкции покажу, как в 2026 году создать новый аккаунт PlayStation с нуля под нужный PS Store. Для...