Пользователи Steam всё-таки нашли списки с запрещёнными словами. Есть и те, за которые могут забанить

Пост опубликован в блогах iXBT.com, его автор не имеет отношения к редакции iXBT.com
| Мнение | Игры

На днях пользователи Steam обратили внимание на то, что в файлах торговой площадки есть текстовые файлы, предназначенные для фильтрации сообщений. Правда на эти документы датируются осенью 2020 года. То есть, этим данным уже 3 года! Из этого можно сделать предположение, что они обновляются в реальном времени без отображения последней редактуры, либо не обновлялись вовсе. Я решил быстренько глянуть что там такого интересного и преподнести это вам.

Источник: steam.ru

Итак! Все данные разделены на 3 категории:

  • filter_banned_*язык* — слова, за которые можно забанить аккаунт;
  • filter_clean_*язык* — разрешенные слова, использование которых в определённых контекстах может вызвать вопросы при проверке;
  • filter_profanity_*язык* — слова, не являющиеся основанием для бана, но будут подвергаться цензуре. В основном, здесь представлены нецензурные выражения.

Под каждую категорию у Valve заготовлено по 29 текстовых документов, каждый из которых содержит в себе слова для определённого языка. Некоторые из этих файлов вообще пустые, а другие, наоборот, готовы похвастаться настолько обширным словарным запасом, что могут превзойти все остальные 28 документов.

Вот так выглядит список японских слов, за которые можно получить бан. И да, я ничего не редактировал!

Ещё одной особенностью этих списков является то, что модераторы стараются выявлять зашифрованные оскорбления.

Просмотрев все эти файлы, я обратил внимание на следующие моменты:

  • Наиболее богатым на сквернословие оказался польский язык. Valve нашла у них 6 843 матерных слова. Только по словам, за которые можно заработать бан он оказался лишь на втором месте;
  • Наибольшее количество запрещённых слов оказалось в индонезийском языке. Модераторы внесли в список 354 слова;
  • К тому же, модераторы стараются следить за активностью «недоброжелателей», которые стараются использовать «шифровки» в виде оскорблений. Некоторые из них вносятся в списки, но что они значат — неизвестно;

n+([ehiy]+|ay|ey|io|[il]+)[bgq$]+h?(a+|aer|a+h+|a+r+|e+|ea|eoa|e+r+|ie|ier|let|lit|o|or|r+|u|uh|uhr|u+r+|ward|y+)s*

Если я правильно понял, то это оскорбление как-то связано с темнокожими людьми.

  • Русский язык оказался намного беднее индонезийского и польского языков как в оскорблениях, так и в мате. В нашем языке модераторы нашли лишь 116 слов, за которые можно забанить аккаунт и ещё 1 987 слов, которые будут подвергаться режиму цензуры;
  • Для украинского языка были сделаны отдельные языковые фильтры. Вот только они делят с нами одни и те же места в топе т.к. украинские наборы слов являются полной копией русских фильтров. В списках полностью отсутствуют характерные украинские слова и выражения.

Если у вас есть желание взглянуть на эти списки, то знайте, что все эти 3 года данные находились в папке «Steam/resourse» и вряд ли переедут куда-то в ближайшее время. В ней же есть картинки отображением звёзд для оценивания пользовательских работ, функциональные иконки, локализация самой площадки и многое другое, что связано с дизайном и функционалом площадки Гейба Ньюэлла.

PCДругойДругая
Автор не входит в состав редакции iXBT.com (подробнее »)
Об авторе
Высказываю непопулярное мнение на популярные (и не очень) темы. YouTube: https://youtube.com/@danya_shepard?si=TC5lhQGbPffAf5HD

8 комментариев

Добавить комментарий

L
Чёт я не понял. Я не совсем те слова ожидал встретить в русском списке…
DanyaShepard
Читайте внимательнее название файлов. Это Clean-фильтр. Я мог бы вставить списки с матами и оскорблениями, но тогда модерация iXBT не пропустила бы блог. А так, там по всем трём фильтрам наборы одинаковые.
S
Что-то я не понял, это слова, которые проверяются в чатах и рецензиях? А почему тогда эти списки находятся в локальных ресурсах? Что, если вручную отредактировать эти файлы, то списки фильтруемых слов реально поменяются?
DanyaShepard
Не задумывался об этом, но скорее всего, это повлияет только на работу Вашего фильтра и не более. К тому же это не отменяет того, что за эти слова можно будет получить бан или то, что они будут зацензурены у других людей.
UPD: Проверил. Файлы спокойно выпиливаются при включенном стиме, но цензура не убирается. К тому же эти файлы быстро восстанавливаются, когда делайте полный перезапуск. В процессе запуска он проверяет наличие всех файлов и догружает чего не хватает. А ещё Steam откатывает все изменения, которые были сделаны в файлах.
S
Тогда, скорее всего, эти файлы просто кэшируют содержимое сервера, а их нетронутость наверное проверяется по хэшу. На этих файлах экономия конечно копеечная, но, если это общий подход для целой кучи разных данных, то смысл есть.
DOK
«Наиболее богатым на сквернословие оказался польский язык. Valve нашла у них 6 843 матерных слова»
шта? у них кроме «курвы» нет больше ничего
Korzh
Вы просто не умеете его готовить :)
LaNocheOscura
Самое интересное в filter_profanity_english
167 позиций, из них 87 на русском языке.

Добавить комментарий

Сейчас на главной

Новости

Публикации

Почему шерсть мериноса так ценится? Греет, не колется и не пахнет — научный взгляд на природные технологии

Несмотря на появление высокотехнологичных синтетических материалов, натуральная шерсть мериноса остается одним из самых востребованных видов сырья в производстве функциональной одежды. Ее...

Могла ли Земля случайно занести жизнь на спутник Юпитера? Как миллионы наших бактерий ежесекундно падают на Европу

Поиски внеземной жизни сосредоточены на ледяных спутниках планет-гигантов. Европа, один из крупнейших спутников Юпитера, обладает глобальным океаном жидкой воды, который расположен под...

Поджарит с корочкой: обзор аэрогриля Dreame Tasti PT60 с двумя чашами в комплекте

Люблю готовить с аппетитной корочкой, но не люблю тратить на это время. В этом меня выручает аэрогриль Tasti PT60 от Dreame. Его особенность — сразу две стеклянные чаши в комплекте и...

FiiO JadeAudio Level 1 — компактно, функционально и мощно — обзор 600-ваттного усилителя для акустики

Насколько я знаю, до Level 1 у компании FiiO еще не было усилителей для акустики. У них есть несколько серьезных настольных усилителей для наушников и активная акустика, а вот усилителей для...

Как мальтийцы полвека получают прибыль от декораций к провальному фильму

Далеко не каждый фильм становится культовым. Как показывает практика, часто деньги вливаются в ленту, которой не суждено даже окупиться. И на позорном кассовом провале такие фильмы заканчиваются,...

Можно ли снести дом на своем участке и построить новый

Многие владельцы домов сталкиваются с ситуацией, когда старое жилье приходит в негодность или перестает соответствовать потребностям семьи. Но можно ли полностью снести существующий дом на...