Викии Вики
Викии Вики
Advertisement
Викии Вики
1864
страницы
PageSize in History

Вес статьи в истории правок

Вес — одно из свойств страницы, оценивающее, сколько памяти занимает данная страница в базе данных конкретной вики.

Описание[]

Весом страницы считается только формирующая её викиразметка, а не информационный объем отрендеренной страницы, которую видит пользователь. Следовательно, не учитывается викитекст, добавленный с помощью конструкции подстановки или в результате вызова функции парсера, и не учитывается размер вставленных в нее изображений. Объём статьи имеет верхний предел, и этот предел довольно большой. В настройках движка MediaWiki для Фэндома используется стандартное значение — 2048 кибибайт или 2 097 152 байта[1].

Информация о весе страницы обновляется после каждой правки и остается в истории статьи. Зелёные или красные цифры изменения объёма отражают вес, который приобрела или потеряла страница в результате правки. Актуальный вес можно получить, использовав параметр адресной строки ?action=info, волшебное слово {{REVISIONSIZE}} (или {{PAGESIZE:страница}} для другой страницы) или обратившись к истории.

Расчёт веса[]

Общая длина страницы является суммой весов каждого из входящих в нее символов. На Фэндоме используется кодировка UTF-8, в которой символ имеет различный вес в зависимости от положения в таблице, выражаемого шестнадцатеричным числом в формате U+xxxx.

Диапазон кодов Вес символа Описание
от до
U+0000 U+007F 1 байт Символы, входящие в таблицу ASCII, — стандартная латиница, цифры, основные знаки пунктуации и наиболее употребимые специальные символы.
U+0080 U+07FF 2 байта Символы расширенной латиницы (буквы с диакритикой и проч.), кириллицы, арабицы, армянского, еврейского алфавита; типографические формы некоторых знаков пунктуации (например, кавычки « и »); испанские знаки пунктуации (¿ и ¡); некоторые специальные символы.
U+0800 U+FFFF 3 байта Символы греческого, грузинского, корейского, эфиопского алфавита, алфавита чероки, японской каны, различных индийских азбук; китайские и японские иероглифы; типографические формы многих знаков пунктуации (в числе прочего: тире — и –, кавычки „ и “, многоточие …, апостроф ’); китайские и японские знаки пунктуации; некоторые специальные символы.
  • Символы индийской азбуки деванагари состоят из непосредственно символа и верхней черты и занимают, таким образом, 6 байт.
U+10000 U+1FFFFF 4 байта Эмодзи.
  • Значки флагов состоят из двух эмодзи и занимают, таким образом, 8 байт.

Таким образом, статья, содержащая только текст «Hello, world!», будет иметь вес 13 байт[2], а содержащая текст «Привет, мир! 😄» — 26 байт[3].

Предназначение[]

PageSize Requirement

Ценз блога по объему на конкурсе

Вес страницы является одной из важнейших характеристик статьи, отражающей, как правило, степень наполненности и проработанности статьи. Это учитывается при построении списка самых длинных страниц и это же может быть использовано разработчиками скриптов, анализирующих контент вики, для фильтрации страниц по объему. Кроме того, вес статьи может служить цензом для участия в каком-либо конкурсе.

Изменение веса позволяет на глаз определить характер правки. Сильное уменьшение размера страницы, почти равное её исходному объему, может служить сигналом вандальной правки, равно как и чрезвычайное увеличение длины статьи, которая полностью описывает свой предмет.

Примечания[]

  1. Документация MediaWiki
  2. Все символы весят по одному байту, так как относятся к диапазону ASCII.
  3. 9 кириллических знаков по два байта, 4 символа из таблицы ASCII по одному байту и один эмодзи в четыре байта.
Advertisement