(PHP 5 >= 5.3.0, PHP 7, PHP 8, PECL intl >= 1.0.0)
Сравнивает строки с поддержкой порядка сортировки с учётом региональных настроек.
Collator::FRENCH_COLLATION
int
Сортировка строк с различными акцентами с конца строки. Этот атрибут автоматически устанавливается в On для французской и некоторых других локалей. Обычно пользователям нет необходимости специально задавать этот параметр. Существуют издержки производительности при сравнении строк, если этот параметр установлен как On, но это никак не влияет на длину ключа сортировки. Возможные значения:
Collator::ONCollator::OFF(по умолчанию)Collator::DEFAULT_VALUE
Пример #1 Правила FRENCH_COLLATION
Collator::ALTERNATE_HANDLING
Атрибут "Alternate" используется для контроля обработки так называемых "переменных символов" в UCA: пробелы, знаки пунктуации и символы. Если "Alternate" установлен как NonIgnorable (N), то различия в этих символах будут считаться такими же значимыми, как и различия между буквами. Если "Alternate" установлен как Shifted (S), то эти символы будут иметь низкую значимость. Значение Shifted зачастую используется в комбинации с Strength, установленным в "Quaternary". В таких случаях подобные символы будут учитываться при сортировке, но только если все остальные аспекты строк (буквы, акценты, регистр) идентичны. Если "Alternate" не установлен как "Shifted", то разницы между уровнями "Strength" 3 и 4 не будет. Более подробно и с примерами читайте в разделе "Variable_Weighting" на сайте » UCA. Причина, по которой значения для "Alternate" — это не просто On и Off, заключается в том, что в будущем могут быть добавлены дополнительные варианты. Опция UCA "Blanked" выражается с помощью "Strength", установленного в 3, и "Alternate", установленного в "Shifted". Для большинства локалей этот параметр по умолчанию равен "NonIgnorable". Если задано "Shifted", то обработка может быть медленнее в случае, если у вас много строк, отличающихся только пунктуацией. Длина ключа сортировки не затрагивается, только если также не увеличивался уровень "Strength".
Возможные значения:
Collator::NON_IGNORABLE(по умолчанию)Collator::SHIFTEDCollator::DEFAULT_VALUE
Пример #2 ALTERNATE_HANDLING rules
Collator::CASE_FIRST
int
Атрибут "Case_First" используется для определения порядка сортировки в зависимости
от регистра символов при отсутствии других различий в строках.
Возможные значения: Uppercase_First(U),
Lowercase_First (L), Default
и Off.
Между "Off" и "Lowercase_First" практически нет разницы, так что пользователи
обычно не используют "Lowercase_First", а только Off или Uppercase_First. (Те, кому действительно
интересна разница между X и L могут обратиться к Настройке Collation).
Задание L или U не сказывается на скорости сравнения, но влияет на длину ключа сортировки.
Возможные значения:
Collator::OFF(по умолчанию)Collator::LOWER_FIRSTCollator::UPPER_FIRSTCollator:DEFAULT
Пример #3 Правила CASE_FIRST
Collator::CASE_LEVEL
int
Атрибут "Case_Level" используется, когда акценты не важны, а регистр важен. В таких случаях установите "Strength" в значение Primary, и "Case_Level" в On. В большинстве локалей по умолчанию задано значение "Off". Оказывает незначительное влияние на скорость сравнения и длину ключа сортировки, если установлено как On.
Возможные значения:
Collator::OFF(по умолчанию)Collator::ONCollator::DEFAULT_VALUE
Пример #4 CASE_LEVEL rules
Collator::NORMALIZATION_MODE
int
Настройка "Normalization" определяет, будет ли текст тщательно нормализован в сравнении или нет. Даже если данная настройка отключена (по умолчанию для многих локалей), текст в общем случае будет сравниваться корректно (подробности в UTN #5). Проблемы могут быть только с отметками акцентов, расположенными в неканоничном порядке. Если установлено как On, то будет гарантирован наилучший результат для всех возможных вариантов текста. Однако, если установлено значение On, это скажется на скорости сравнения в зависимости от количества последовательностей, которые необходимо нормализовать. Какого-либо заметного влияния на длину ключа сортировки оказано не будет. Если заранее известно, что текст уже нормализован как NFD или NFKD, необходимости в использовании этой настройки нет.
Возможные значения:
Collator::OFF(по умолчанию)Collator::ONCollator::DEFAULT_VALUECollator::STRENGTH
int
ICU Collation Service поддерживает множество уровней сравнения (они называются "Levels", но также известны как "Strengths"). Использование этих настроек позволяет ICU сортировать строки точно в соответствии с правилами локали. Однако, разрешая выборочное использование этих уровней, поиск строки в тексте можно производить с использованием различных условий. Больше информации описано в главе, посвящённой collator_set_strength().
Возможные значения:
Collator::HIRAGANA_QUATERNARY_MODE
int
Совместимость с JIS x 4061 требует введения дополнительного уровня для выделения символов Hiragana и Katakana. Если требуется совместимость со стандартом, то этот атрибут потребуется задать как On, а "Strength" как "Quaternary". Это скажется на длине ключа сортировки и скорости сравнения.
Возможные значения:
Collator::OFF(по умолчанию)Collator::ONCollator::DEFAULT_VALUECollator::NUMERIC_COLLATION
int
Если включён, этот атрибут генерирует ключ сравнения для числового значения подстроки, состоящей из цифр. Это позволяет при сортировке помещать '100' после '2'.
Возможные значения:
Collator::OFF(по умолчанию)Collator::ONCollator::DEFAULT_VALUECollator::DEFAULT_VALUE
int
Collator::PRIMARY
int
Collator::SECONDARY
int
Collator::TERTIARY
int
Collator::DEFAULT_STRENGTH
int
Collator::QUATERNARY
int
Collator::IDENTICAL
int
Collator::OFF
int
Collator::ON
int
Collator::SHIFTED
int
Collator::NON_IGNORABLE
int
Collator::LOWER_FIRST
int
Collator::UPPER_FIRST
int
Collator::SORT_REGULAR
int
Collator::SORT_STRING
int
Collator::SORT_NUMERIC
int
| Версия | Описание |
|---|---|
| 8.4.0 | Константы класса стали типизированными. |