Même si la plupart des langues peuvent être représentées grâce à un jeu de 128 caractères, il y a d'autres langues qui requièrent des jeux de caractères bien plus grands. Des méthodes de caractères multioctets ont été développées pour résoudre ce type de problème.
Lorsqu'on manipule des chaînes de caractères multioctets, pour couper, rechercher ou nettoyer une chaîne, il faut utiliser deux octets consécutifs, qui représentent un seul caractère. Si l'on n'y prend pas garde, on va obtenir une chaîne corrompue et invalide, avec une représentation totalement incompréhensible.
mbstring fournit les fonctions spécifiques de manipulations
de chaînes qui permettent de travailler avec les encodages multioctets en PHP.
En plus de cela, mbstring gère la traduction
entre les jeux de caractères disponibles. mbstring est
également connu pour gérer l'Unicode, comme UTF-8 et UCS-2 ainsi que de
nombreux autres jeux mono-octets (listés dans
Encodages de caractères pris en charge).