Кодирует строку ISO-8859-1 в кодировке UTF-8


(PHP 4, PHP 5)

utf8_encodeКодирует строку ISO-8859-1 в кодировке UTF-8

Описание

string utf8_encode ( string $data )

Эта функция кодирует строку data кодировкой UTF-8, и возвращает закодированный вариант. UTF-8 - стандартный механизм, используемый в Unicode для кодирования wide character значений в поток байтов. UTF-8 не оказывает влияния на незашифрованные ASCII символы, он самосинхронизирующийся (это значит, что программно можно вычислить, где в потоке байт начинаются символы) и может использоваться функциями сравнения строк для сортировки и подобных задач. PHP кодирует UTF-8 символы в 4 байта, как показано ниже:

UTF-8 encoding
байты биты представление
1 7 0bbbbbbb
2 11 110bbbbb 10bbbbbb
3 16 1110bbbb 10bbbbbb 10bbbbbb
4 21 11110bbb 10bbbbbb 10bbbbbb 10bbbbbb
Каждая b представляет бит, который может быть использован для хранения данных символа.

Список параметров

data

ISO-8859-1 строка.

Возвращаемые значения

Возвращает UTF-8 перевод данных data.

Смотрите также

  • utf8_decode() - Преобразует строку с ISO-8859-1 символами кодированную в UTF-8 в однобайтную ISO-8859-1