Галерея
7757 8119 8300 8698 8817 9504 9722 9937
Интересные записи
Новое на сайте
Новое

Введение в Unicode

Введение в UnicodeВынужденным наследником кода ACSII стал Unicode. Это стандартный 2-х или 4-х байтовый набор символов, где каждому их них сопоставляется уникальное число. Этот набор позволяет охватить символы алфавитов практически всех языков, существующих на планете. Переходя на язык баз данных, можно сказать, что этот набор символов позволяет индексировать все текстовые строки, на каком бы языке они ни вводились. Стандарт Unicode стал результатом разработок неправительственной организации под названием The Unicode Consortium. Первая версия стандарта Unicode (Unicode 1.0) была представлена в 1991 году и с тех пор адаптирована такими крупными производителями аппаратного и программного обеспечения, как Apple, HP, IBM, Microsoft, Oracle, SAP, Sun, Sybase, Unisys и многими другими (последняя версия стандарта, Unicode 5.0, была представлена в 2006 году). Кодировку Unicode требуют такие современные стандарты, как XML, Java, JavaScript, CORBA, WML и HTML. В грубом приближении этот стандарт соответствует стандарту ISO 10646. Он поддерживается большинством операционных систем, всеми веб-браузерами, основными СУБД и прочими программными продуктами. Появление стандарта Unicode и массы программных продуктов, его поддерживающих, способствовало процессу глобализации информационных технологий. Символьные типы данных Oracle большей частью совпадают со стандартом SQL:2003. Для строк фиксированной длины используется тип CHAR. По умолчанию длиной строки считается один символ, максимальная длина поля этого типа равна 2000 байтам. Тип данных VARCHAR2 в Oracle предназначен для хранения символьных строк переменной длины. Длины по умолчанию данный тип не имеет, так что можно в объявлении ее задать в пределах от 1 до 4000.