theretalk.ru

    Главная      
Программирование
Самоучители:

 

Символы

Для записи одиночных символов используются следующие формы.

  • Печатные символы можно записать в апострофах: 'а', 'N', '?'.
  • Управляющие символы записываются в апострофах с обратной наклонной чертой:
    • '\n' — символ перевода строки newline с кодом ASCII 10;
    • '\r' — символ возврата каретки CR с кодом 13;
    • '\f' — символ перевода страницы FF с кодом 12;
    • '\b' — символ возврата на шаг BS с кодом 8;
    • '\t' — символ горизонтальной табуляции НТ с кодом 9;
    • '\\' — обратная наклонная черта;
    • '\"' — кавычка;
    • '\'' — апостроф.
  • Код любого символа с десятичной кодировкой от 0 до 255 можно задать, записав его не более чем тремя цифрами в восьмеричной системе счисления в апострофах после обратной наклонной черты: '\123' — буква S, '\346' — буква Ж в кодировке СР1251. Не рекомендуется использовать эту форму записи для печатных и управляющих символов, перечисленных в предыдущем пункте, поскольку компилятор сразу же переведет восьмеричную запись в указанную выше форму. Наибольший код '\377' — десятичное число 255.
  • Код любого символа в кодировке Unicode набирается в апострофах после обратной наклонной черты и латинской буквы ц ровно четырьмя шестнад-цатеричными цифрами: '\u0053' — буква S, '\u0416' — буква Ж.

Символы хранятся в формате типа char (см. ниже).

Примечание

Прописные русские буквы в кодировке Unicode занимают диапазон от '\u0410' — заглавная буква А, до '\u042F' — заглавная Я, строчные буквы от '\u0430' — а, до '\044F' — я.

В какой бы форме ни записывались символы, компилятор переводит их в Unicode, включая и исходный текст программы.

Замечание

Компилятор и исполняющая система Java работают только с кодировкой Unicode.

 

Интернет и сети
Самоучители:
Статьи:

theretalk.ru 2007-2008 г.

Rambler's Top100


на www.altavista.ru