Руби (глоссы)

Руби (яп.: ルビ, ром.: rubi; кор. 루비, ром.: rubi) — небольшие аннотативные глоссы, которые обычно размещаются над или справа от логографических знаков языков восточноазиатской культурной сферы, таких как китайский ханьцзы, японский кандзи и корейский ханча, чтобы показать произношение логографов. Ранее они также использовались для вьетнамских тьы-хан и тьы-ном, и до сих пор иногда встречаются в этом контексте при чтении архаичных текстов. Такие аннотации, обычно называемые просто руби, чаще всего используются в качестве руководства по произношению иероглифов, которые, вероятно, незнакомы читателю.

Примеры

Вот пример японских иероглифов руби (называемых фуригана) для слова Токио («東京»):

Хирагана Катакана Ромадзи
(とう) (きょう) (トウ) (キョウ) () (kyō)

Большинство фуриган записывается слоговой азбукой хирагана, но иногда используются также катакана и ромадзи. В качестве альтернативы, иностранные слова (обычно английские) иногда пишутся фуриганой для передачи смысла, и наоборот. В учебниках иногда оное-чтения записываются катаканой, а куное-чтения — хираганой.

Ниже приведен пример рубиновых иероглифов для слова Пекин («北京») в чжуинь (он же бопомофо), сяоэрцзин и пиньинь.

Чжуинь Сяоэрцзин Пиньинь
(ㄅㄟˇ) (ㄐㄧㄥ) (ڭٍ) (بِی) (Běi) (jīng)

На Тайване основным слоговым письмом для китайских символов «руби» является чжуинь фухао (также известный как бопомофо); в материковом Китае в основном используется пиньинь. Как правило, в отличие от приведённого выше примера, чжуинь используется в вертикальном традиционном письме, и он пишется справа от иероглифов. В материковом Китае используется горизонтальное письмо, и символы «руби» (пиньинь) пишутся над китайскими иероглифами.

Сяоэрцзин — персидско-арабский алфавит, принятый мусульманами-хуэйцами и иногда используемый в качестве рубиновых иероглифов в различных рукописях. Эта система имеет свои недостатки, главным образом, из-за отсутствия возможности обозначения тонов. С распространением пиньинь использование этой системы в последние десятилетия пошло на спад. В большинстве рукописей, где иероглифы обозначены сяоэрцзин, они пишутся справа налево, что весьма необычно по сравнению с другими системами. Это связано с тем, что такие рукописи обычно содержат арабские тексты, такие как Коран, а китайское письмо служит лишь пояснением или переводом.

Книги с фонетическими справочниками (особенно пиньинь) популярны среди детей и иностранцев, изучающих китайский язык.

Вот пример корейских иероглифов «руби» для Кореи («韓國»):

Хангыль Ромаджа
() () (Han) (guk)

До появления хангыля в иностранных учебниках обычно использовалась корейская романизация (ромаджа). Символы Руби довольно часто встречаются на вывесках в некоторых частях Южной Кореи.

Вот пример вьетнамских символов руби (Тьы куокнгы) для Ханоя («河內»):

Тьы куокнгы
() (Nội)

Китайские иероглифы и их производные (тьы-хан и тьы-ном), которые использовались вьетнамцами, вышли из употребления уступив место латинскому алфавиту тьы куокнгы во время французского колониального периода, когда он стал частью обязательного образования (с 1920-х годов). В настоящее время они всё ещё используются народом цзин в Китай (субэтнос вьетнамцев).

Использование

Руби может использоваться по разным причинам:

  • из-за редкости иероглифа, а его произношение многим неизвестно (личные имена часто попадают в эту категорию);
  • потому что у иероглифа есть несколько вариантов произношения, и контекст недостаточен для определения того, какой из них использовать;
  • потому что предполагаемые читатели текста всё ещё изучают язык и не всегда знают произношение или значение термина;
  • потому что автор использует нестандартное произношение для иероглифа или термина.

Кроме того, «руби» может использоваться для обозначения значения, а не произношения, возможно, незнакомого (обычно иностранного) или сленгового слова. Это обычно используется в разговорной речи и применяется только в японских публикациях. Наиболее распространённая форма «руби» называется фуригана или ёмигана и встречается в японских учебных пособиях, газетах, комиксах и детских книгах.

В японском языке некоторые иероглифы, например, сокуон (促音) (маленький цу, っ), обозначающий паузу перед предшествующим ему согласным, обычно пишутся примерно в два раза меньше обычных иероглифов. При написании в стиле «руби» такие иероглифы обычно имеют тот же размер, что и другие иероглифы в стиле «руби». Развитие технологий позволяет теперь точно отображать некоторые иероглифы[1].

В китайском языке практика передачи фонетических подсказок с помощью руби встречается редко, но систематически встречается в учебниках и словарях для начальной школы. В Китае для этой практики нет специального названия, поскольку она не так распространена, как в Японии. На Тайване она известна как «чжуинь», по названию фонетической системы, используемой там для этой цели. Она практически всегда используется вертикально, поскольку публикации обычно имеют вертикальный формат, а чжуинь не так легко читать в горизонтальном положении. Там, где чжуинь не используется, используются другие китайские фонетические системы, например, пиньинь.

В академических целях вьетнамский текст, написанный на тьы-хан или тьы-ном, для современных читателей может быть дополнен руби тьы куокнгы[2].

Иногда межстрочные глоссы визуально похожи на руби, располагаясь над или под основным текстом более мелким шрифтом. Однако это отдельная практика, используемая для помощи студентам, изучающим иностранный язык, где глоссы используются для слов в тексте, а не для произношения малоизвестных символов.

Аннотации руби также могут использоваться в рукописном тексте.

История

В британской типографике «руби» изначально обозначал шрифт высотой 5,5 пунктов, который печатники использовали для межстрочных примечаний в печатных документах. В японском языке это слово стало обозначать не размер шрифта, а наборную фуригану. При обратной транслитерации на английский язык в некоторых текстах оно передавалось как «rubi» (типичная романизация японского слова ルビ, вместо ルビー (rubī), ожидаемой транслитерации слова «ruby»). Однако написание «ruby» стало более распространённым после публикации W3C рекомендаций по разметке «ruby». В США этот размер шрифта назывался «agate» (агат), и, согласно Оксфордскому словарю английского языка, этот термин используется с 1831 года.

HTML-разметка

В 2001 году W3C опубликовал спецификацию аннотаций Руби[1], дополняющую XHTML разметкой Руби. Разметка Руби включена в спецификацию XHTML 1.1 и HTML5[3].

Для браузеров, не поддерживающих Руби изначально, поддержку Руби проще всего добавить с помощью правил CSS, доступных в интернете[4].

Разметка Руби структурирована таким образом, что если браузер не поддерживает Руби, отображается резервный рендеринг, состоящий из символов Руби в скобках сразу после основного текста.

W3C также работает над специальным модулем Руби для CSS уровня 2, который дополнительно позволяет группировать символы Руби и автоматически пропускать фуриганы, соответствующие их аннотированной части[5].

Пример разметки

Ниже приведены несколько примеров разметки Руби. Сначала отображается исходная разметка, затем — отрендеренная разметка, а затем — неотмеченная версия. Веб-браузеры либо отображают её с правильным размером и позиционированием, как показано в примерах с таблицей выше, либо используют резервный вариант отображения с символами Руби в скобках:

XHTML CSS уровня 2[5]
Разметка
<ruby> 
東京 <rp>(</rp> <rt>とうきょう</rt><rp>)</rp>
</ruby>
<ruby><rp>(</rp><rt>ㄅㄟˇ</rt><rp>)</rp><rp>(</rp><rt>ㄐㄧㄥ</rt><rp>)</rp>
</ruby>
<ruby>
<rbc><rb></rb><rb></rb><rb></rb><rb></rb><rp>(</rp></rbc>
<rtc><rt></rt><rt></rt><rt></rt><rt></rt><rp>)</rp></rtc>
</ruby>
Визуально

東京( とうきょう)

(ㄅㄟˇ) (ㄐㄧㄥ)

()
()()
По умолчанию код выше приведёт к следующему эффекту. Для достижения этого эффекта может потребоваться дополнительная стилизация CSS.

Не размечено 東京(とうきょう) 北(ㄅㄟˇ)京(ㄐㄧㄥ) 振り仮名(ふりがな)

Обратите внимание, что китайские руби обычно отображается в вертикальных столбцах справа от каждого символа. В настоящее время этот подход обычно не поддерживается браузерами.

Это пример таблицы с вертикальными столбцами:

кит. трад.  кит. тайв. 

ㄥˊ
кит. трад.  кит. тайв. ˙

Сложная разметка Руби

Сложная разметка Руби позволяет связать более одного текста Руби с базовым текстом или части текста Руби с частями базового текста.[6]

Unicode

Unicode и сопутствующий ему стандарт, универсальный набор символов, поддерживают Руби посредством следующих символов межстрочной аннотации[7]:

  • Кодовая точка FFF9 (шестнадцатеричная) — якорь межстрочной аннотации — отмечает начало аннотируемого текста
  • Кодовая точка FFFA (шестнадцатеричная) — разделитель межстрочной аннотации — отмечает начало аннотируемых символов
  • Кодовая точка FFFB (шестнадцатеричная) — терминатор межстрочной аннотации — отмечает конец аннотируемого текста

Эти символы реализованы лишь в немногих приложениях. В Техническом отчёте Unicode № 20[8] разъясняется, что эти символы не предназначены для использования пользователями языков разметки и программных приложений, а предназначены для внутреннего использования либо в системах, либо в самих приложениях. В нём предлагается использовать вместо них разметку Руби, где это уместно.

Символы межстрочных аннотаций являются частью блока Unicode «Specials»:

Специальные символы[1][2]
Официальная таблица символов Консорциума Юникода (PDF)
  0 1 2 3 4 5 6 7 8 9 A B C D E F
U+FFFx
IA
A
IA
S
IA
T
OBJ
Примечания
1.^ По состоянию на версию 15.0.
2.^ Серые клетки обозначают зарезервированные кодовые позиции.

ANSI

Стандарт ISO/IEC 6429 (также известный как ECMA-48), определяющий управляющие последовательности ANSI, также предоставляет механизм для Руби-текста, используемый текстовыми терминалами, хотя лишь немногие терминалы и эмуляторы терминалов реализуют его. Управляющий код PARALLEL TEXTS (PTX) допускает шесть значений параметров, что обеспечивает следующие управляющие последовательности для обозначения Руби-текста:

  • CSI 0 \ или просто CSI \, поскольку 0 используется в качестве значения по умолчанию для этого элемента управления) – конец параллельных текстов
  • CSI 1 \ – начало строки основного параллельного текста
  • CSI 2 \ – начало строки дополнительного параллельного текста
  • CSI 3 \ – начало строки дополнительной фонетической разметки на японском языке
  • CSI 4 \ – начало строки дополнительной фонетической разметки на китайском языке
  • CSI 5 \ – конец строки дополнительной фонетической разметки

См. также

  • Харакат – озвученные диакритические знаки арабского письма, которые оказывают фонетическое содействие при чтении текстов на арабском языке.
  • Никуд – озвученные обозначения гласных в еврейском письме, которые помогают при чтении на иврите. (Еврейское абджад обозначает только согласные.)
  • Шаблон:Rubi

Примечания

  1. 1 2 Martin Dürst; Tex Texin; Marcin Sawicki; Michel Suignard; Masayasu Ishikawa. Ruby Annotation. W3C Recommendation. World Wide Web Consortium (31 мая 2001). Дата обращения: 14 февраля 2007.
  2. Lunde, 2009, p. 529.
  3. W3C Ruby Markup Reference.
  4. CSS Ruby Support Архивировано 28 февраля 2007 года.—Works in all modern browsers
  5. 1 2 CSS Ruby Annotation Layout Module Level 1. Дата обращения: 3 марта 2021.
  6. Complex ruby markup
  7. 23.8 Specials: Annotation Characters // The Unicode Standard, Version 15.0. — Mountain View, CA : Unicode, Inc, September 2022.
  8. Martin Dürst; Asmus Freytag. Unicode in XML and other Markup Languages. W3C and Unicode Consortium (16 мая 2007). Дата обращения: 23 марта 2018. Архивировано из оригинала 19 февраля 2005 года.

Литература