Транслит

Материал из Seo Wiki - Поисковая Оптимизация и Программирование

Перейти к: навигация, поиск

Трансли́т (название произведено сокращением слова «транслитерация») — передача русского текста латинскими буквами, иногда также цифрами и иными доступными знаками. Так могут называть и сам русский текст, набранный латинскими буквами.

Иногда транслитом также называют аналогичное явление применительно к другим языкам с нелатинской письменностью. По-болгарски оно называется шльо̀кавица или мето̀диица.

По некоторым сведениям, в профессиональной речи слово «транслит» иногда используется вместо слова «транслитерация».[1]

Типичные соответствия знаков в транслите
(более распространенные варианты даны первыми)
БукваТранслит БукваТранслит БукваТранслит
аa кk, c чch, č, 4
бb лl, Jl шsh, š, w, 6
вv, w мm щsh, sch, shch, šč,
shh, w
гg нn
дd, g оo ъ', y, j, '', #,
опускается
еe, ye, je пp
ёyo, jo, io, e рr ыy, i
жzh, ž, j, z, g, * сs ь', y, j,
опускается
зz, 3 тt
иi уu эe, e', je, eh, ye
йy, j, i,
опускается;
-ий/ый → y, i
фf
хh, x, kh юyu, ju, iu, u
цc, ts, z яya, ja, ia, a

Содержание

Принцип

Транслит в целом строится по принципу фонетических соответствий русских и латинских букв. Часто сочетаются правила чтения из разных языков: прежде всего конкурируют соответствия из старых латинских транскрипций польско-немецкого толка (й→j, ц→c, ы→y, ю→ju, я→ja) и позже усвоенные английские (й→y, ц→ts, ч→ch, ш→sh, ю→yu, я→ya…). Может использоваться и визуальное сходство знаков (ш→III или ш→w; ч→4; я→9I; ы→bl) — однако умеренно, поскольку в противном случае говорят уже не о транслите, а о «кодировке Волапюк». Заимствованные слова (и даже отдельные морфемы) могут передаваться в написании оригинала.

Типы транслита

Транслит однозначных и устойчивых правил не имеет — в этом, собственно, и состоит его отличие от транслитерации. Он варьирует от человека к человеку: у одних совершенно стихиен, когда одно и то же слово может передаваться по-разному на соседних строках, — у других же доходит до достаточно стройных систем, иногда совпадающих с каким-либо стандартом транслитерации, а иногда индивидуальных. Особенности применяемой разновидности транслита могут служить своего рода идентификатором автора сообщения.

Неупорядоченность и неоднозначность транслита (иногда сравниваемая [1] с временами до Кирилла и Мефодия, когда, по словам Черноризца Храбра, славяне пользовались «римскими и греческими письменами… без устроения») нередко создаёт проблемы при его чтении. Чтобы не возникало путаницы, желательно придерживаться распространённых стандартов транслитерации (например, ISO 9).

Существует четыре основных типа транслита:

  • Транскрипция — транслит, основанный на звучании букв. Близок к стандартным системам транскрипции букв наподобие ISO 9. Например, Vikipediya. Используется для написания СМС, в адресах русскоязычных сайтов, при работе в компьютерных программах, не поддерживающих кириллицу, и др. Характеризуется простотой ввода — нужны только латинские буквы. Некоторые трудности при чтении создают звуки, обозначаемые несколькими буквами: «ж» (zh), «ч» (ch), «ш» (sh), «щ» (shch).
  • «Один символ — одна буква». Наследники МТК-2 и КОИ-8. Алфавит расширяется спецсимволами наподобие @ и ^ для полной обратимости конвертации. Такой способ транслитерации труден и в наборе, и в расшифровке, поэтому используется очень редко — там, где обратимость важна. Например, Wikipediq.
  • «Геймерский язык» («кодировка Волапюк»). Применяются латинские буквы (с добавленим цифр и знаков препинания), внешне похожие на соответствующие русские буквы. Например, BuKunEDu9I. Этот способ ввода получил своё название из-за того, что во многих компьютерных играх (даже в русифицированных) нет возможности использования кириллицы в никах, и игроки часто пишут русские ники таким образом. Иногда такой способ набора используется в адресах русскоязычных сайтов. Например, kypc.ru, nouck.ru. В случае интернет-адресов можно написать таким образом далеко не все слова, например, нельзя написать слова с буквами Л, Ч, Щ. Геймерский язык достаточно легко читается (если к нему привыкнуть), но для длинных сообщений непригоден, так как очень сложен в наборе. Крайне редко используется для написания СМС.
  • «Вульгарный». Смесь транскрипции и геймерского языка, популярная в народе. Компромисс между простотой ввода и удобочитаемостью. Например, 4ernuy для записи слова «чёрный». Обычно используют «икс» для обозначения «х», четвёрку для обозначения «ч», звёздочку для «ж» и иногда «w» для «ш». Другие буквы передают с помощью фонетической транскрипции. Возможны различные вариации. Большинство людей пишут СМС именно таким способом.
  • «Пиратский». Часто используется в пиратских переводах игр. Латинские буквы заменяются похожими русскими. Сами буквы почти всегда одинаковые — АВСДЕГЖРіЬКЛМИОРЦЯЫТЮФШХУП (i игнорируется, вместо цифра 3 используется как З и Э, а цифра 6 используется как Б).

Применение

Транслит как явление (ещё без названия) возник в докомпьютерные времена (подобным образом, например, с середины XIX века передавали русские тексты международным телеграфом; см. также МТК-2), но особенно широко распространился в интернет-общении в связи с существовавшими (порой и существующими) проблемами отображения (см. «крокозябры») либо ввода русских букв — например, их может не быть на доступной в данный момент клавиатуре. Транслит активно применяется при общении посредством SMS, поскольку сообщение, набранное латиницей, может содержать примерно вдвое больше букв, чем при использовании кириллицы в кодировке юникод.

Имеется несколько несовместимых между собой[2] советских и российских официальных стандартов и правил транслитерации кириллицы латинским алфавитом:

  • Приложение № 7 к инструкции о порядке оформления и выдачи паспортов гражданам Российской Федерации для выезда из Российской Федерации и въезда в Российскую Федерацию[3]
  • ГОСТ 16876-71
  • СЭВ 1362-78
  • ГОСТ 7.79-2000 (перевод ISO 9)

В некоторых стандартах, например ГОСТ 16876-71 и ГОСТ 7.79-2000, описано несколько систем транслитерации. Одна для версии символ в символ (с использованием латинских диакритических символов), другая для преобразования одного символа кириллицы в один или несколько символов латиницы без диакритики.

Транслит в Интернете — изменения в XXI веке

В 1996—1999 гг. транслит был широко распространён в Интернете: в форумах и группах новостей Usenet, особенно вне России, было очень много сообщений транслитом; авторские сайты бывали в транслите. Но благодаря прогрессу в компьютерных технологиях, в XXI веке это кардинально изменилось, стало совсем легко поддерживать и чтение и ввод кириллицы.

Чтение
Кириллица изначально поддерживается в обычных шрифтах, включенных в поставку любой редакции Windows, будь то немецкая или корейская. Можно читать ru.wikipedia.org даже в интернет-кафе в Токио.
Ввод
Клавиатурные средства ввода кириллицы тоже изначально присутствуют, только в отличие от шрифтов, их надо активировать — обычным образом добавить русскую («RU») раскладку клавиатуры (keyboard layout), точно так же, как французскую («FR»). Причём Windows предлагает иметь — на выбор — несколько разных раскладок (англ. keyboard layouts) для одного языка.

Сотни тысяч русскоговорящих людей по всему миру, из тех, кто в XX веке годами писали транслитом сейчас общаются на форумах, в блогах и по e-mail используя стандартную кириллицу, так как сейчас:

  1. Не обязательно вводить именно с обычной, стандартной русской раскладкой клавиатуры (расположением букв), можно использовать метод В. Маслова — фонетическую раскладку основной, системной клавиатуры (см. ниже ссылку на Обзор методов ввода), когда ввод, при «RU», идет в режиме, привычном для таких людей: А—A, Б—B, Д—D, Ф—F, К—K, О—O,…
  2. В ситуации использования «чужого компьютера», например, в интернет-кафе в Барселоне, уже не надо использовать устаревшие методы (см. ниже ссылку на Обзор методов ввода) — не требуется трудоёмкий ввод мышкой с помощью виртуальной клавиатуры или ненадёжные «перекодировщики текста, введенного латиницей». Можно и в интернет-кафе производить ввод текста удобно и привычно — точно как дома: на современных сайтах, где полностью имитируется «домашний», «системный» ввод, и можно вводить с той же раскладкой, что дома — стандартной или фонетической.

Современные, простые методы ввода кириллицы (включая метод В.Маслова) за рубежом — дома или в Интернет-кафе — собраны в Обзоре «FAQ-Часто Задаваемые Вопросы: как писать кириллицей вне России/СНГ»

Примечания

См. также

Ссылки

Кодировки символов
Основы → алфавиттекстфайлданные ) • набор символовконверсия
Исторические кодировки → Докомп.: семафорная (Макарова)МорзеБодоМТК-2 Комп.: 6 битУППRADIX-50EBCDICДКОИ-8 ) • КОИ-7ISO 646
совре-
менное
8-битное
представ-
ление
символы ASCIIуправляющиепечатные ) не-ASCIIпсевдографика )
8бит. код.стр. Разные →   Кириллица: КОИ-8ГОСТ 19768-87MacCyrillic
ISO 8859 → 1(лат.) 2 3 4 5(кир.) 6 7 8 9 10 11 12 13 14 15(€) 16
Windows → 1250 1251(кир.) 1252 1253 1254 1255 1256 1257 1258WGL4
IBM&DOS → 437850852855866 «альт.»МИК )
Много-
байтные
Традиционные → DBCSGB2312 ) • HTML
Unicode → UTF-16UTF-8список символовкириллица )
Связанные
темы →
интерфейс пользователяраскладки клавиатурлокальперевод строкишрифткрокозябрытранслитнестандартные шрифтытекст как изображение Утилиты: iconvrecode
bg:Шльокавица

de:Translit en:Translit es:Translit

Личные инструменты

Served in 0.244 secs.