Транслитерация

Предложение за транслитерация
(това е за руски език, вижте предложението за български език)

     Има два различни вида транслитерации, между които трябва да правим разлика. В единия случай говорим за транслитериране, което е предназначено за чужденци (например имената в личните карти и географските наименования, изписани на карти, улични табели и пътни знаци). Във втория случай говорим за транслитериране, предназначено за руснаци (например когато се пише e-mail на руски език, предназначен за руснак, но поради технически проблеми не може да бъде използвана кирилицата и се налага да се кодира на латиница).
     За да различи двете понятия, професор Владимир Успенски използва термина транскрипция, когато се касае за транслитериране за чужденци. Професор Любомир Иванов смята, че е по-правилно да се използва терминът транслитерация и в двата случая, но във втория той говори за обратима транслитерация, предназначена за технически цели.
     Двата вида транслитерация не могат да бъдат обединени в една транслитерационна схема, защото изискванията към тях са коренно различни и дори противоречиви. Когато транслитерираме за чужденци, ние трябва да го направим звукоподражателно, като при това трябва да изберем определен чужд език и да се съобразим с правилата му. Когато транслитерираме за руснаци не е нужно да търсим звукоподражателност, защото нашите читатели знаят как да прочетат думите и дори знаят как тези думи се пишат на кирилица. Нужно е само да кодираме кирилския текст на латиница по някаква проста система, която е желателно да бъде обратима, за да може лесно и дори автоматично да може да се възстанови кирилският текст от кодираното на латиница.

За транслитерацията, предназначена за чужденци, може да се използва следната транслитерационна схема:

а - a е - e й - y о - o у - u ш - sh э - e

б - b ё - e к - k п - p ф - f щ - shch ю - yu

в - v ж - zh л - l р - r х - h ъ - я - ya

г - g з - z м - m с - s ц - ts ы - i ье - ye

д - d и - i н - n т - t ч - ch ь - ьи - yi

     За втори, по-кратък и обратим стандарт предлагаме да се кодират 33-те букви на кирилицата чрез 26-те букви на латиницата, като всяка буква от кирилицата си има съответна буква на латиница, с изключение на двойните (Щ, Ю, Я и Ё), които се кодират като (ШЧ, ЙУ, ЙА, ЙО) и на Ь, Ъ, Э, които се кодират както следва: Малки ( ', ", /e) и главни ( &', &", /E).
     Как ще се кодират останалите 26 букви? За 20 е ясно - както в таблицата от въпросника. Остават 6, а именно: Й, Ц, Ы, Ш, Ч, Ж. Предлагаме буквите Й, Ц и Ы да се кодират като J, C и Y, защото звучат сходно, защото така се изписват в славянските езици, използващи латиница и защото така е в съществуващата фонетична подредба на клавиатурата.
     Остава да се кодират Ш, Ч, Ж. Неизползваните до момента букви от латиницата са w, q, x и предлагаме да се кодират в този ред, заради леката графична прилика.

Така полученият вариант на кодиране може да се види в таблиците, които следват, но е по-лесно да се оцени, ако се натисне жълтата стрелка и се погледне вторият вариант на въпросника, който е кодиран по този начин.

Малки букви:

а - a е - e к - k п - p ф - f щ - wq ю - ju

б - b ж - x л - l р - r х - h ъ - " я - ja

в - v з - z м - m с - s ц - c ы - y ё - jo

г - g и - i н - n т - t ч - q ь - '

д - d й - j о - o у - u ш - w э - /e

Главни букви:

А - A Е - E К - K П - P Ф - F Щ - Wq Ю - Ju

Б - B Ж - X Л - L Р - R Х - H Ъ - &" Я - Ja

В - V З - Z М - M С - S Ц - C Ы - Y Ё - Jo

Г - G И - I Н - N Т - T Ч - Q Ь - &'

Д - D Й - J О - O У - U Ш - W Э - /E

Предимствата на предложения вариант са три:

Първо, той е сравнително лесен за научаване, защото кодирането на почти всички букви е логично, с изключение на четири, при три от които е съвсем нелогично (Ш, Ч, Ж), а при една е донякъде логично (Э). Тоест, научаването се свежда до запомняне на кодирането на четири букви.

Второто предимство е краткостта. Повечето руски букви се предават с една латинска буква или знак. Изключение правят само 5 букви, които се кодират с два знака (Щ, Ю, Я, Ё, Э).

Третото и най-важно предимство е, че декодирането е много лесно. Причината за това е, че почти всички букви съответстват едно към едно. Грешка може да се получи само при двойните букви (Щ, Ю, Я, Ё). Например Щекотливый може да се декодира като Шчекотливый, което е грешка, но не така ужасна, каквато е декодирането на Схема като Шема (тоест Щекотливый и Шчекотливый се пишат различно, но се произнасят почти еднакво). Дори такива грешки трудно биха се допуснали, защото двойните букви ще се декодират слято, с изключение само на случаите, в които това е изрично указано.

Дотук стандартът е прост и на практика е обратим за текстове без правописни грешки. Ще добавим още четири правила, които ще позволят в текста да има включени думи на латиница и ще направят кодирането 100% обратимо за произволен текст (дори ако е с правописни грешки). Тези четири допълнителни правила ще усложнят стандарта, но можем да предполагаме, че хората няма да ги учат и няма да ги ползват, а само компютърните програми ще ги прилагат.

     1. Допълнителното правило за текст, включващ думи на латиница, е тези думи да се заграждат със символът *. Ако в текста се среща символа *, то той трябва да се повтори (да се замени с два символа *).
     2. Допълнително правило за разделяне на двойни букви е да се пише / между тях. Например името Майа ще се кодира така: Maj/a.
     3. Когато в текста се срещат символите апостроф и кавичка ( ' и "), то пред тях се пише символа /, за да не се бъркат тези символи с кодираните Ь и Ъ малки. (При декодирането няма да се прави разлика между символа апостроф и символите отварящ и затварящ апостроф (‘ ’ ‚‹ ›), както и между символа кавичка и символите отваряща и затваряща кавичка (“” „ «»), защото някои текстови редактори автоматично заменят тези символи с отварящи и затварящи апострофи и с отварящи и затварящи кавички. Затова символът / ще се пише пред всичките тези символи (шестте символа за апостроф и шестте за кавичка). Unicode номерата на тези символи са U+0027, U+2018, U+2019, U+201A, U+2039, U+203A и U+0022, U+201C, U+201D, U+201E, U+00AB, U+00BB.)
     4. Допълнително правило за кодирането на символите / и &. Тези символи се заграждат със символа *, когато в противен случай може да се получи колизия с правилата 2 и 3 или с кодирането на някоя от буквите Ь, Ъ и Э. Например последователностите от символи ш/ч и ю&"я се кодират съответно w*/*q и ju*&*/"ja.

Назад към първата страница на инициативата

а - a	е - e	й - y	о - o	у - u	ш - sh	э - e
б - b	ё - e	к - k	п - p	ф - f	щ - shch	ю - yu
в - v	ж - zh	л - l	р - r	х - h	ъ -	я - ya
г - g	з - z	м - m	с - s	ц - ts	ы - i	ье - ye
д - d	и - i	н - n	т - t	ч - ch	ь -	ьи - yi