(за руски език) |
За кодиране на руски език на латиница има две възможности. Първата е да се ползва стандартът за звукоподражателно кодиране на имена, макар този стандарт да не отговаря на изискванията за краткост и обратимост. Втората възможност е звукоподражателното кодиране да остане валидно само за кодиране на имена, а за комуникация между руснаци да се приеме втори, по-кратък и обратим стандарт.
За втори, по-кратък и обратим
стандарт предлагаме да се кодират 33-те букви на кирилицата чрез 26-те
букви на латиницата, като всяка буква от кирилицата си има съответна буква
на латиница, с изключение на двойните (Щ,
Ю,
Я
и Ё), които се кодират като (ШЧ,
ЙУ,
ЙА,
ЙО)
и на
Ь, Ъ, Э,
които се кодират както следва: Малки (
',
",
^e)
и главни ( ^',
^",
^E).
Как ще се кодират останалите
26 букви? За 20 е ясно - както в таблицата от въпросника. Остават 6, а
именно: Й, Ц,
Ы, Ш, Ч,
Ж. Предлагаме буквите Й, Ц
и Ы да се кодират като J,
C
и Y, защото звучат сходно, защото така се
изписват в славянските езици, използващи латиница и защото така е в съществуващата
фонетична подредба на клавиатурата.
Остава да се кодират Ш,
Ч, Ж. Неизползваните до момента букви
от латиницата са w,
q, x и предлагаме да се кодират в този
ред, заради леката графична прилика.
Така полученият вариант на кодиране
може да се види в таблицата, която следва, но е по-лесно да се оцени, ако
се натисне жълтата стрелка
и се погледне вторият вариант на въпросника, който е кодиран по този начин.
а - a | е - e | к - k | п - p | ф - f | щ - wq | ю - ju |
б - b | ж - x | л - l | р - r | х - h | ъ - " | я - ja |
в - v | з - z | м - m | с - s | ц - c | ы - y | ё - jo |
г - g | и - i | н - n | т - t | ч - q | ь - ' | |
д - d | й - j | о - o | у - u | ш - w | э - ^e |
Предимствата на предложения вариант са три:
Първо, той е сравнително лесен за научаване, защото кодирането на почти всички букви е логично с изключение на четири, при три от които е съвсем нелогично (Ш, Ч, Ж), а при една е донякъде логично (Э). Тоест, научаването се свежда до запомняне на кодирането на четири букви.
Второто предимство е краткостта. Повечето руски букви се предават с една латинска буква или знак. Изключение правят само 5 букви, които се кодират с два знака (Щ, Ю, Я, Ё, Э).
Третото и най-важно предимство е, че декодирането е много лесно. Причината за това е, че почти всички букви съответстват едно към едно. Грешка може да се получи само при двойните букви (Щ, Ю, Я, Ё). Например Щекотливый може да се декодира като Шчекотливый, което е грешка, но не така ужасна, каквато е декодирането на Схема като Шема (тоест Щекотливый и Шчекотливый се пишат различно, но се произнасят почти еднакво). Дори такива грешки трудно биха се допуснали, защото двойните букви ще се декодират слято с изключение само на случайте в които това е изрично указано.
Дотук стандартът е прост и е
обратим за текст без правописни грешки. Ще добавим още правила, които ще
позволят в текста да има включени думи на латиница и ще направят кодирането
100%
обратимо за произволен текст (дори ако е с правописни грешки). Тези допълнителни
правила ще усложнят стандарта, но можем да предполагаме, че хората няма
да ги учат, а само компютърната програма ще ги знае.
Допълнителното правило за текст,
включващ думи на латиница, е тези думи да се заграждат със символа `.
Ако в текста се среща символа `, то той трябва
да се повтори (да се замени с два символа `).
Допълнително правило за разделяне
на двойни букви е да се пише | между тях.
Например името Майа ще се кодира така: Maj|a
(има такова име и то е различно от Мая).
Когато в текста се срещат символите
( ',
"), то те
се ограждат с символа `, за да не се бъркат
тези символи с кодираните Ь, Ъ.
Аналогично символът ^
се ограждат с `,
когато е пред буквата
Е или пред '
или пред ".