Кулланучы бәхәсе:231013-a/Latin yazılışı

Битнең эчтәлекләре башка телләрдә бирелми.
Wikipedia — ирекле энциклопедия проектыннан ([http://tt.wikipedia.org.ttcysuttlart1999.aylandirow.tmf.org.ru/wiki/231013-a/Latin yazılışı latin yazuında])

Bu latıyn yazılışı öçen bäxäse.

Я в своё время пытался изучать французский, так вот, там с этими подстрочно-надстрочными знаками мне показался полный караул. Здесь я вижу подобное. Garant^^ 11. May 2009, 10:14 (UTC)

Дорогой Garant, это "отладочная версия" алфавита. Со временем исправим --Вячеслав 12. May 2009, 12:45 (UTC)

Konvertatsianıŋ bəxəse[вики-текстны үзгәртү]

Конвертрер нужен, это точно. Причем как в ту, так и в обратную сторону. Вы можете его написать? Если да, то можно обсудить особенности конвертации. На самом деле там все достаточно однозначно, и не обязательно даже вводить какие-то новые символы. Все-таки новый алфавит на основе латиницы был уже предложен и внесен в законопроект в свое время. – Timming 11. May 2009, 10:34 (UTC)

Delphidä äşlärgä mömkinme? Я уже начал. --Вячеслав 11. May 2009, 13:16 (UTC)
В принципе, на любом языке можно. Правда, хотелось бы, чтобы можно было потом сделать бота на основе этой программы, а ботов пишут, как я понимаю, на Перле или Питоне. Но это не так важно, если вы напишете хорошо работающую программу. – Timming 11. May 2009, 13:55 (UTC)

Вы предлагаете следующий вариант:

А - A
Ə - Ä (не Ə т.к. Ä - более общеизвестно)
Б - B
В - V
Г - G
Д - D
Е - Е
Ё - Ö
Ж - J
Җ - C
З - Z
И - İ
Й - Y
К - K
Л - L
М - M
Н - N
Ң - Ñ
О - O
Ө - Ө
П - P
Р - R
C - S
Т - T
У - U
Ү - Ü
Ф - F
X - X
Һ - H
Ц - Ţ (чтобы обойтись без диграфа)
Ч - Ç
Ш - Ş
Щ - Ś (чтобы обойтись без диграфа)
Ь - Î (в латинице Ь - это производная от И)
Ъ - ` (гравис)
Ы - I (ı)
Э - Ë (для отличия от Е)
Ю - Û
Я - Â

Как я понимаю, вы хотите любым способом избежать написания двух символов вместо одного. Для первой версии программы можно сделать и так, но потом все равно придется заменять некоторые символы комбинациями. Например, Я - YA, и так далее. От этого никуда не деться, потому что иначе мы с вами придумаем просто очередную латиницу. Предлагаю написать пока программу с предложенной вами таблицей символов и с конвертацией в обе стороны.

А на следующем этапе делать замену комбинаций. Как вы на это смотрите? – Timming 11. May 2009, 13:55 (UTC)

Yarar, и так можно. А какой алфавит был в законопроекте, не напомните? --Вячеслав 11. May 2009, 14:07 (UTC)
Яңалиф-2 [1] - Timming 11. May 2009, 14:17 (UTC)
Yañalif-2, конечно, очень хорошая основа, только опять вижу неразбериху с g/ğ и k/q, плюс ŋ ещё не везде есть. За основу взять стоит, но пару символов придётся сменить. И, кстати, "w" xərefe kiril əlifbasında niçek bula? (Пишу через ə т.к. ä выискивать неудобно, время теряется). И ещё мне кажется, что ğ и q можно приспособить для передачи кириллических гъ и къ, как в крымскотатарском: Икътисад-->İqtisad, Мәгълумат - Məğlumat
>плюс ŋ ещё не везде есть
что вы имеете в виду?
"w" - в кириллице передается буквой "в". Применяется в словах Авыл, Ватан. Читается как "у".
Timming 11. May 2009, 14:51 (UTC)
ŋ ещё не введена в Юникод. А в авыл и Ватан не совсем [у] а скорее [w] --Вячеслав 11. May 2009, 15:30 (UTC)
Oops, я кажется неправ... Нашёл ŋ в шрифте Batang. А вам как кажется, что "лучше": ŋ или ñ?--Вячеслав 11. May 2009, 16:11 (UTC)
Я считаю, что с точки зрения читабельности лучше "классический" первый вариант. - Timming 11. May 2009, 17:24 (UTC)
Раз уж зашла речь о "читабельности", то тогда придётся оставить q, ğ и w, но не давать им статуса самостоятельной буквы. Поставить в алфавит q как вариант k, ğ как вариант g, а w - как вариант v. --Вячеслав 12. May 2009, 06:45 (UTC)
Можно и так. – Timming 12. May 2009, 10:58 (UTC)
И ещё, я думаю, алфавит надо создавать такой, чтобы им было максимально удобно пользоваться, используя одну раскладку клавиатуры. Я думаю, наилучшим вариантом будет Азербайджанская (латиница), там основная часть букв есть (нет только w, ŋ) и ещё придётся заменить ä на ə, впрочем в Yaŋalif-2 так и есть. --Вячеслав 12. May 2009, 11:11 (UTC)
Да, я одно время тоже пользовался этой раскладкой. Она наверное лучше всего подходит. – Timming 12. May 2009, 11:53 (UTC)
И ещё надо что-то делать с Ь и Ъ, ведь их иногда можно "опускать" (l - это может быть как твёрдое, так и мягкое л/љ).
Я предлагаю сделать сперва просто замену букв. С комбинациями разбираться потом. Тема довольно запутанная, лучше разбираться по частям. – Timming 12. May 2009, 11:53 (UTC)
Делаю соответствия на основе первоначального варианта (сначала нужна отладочная версия), потом поправим и дополним. --Вячеслав 12. May 2009, 16:18 (UTC)
Timming, ğafu itegez, min xəzer Perldə yazıym (Delphidə yazarğa kübrək :) ). Ləkin redaktorda tatar (kirillik) xəreflər (məsələn ә, ө, ү, җ, ң, һ) yuq. Ə həm başqa tatar xəreflərneŋ urınında "?"lar. Ni öçen? --Вячеслав 21. May 2009, 15:38 (UTC)
Юникодта язмый торгансыздыр мөгаен... UTF-8 кодировкасын кулланырга кирәк. –Timming 21. May 2009, 15:52 (UTC)
Ə Yunikodta Perlnıŋ redaktorları barmı? Mineŋ berençe Perl-redaktor Yunikodta yazmıydı, ikençe şul... Yaŋa redaktor kirəkmi? --Вячеслав 22. May 2009, 08:12 (UTC)
Анысын белмим инде. —Timming 22. May 2009, 11:53 (UTC)
Простите за русский, боюсь наделать ошибок на татарском. Сейчас все эти соответствия заканчиваю, вчера консультировался насчёт конвертера с сербами (у них такая же ситуация), оказывается у них значительную часть работы выполнял пользователь zh-wiki, я его попросил проверить, а если ошибок много, то просто выслать копию конвертера с sr-wiki (Начало отправил по вики-почте, конец можете увидеть в 讨论). Что Вы по этому поводу думаете? Мне кажется, я всё равно что-то сделал не так :) --Вячеслав 25. May 2009, 03:46 (UTC)
Кажется, у казахов тоже существует латиница. Можно и с ними проконсультироваться. —Timming 25. May 2009, 10:20 (UTC)
İdeyabız bik yaxsı - Qazaqlarda öç yazılışılar (kiril, latin, ğərəp). Alarnıŋ konvertatsiya sisteması bik yaxsı.Qazaq Wikipediasınıŋ adminnarı kem?--Вячеслав 25. May 2009, 10:41 (UTC)
Менә монда карый аласыз [[2]] –Timming 25. May 2009, 14:32 (UTC)
Xəzer Arruahta yazıydım.Запросил только данные о языке программирования (думаю, все конвертеры в Виипедии написаны единообразно) и некоторых кодах (постоянно "вылезают" какие-то ошибки)Если он вышлет нужные файлы (а не только укажет на ошибки и т.д.), просто сменю буквы;döres bulamı? --Вячеслав 26. May 2009, 10:35 (UTC)
Шунда күрербез. —Timming 26. May 2009, 10:59 (UTC)
Arruah Вам ешё не ответил? Мне нет. --Вячеслав 27. May 2009, 11:08 (UTC)
А он мне должен ответить? —Timming 27. May 2009, 11:49 (UTC)
Не думаю, но подумал: раз не ответил мне, может кому-нибудь из администраторов... Ğafu itegez, не сочтите за дерзость. Кстати, пытался связаться с участником сербской Википедии, который тоже над конвертацией работал, но он (насколько я понимаю сербский) в викиотпуске. В ближайшее время постараюсь со всеми, кого мы здесь упомянули, связаться по е-mail (раньше как-то в голову не приходило :)) --Вячеслав 27. May 2009, 15:35 (UTC)
Одна голова – хорошо, а две – лучше =) —Timming 27. May 2009, 21:48 (UTC)
Xәzer bөten aŋladım. Əşlim...
Кстати, тут по ходу дела ещё сделал раскладку клавиатуры, как Вам можно её отправить 9если конечно вы не против её проверить)? --Вячеслав 30. May 2009, 07:46 (UTC)
Менә бу адреска җибәрә аласыз: Timming 30. May 2009, 08:38 (UTC)
Yazıydım --Вячеслав 30. May 2009, 11:12 (UTC)
Xәzer klaviaturası әşlimı? --Вячеслав 31. May 2009, 13:38 (UTC)
Юк шул :( --Timming 31. May 2009, 17:04 (UTC)

Насколько я понимаю, конвертационные скрипты пишутся на php. Don Alessandro 21. Yün 2009, 22:11 (UTC)

Хәерле көн! Друзья, как идут дела с конвертированием? Недавно почитал мнения посторонних людей про Татарскую Википедию, нам просто необходимо варианты чистая кирилица и чистая латиница для роста популярности! --Yildiz 16. Yül 2009, 13:22 (UTC)

Конвертация по таблице[вики-текстны үзгәртү]

Timming, я думаю, конвертацию нужно производить не "буква за буквой" (как в сербском), а примерно вот так

Отличная идея! --Timming 19. Yün 2009, 12:56 (UTC)

Rəxmət--Вячеслав 20. Yün 2009, 02:58 (UTC)

Бөтен эщләрегез килеп чыксын! УдачиNumenorean 17. May 2009, 08:28 (UTC)

Крымскотатарский транслитератор[вики-текстны үзгәртү]

Приветствую!

Мы с другом в своё время написали скрипт для транслитерации с латиницы на кириллицу и обратно текстов на крымскотатарском языке. Там правила отличные от татарского, но не менее замороченные, т.е. ни о каком взаимнооднозначном соответствии букв двух алфавитов речи не идёт. Но в итоге скрипт получился неплохой - криво транслитит только имена собственные. Вот сам транслитератор, скрипты, если интересно, могу прислать по почте.

В чём мы в итоге так и не разобрались, так это в том, как этот скрипт прикрутить к вики. (А крымскотатарской википедии транслитерация тоже очень нужна, ибо в Крыму много кто не владеет латиницей, а в многочисленной диаспоре в принципе не знают кириллицы).

Если кто-нибудь возьмётся помочь приделать наш скрипт к вики, был бы очень признателен. Don Alessandro 21. Yün 2009, 22:07 (UTC)

Как здорово, что вы занялись этим. Пришлите, пожалуйста, скрипт на . Мне кажется, что с небольшими поправками он отлично подойдет и для "казанскотатарского" языка. А насчет того, как прикрутить скрипт к википедии, попробуйте поинтересоваться в казахской википедии. Они это реализовали, насколько я понимаю. --Timming 21. Yün 2009, 22:50 (UTC)
Отправил. С небольшими поправками - это вряд ли, потому что заморочки у нас хоть и одинаковые по сути (транслитерация буквы зачастую зависит от соседних с ней букв), но абсолютно разные в конкретике. Но глядя на наш скрипт можно понять, как с помощью регулярных выражений в php можно сделать то, что вам нужно.
Как я понимаю у вас основные неоднозначности это:
  • г и к могут обозначать как g/k, так и ğ/q. Но тут всё вроде относительно просто - нужно смотреть на последующую или предыдущую гласную: если а/о/у/ы - то пишем ğ/q, если ә/е/ө/ү/и - то пишем g/k.
  • Латинскому ä в кириллице может соответствовать ә, я и а.
  • Кириллическое е может переходить в e, может в ye, a может в .
В принципе, всё это решается, нужно только аккуратно описать правила транслитерации.
Что касается казахской вики. Я в своё время общался с человеком, который делал такой скрипт там, и он мне много чем успел помочь. Но он в прошлом году довольно резко ушёл из вики, и на письма тоже перестал отвечать. :( Don Alessandro 22. Yün 2009, 15:10 (UTC)
Да, посмотрел код. Движок хорош, но вот наполнение придется полностью делать самим. Это при том, что лично моих знаний для того, чтобы прописать хотя бы все исключения, явно не хватает.
>Что касается казахской вики. Я в своё время общался с человеком, который делал такой скрипт там, и он мне много чем успел помочь. Но он в прошлом году довольно резко ушёл из вики, и на письма тоже перестал отвечать.
Это, видимо, судьба всех энтузиастов википедии. =)
Вячеслав, вы кажется общались еще и с сербами. Может, они смогут помочь? --Timming 22. Yün 2009, 15:21 (UTC)

Timming, можете мне это переслать? Я поправлю согласно таблице (если не возражаете) --Вячеслав 22. Yün 2009, 07:16 (UTC)

Эшләнде--Timming 22. Yün 2009, 15:06 (UTC)
Простите за долгое молчание - целый месяц творился какой-то бред с И-нетом ... Сейчас посмотрю, нет ли у сербов на этот счёт чего-нибудь.----Вячеслав 1. Aug 2009, 14:51 (UTC) 1. Aug 2009, 12:51 (UTC)
Я тут достал готовый рабочий скрипт по конвертации кириллица->латиница. Могу скинуть вам не e-mail. Осталось сделать обратную конвертацию, а также прикрутить все это хозяйство к википедии. --Timming 1. Aug 2009, 14:11 (UTC)
Отпправьте, пожалуйста --Вячеслав 1. Aug 2009, 14:44 (UTC)
Эшләнде--Timming 2. Aug 2009, 08:16 (UTC)

Don Alessandro, можно на отдельных подстраницах специально расписать транслитерацию для каждого буквосочетания? --Вячеслав 26. Sen 2009, 14:07 (UTC)

Для татарского? Вот тут вроде всё расписали. Don Alessandro 26. Sen 2009, 20:49 (UTC)

Раскладки клавиатуры[вики-текстны үзгәртү]

Создать раскладку клавиатуры для Windows - не проблема. Если хотите, я могу сделать с помощью Microsoft Keyboard Layout Creator, скажите только, что на какой клавише должно быть. На выходе будет раскладка, установить которую можно будет, запустив прилагающийся exe файл.

Можно сделать на базе турецкой, можно на базе азербайджанской (надо только определиться, какими символами будем жертвовать для освобождения места под дополнительные буквы), можно по типу польской программистской: буквы с диакритиками получаются нажатием Alt+соотв. буква без диакритики. Don Alessandro 22. Yün 2009, 17:01 (UTC)

С нажатием Альт+, по-моему, гениально. Вы могли бы сделать 2 раскладки: на основе русской и английской? --Timming 1. Aug 2009, 14:14 (UTC)
Как-то я не увидел это ваше сообщение. Прошу прощения. Вам с каким набором букв сделать: ə, ɵ, ŋ; ə, ö, ŋ или ä, ö, ñ? Лично мне так более симпатичен второй вариант, но более распространены первый и третий. Если хотите, можно три раскладки сделать. Don Alessandro 27. Sen 2009, 18:15 (UTC)
Предлагаю сделать так: для кириллической раскладки - буквы ә, ө, ү, ң, җ, һ; для латинницы: ə, ö, ŋ, ū, ç. --Timming 29. Sen 2009, 20:54 (UTC)
Сделал четыре варианта латинской раскладки и кириллическую. Куда выслать? Don Alessandro 30. Sen 2009, 19:37 (UTC)
Раскладки и инструкция по установке выложены здесь --Timming 29. окт 2009, 09:29 (UTC)

Описание правил транслитерации. Пока просто по-русски[вики-текстны үзгәртү]

Давайте попробуем сделать аккуратное описание правил транслитерации с кириллицы в стандартную латиницу. Для начала просто по-русски. Я начну, а вы продолжите, ибо я в татарской орфографии мягко говоря не силён. Don Alessandro 22. Yün 2009, 20:09 (UTC)

1) расставляем ğ и q

  • га, го, гу, гы > ğа, ğо, ğu, ğы
  • ка, ко, ку, кы > , , qu,
  • аг, ог, уг, ыг > аğ, аğ, , ыğ
  • ак, ок, ук, ык > аq, оq, uq, ыq
  • гъ > ğ
  • къ > q

2) обрабаотываем е, ю, я в начале слога В начале слова, а также после гласных, ь и ъ

  • е/ю/я > ye//, если сразу перед, сразу после, через одну или через две буквы следуют ә, е, и, ө, ү или ь
  • е/ю/я > /yu/ya в остальных случаях

3) преобразуем твёрдые гласные в мягкие, там, где это нужно

Если после буквы а/о/у/ы/ый сразу, через одну или через две буквы идёт ә, е, и, ө, ү или ь, то она заменяется на ä/ö/ü/e/i cоответственно.

Простите, что вмешиваюсь, но, как я понял, именно от Вас зависит, будет ли у нас долгожданный конвертор. :) . Возможно, стоит учесть особенности арабских заимствований (коих множество в татарском). Например, сәлам (транскрипция - [сәләм]). К тому же, упомянутая выше схема с /yu/ya в остальных случаях не всегда работает (дия будет конвертировано в diya, а должно в diyä). То есть нужно делать проверки и предыдущих букв. Правда, всё равно есть слова типа я (может транскрибироваться как ya, так и )... Впрочем, если конвертор делается для начального периода, можно, наверное, и без этого обойтись... --Himiq Dzyu 25. Yül 2009, 19:11 (UTC)

Транслитератор на JavaScript[вики-текстны үзгәртү]

На основе вот этого обсуждения сделал на JavaScript транслитератор кириллица > латиница. Don Alessandro 26. Sen 2009, 20:12 (UTC) Я попытаюсь сделать обратную конвертацию, что неясно - напишу здесь или в том обсуждении --Вячеслав 27. Sen 2009, 10:26 (UTC)

В целом транслит latin-kiril попроще, но свои нюансы тоже есть. Как например восстанавливать кириллический ь/ъ (если не хамза; с хамзой всё лучше засунуть в исключения)?

И ещё. В этом обсуждении я оставлял сообщение на тему использования букв ö/ɵ. Нельзя ли как-нибудь настроить возможность переключения между кириллицей, латиницей, иналифом и заманалифом (или хотя бы версиями с ä/ö/ñ и ə/ɵ/ŋ)? Тогда каждый будет использовать тот алфавит/версию алфавита, к которому/которой привык. --Вячеслав 27. окт 2009, 14:18 (UTC)

надо оставить, хотя бы как вариант. как писать һ на "чистой" латинице?

Кириллическая һ в латинице передаётся через h, а х - x --Вячеслав 29. окт 2009, 15:44 (UTC)