Форум программистов «Весельчак У»
  *
Добро пожаловать, Гость. Пожалуйста, войдите или зарегистрируйтесь.
Вам не пришло письмо с кодом активации?

  • Рекомендуем проверить настройки временной зоны в вашем профиле (страница "Внешний вид форума", пункт "Часовой пояс:").
  • У нас больше нет рассылок. Если вам приходят письма от наших бывших рассылок mail.ru и subscribe.ru, то знайте, что это не мы рассылаем.
   Начало  
Наши сайты
Помощь Поиск Календарь Почта Войти Регистрация  
 
Страниц: [1] 2  Все   Вниз
  Печать  
Автор Тема: О разговорных языках.  (Прочитано 8966 раз)
0 Пользователей и 1 Гость смотрят эту тему.
Aether
Специалист

ru
Offline Offline
Пол: Мужской

« : 28-01-2018 21:05 » 

Доброго вечера.

Затеял небольшой эксперимент: провести небольшую статистику по языкам, в частности по русскому и английскому, не сколько ради серьёзного научного результата, сколько для удовлетворения любопытства и развлечения.

Код набирал на скорую руку, возможны ошибки, но тем не менее:

За анализируемые тексты были взяты русская и английская версии произведения "Гарри Поттер и философский камень", интересно было бы также провести обратный анализ, то есть русского произведения, переведённого на английский.

Русская версия кратко:
(click to show)
Анализируемый файл: potter_rus.txt

        ... РАСПЕЧАТКА СЛОВАРЯ ...
 ИНДЕКС | РАЗМЕР | КОЛ-ВО ПОВТОРОВ | СЛОВО
      0 |      1 |            2677 | и
      1 |      1 |            2038 | в
      2 |      2 |            1814 | не
      3 |      3 |            1782 | что
      4 |      5 |            1639 | гарри
      5 |      2 |            1323 | на
      6 |      2 |            1253 | он
      7 |      1 |             875 | с
...
  15302 |     10 |               1 | пораженная
  15303 |     13 |               1 | нелюбезностью
  15304 |     12 |               1 | сомневайтесь
  15305 |     10 |               1 | ухмыляется
  15306 |     10 |               1 | повеселюсь
РАЗНОВИДНОСТЕЙ СЛОВ ИСПОЛЬЗОВАНО: 15307

Английская версия кратко:
(click to show)
Анализируемый файл: potter_en.txt

        ... РАСПЕЧАТКА СЛОВАРЯ ...
 ИНДЕКС | РАЗМЕР | КОЛ-ВО ПОВТОРОВ | СЛОВО
      0 |      3 |            3629 | the
      1 |      3 |            1918 | and
      2 |      2 |            1856 | to
      3 |      2 |            1755 | he
      4 |      1 |            1690 | a
      5 |      5 |            1317 | harry
      6 |      1 |            1299 | в
      7 |      2 |            1265 | of
      8 |      3 |            1185 | was
      9 |      2 |            1167 | it
     10 |      3 |            1022 | you
     11 |      1 |            1007 | s
     12 |      2 |             966 | in
...
   6187 |      9 |               1 | mustached
   6188 |      6 |               1 | manner
   6189 |      5 |               1 | haveв
   6190 |      7 |               1 | holiday
   6191 |      9 |               1 | spreading
РАЗНОВИДНОСТЕЙ СЛОВ ИСПОЛЬЗОВАНО: 6192

* ww.7z (449.38 Кб - загружено 635 раз.)
Записан
Sla
Модератор

ua
Offline Offline
Пол: Мужской

WWW
« Ответ #1 : 28-01-2018 22:28 » 

Толстой - Война и Мир Улыбаюсь
Записан

Мы все учились понемногу... Чему-нибудь и как-нибудь.
Алексей++
глобальный и пушистый
Глобальный модератор

ru
Offline Offline
Сообщений: 13


« Ответ #2 : 29-01-2018 08:55 » 

Aether, а в русском варианте сколько усатых ? Отлично
Записан

Aether
Специалист

ru
Offline Offline
Пол: Мужской

« Ответ #3 : 29-01-2018 10:04 » 

Оригинал на русском
"Война и мир"
Перевод на английский
"Война и мир"
Перевод на русский
"Гарри Поттер и ф. камень"
Оригинал на английском
"Гарри Поттер и ф. камень"
Разных слов
10503
5281
15309
6449
Ср. дл. слова
7,558
6,948
7,723
6,458
Всего слов
41756
48227
84350
79186
Всего букв
209626
211939
424558
340198

Из "Война и мир" была взята часть первого тома, русский и английский текст были кратко проверены на соответствие передаваемому смыслу.

* ww_2.7z (732.11 Кб - загружено 598 раз.)
« Последнее редактирование: 29-01-2018 10:07 от Aether » Записан
Aether
Специалист

ru
Offline Offline
Пол: Мужской

« Ответ #4 : 29-01-2018 10:07 » 

Aether, а в русском варианте сколько усатых ? Отлично
Кого? Улыбаюсь
Записан
Ochkarik
Команда клуба

ru
Offline Offline
Пол: Мужской

« Ответ #5 : 29-01-2018 11:10 » 

fantlab.ru
 Лингвистический анализ произведения
   Произведение: Война и Мир. Том 1

PS пардон, немножко не  о том, но просто вспомнил, что видел похожее)
алгоритм там ниже описан
« Последнее редактирование: 29-01-2018 11:13 от Ochkarik » Записан

RTFM уже хоть раз наконец!  RTFM :[ ну или хотя бы STFW...
Aether
Специалист

ru
Offline Offline
Пол: Мужской

« Ответ #6 : 29-01-2018 13:39 » 

PS пардон, немножко не  о том, но просто вспомнил, что видел похожее)
Я так понял, они пытаются выявить критерии стиля текста методами статистики, и кое-что у них получается. По крайней мере, параметров они вывели довольно прилично.

Просто я замечал, что один и тот же текст в разных языковых версиях имеет разную "плотность информации", теперь это можно в первом приближении увидеть в цифрах. В русском очень много синонимов, часто заимствованных из иностранных языков, от этого страдает точность, как понятий, так и текста в целом.

К сожалению, в консоли не могу представить японского языка, но сравнение также было неплохо бы провести, особенно в плане фонетики. В русском, как и в немецком, запредельное количество парных согласных, и от этого приходится напрягаться при произношении, а также сама речь становится как-бы ломаной, ораторы часто используют приёмы чередования и подпитки речи дополняющими словами, не несущими смысла, но делающими речь более приятной на слух. В японском языке, в фонетике, почти отсутствуют парные согласные, я не встречал более мягкой речи нигде более.

Цитата
К сожалению, в консоли не могу представить японского языка, но сравнение также было неплохо бы провести, особенно в плане фонетики. В русском, как и в немецком, запредельное количество парных согласных, и от этого приходится напрягаться при произношении, а также сама речь становится как-бы ломаной, ораторы часто используют приёмы чередования и подпитки речи дополняющими словами, не несущими смысла, но делающими речь более приятной на слух. В японском языке, в фонетике, почти отсутствуют парные согласные, я не встречал более мягкой речи нигде более.
Записан
Люсь
Модератор

ru
Offline Offline
Пол: Женский

« Ответ #7 : 30-01-2018 10:16 » 

Судя по тому, что имя Гарри упоминается в русском тексте на 300++ раз больше - русские явно что-то добавили в роман от себя... раза в 3++ так больше ))
Записан

Посторонним просьба не беспокоить!
-------------------------------------------------
O (I) Rh +
Люсь
Модератор

ru
Offline Offline
Пол: Женский

« Ответ #8 : 30-01-2018 10:20 » 

А японские иероглифы же переводятся в катакану, и затем их уже легко посчитать. Или я что-то не учитываю?
Записан

Посторонним просьба не беспокоить!
-------------------------------------------------
O (I) Rh +
Aether
Специалист

ru
Offline Offline
Пол: Мужской

« Ответ #9 : 30-01-2018 11:28 » 

А японские иероглифы же переводятся в катакану, и затем их уже легко посчитать. Или я что-то не учитываю?
Можно использовать и ромадзи, и писать просто латинской транслитерацией, однако, дело встаёт на кандзи, то есть в японском есть иероглифы, которые сразу обозначают понятие, мало того, в разных концах страны их произносят по разному. Сами японцы набирают текст на компьютере хираганой, а редактор сам позволяет выбрать окончательный вариант записи, обычно выбирают более короткий и традиционный, то есть одним иероглифом. Хирагана, которая содержит 47 слогов, тоже расширяется, например, дакутеном, что даёт ещё 47 слогов. В общем иероглифы это жесть. Улыбаюсь
Записан
Люсь
Модератор

ru
Offline Offline
Пол: Женский

« Ответ #10 : 30-01-2018 17:20 » 

Как они там живут бедные )) Хвала Кириллу и Мефодию )))
Записан

Посторонним просьба не беспокоить!
-------------------------------------------------
O (I) Rh +
Aether
Специалист

ru
Offline Offline
Пол: Мужской

« Ответ #11 : 30-01-2018 19:44 » 

Как они там живут бедные )) Хвала Кириллу и Мефодию )))
Интересно, кто-нибудь на форуме видит пользу в использовании латинницы взамен кириллицы, не в плане локальной транслитерации, а в максимально полном виде на официальном уровне?
Записан
Finch
Спокойный
Администратор

il
Offline Offline
Пол: Мужской
Пролетал мимо


« Ответ #12 : 31-01-2018 03:00 » 

Aether, Переход с одной системы азбуки на другую ничему хорошему, на мой взгляд, не приводит. Таких примеров в прошлом веке была уйма. И почему то в основном на территории бывшего СССР или бывшего социалистического лагеря.
Во первых: отбрасывается довольно большой пласт литературы, которая через одно или два поколений переходит в разряд "только для избранных" .
Во вторых: Возрастает обшая безграмотность населения. Коэффмцмент безграмостности снизится к прежнему уровню где то лет через 40.
В третьих: Не факт, что новая азбука будет хорошо отображать на письме все фонемы данного конкретного языка. Придется придумывать разные костыли.

PS. Кстати недавно смотрел ролик в зашиту буквы Ё. Один из примеров там дано было слово безнадежный - безнадёжный. Это два разных слова с разным логическим смыслом. Но сама буква костыль. Который многие и очень часто не применяют на письме.
« Последнее редактирование: 31-01-2018 03:08 от Finch » Записан

Не будите спашяго дракона.
             Джаффар (Коша)
Михалыч
Команда клуба

ru
Offline Offline
Пол: Мужской

« Ответ #13 : 31-01-2018 06:40 » 

Finch, к сожалению, ни первое, ни второе, ни третье - желающих поменять систему не смущает... Крайний (наверное все же не последний?) пример - Назарбаев в Казахстане подписал указ о переходе на латиницу. Вроде как в апреле начнут плавно переходить. Причем, если я правильно помню, упоминалось, как раз, что латиница будет лучше отображать фонемы.
Записан

Поживем - увидим... Доживем - узнаем... Выживу - учту  Улыбаюсь
Aether
Специалист

ru
Offline Offline
Пол: Мужской

« Ответ #14 : 31-01-2018 09:59 » 

В третьих: Не факт, что новая азбука будет хорошо отображать на письме все фонемы данного конкретного языка. Придется придумывать разные костыли.

Когда-то видел вот такую систему транслитерации, и она показалась весьма удобной:
а - a
б - b
в - v
г - g
д - d
е - ë
ё - ö
ж - j
з - z
и - ı
й - i
к - k
л - l
м - m
н - n
о - o
п - p
р - r
с - c
т - t
у - u
ф - f
х - x
ц - tc
ч - ts
ш - s
щ - cts
ъ - '
ы - y
ь - `
э - e
ю - ü
я - ä

Дело в том, что процесс трансформации русского языка идёт давно, и потери идут тоже давно, при этом и приобретается хорошее в большем объёме. Изначально, были попытки перейти на глаголицу из 41 знака, каждый из которых вообще никак не похож ни на современный кириллический алфавит, ни на греческий и ни на латинский. Затем появился классический славянский кириллический алфавит:



Потом его несколько раз переделывали сначала цари, а потом коммунисты. С задачей транслитерации и отбрасыванием "ять" справились без проблем.

Так вот, что имеем: если считать, что татары, чечены и многие народы республик имеют свои языки со своими алфавитами, то коренными пользователями русского алфавита являются несколько десятков миллионов человек. В то же время, латинницей пользуются несколько миллиардов человек по всему миру, и приобщение к этому большой плюс.

... пример - Назарбаев в Казахстане подписал указ о переходе на латиницу.
У нас татары довольно сильно заняты сейчас религиозным образованием, и лоббируют у себя переход на арабскую систему письменности.

* slav.jpg (100.85 Кб - загружено 831 раз.)
« Последнее редактирование: 31-01-2018 10:09 от Aether » Записан
Вад
Команда клуба

ru
Offline Offline
Пол: Мужской

« Ответ #15 : 31-01-2018 11:16 » 

Оригинал на русском
"Война и мир"
Перевод на английский
"Война и мир"
Перевод на русский
"Гарри Поттер и ф. камень"
Оригинал на английском
"Гарри Поттер и ф. камень"
Разных слов
10503
5281
15309
6449
Ср. дл. слова
7,558
6,948
7,723
6,458
Всего слов
41756
48227
84350
79186
Всего букв
209626
211939
424558
340198

Из "Война и мир" была взята часть первого тома, русский и английский текст были кратко проверены на соответствие передаваемому смыслу.
Просто сравнивать слова, на мой взгляд, неправильно. То, что в русском передаётся приставкой + корнем + суффиксом, в английском передаётся добавлением предлогов и модальных глаголов, что уменьшает число используемых слов при прямом подсчёте за счёт комбинаций. Вот если в русском приставку отделить и посчитать заново, считая приставку частью речи - полагаю, результаты могут выйти сравнимые (причём, и по средней длине слова, понятно почему Улыбаюсь), а то и не в пользу русского. Впрочем, так и так будет сравнение несравнимого.
« Последнее редактирование: 31-01-2018 11:19 от Вад » Записан
Aether
Специалист

ru
Offline Offline
Пол: Мужской

« Ответ #16 : 31-01-2018 12:23 » new

А я не зря привёл количество слов и букв в эквивалентном по смыслу тексте.

В случае русского оригинала при переводе на английский число слов возрастает на 16% при этом словарный запас сокращается на 50%.

В случае русского перевода в сравнении с английским оригиналом число слов сокращается на 6% при сокращении словарного запаса на 58%.

Асимметрия очевидна, хотя соглашусь, что критерий оценки крайне не точен. Возможно, более эффективным было бы сравнение следующим образом: соотношение количества букв таково, что в случае русского оригинала разница с английским переводом составляет около 1%. Однако, их алфавит состоит из 26 букв, а наш из 33, таким образом плотность информации опять у них получается выше в 1,27 раз. При английском оригинале число букв сокращается в 1,25 раз, что даёт значительное повышение плотности информации. Своеобразный "битрейт" получается. Улыбаюсь
Записан
darkelf
Молодой специалист

ua
Offline Offline

« Ответ #17 : 31-01-2018 13:06 » 

Можно использовать и ромадзи, и писать просто латинской транслитерацией, однако, дело встаёт на кандзи, то есть в японском есть иероглифы, которые сразу обозначают понятие, мало того, в разных концах страны их произносят по разному. Сами японцы набирают текст на компьютере хираганой, а редактор сам позволяет выбрать окончательный вариант записи, обычно выбирают более короткий и традиционный, то есть одним иероглифом. Хирагана, которая содержит 47 слогов, тоже расширяется, например, дакутеном, что даёт ещё 47 слогов. В общем иероглифы это жесть. Улыбаюсь
Там ещё и катакана есть, для заимствованных слов, типа Гарри, Хогвартс и прочих Дамблдоров с Воландемотрами. В сухом остатке - есть кандзи - китайские иероглифы и есть две слоговые азбуки - хирагана - для служебных и некоторых других слов и окончаний, и катакана - для заимствованных слов и выделения в тексте.

А по-поводу латинизации - у нас, на Украине, на волне "революции достоинства" раздавались призывы отказаться от кириллицы, но потом как-то всё заглохло. Правда до сих пор существует сайт , на площадке которого некоторыми товарищами предлагались свои варианты украинской латиницы. По моему мнению у большего числа вариантов в качестве недостатков было то, что либо калькировали с английского, вплоть до ш - sh, щ - sch, ц - c, ч - ch, либо эти алфавиты придумывали ниразу не лингвисты, а "революционеры", соответственно ни с тем, что-бы придуманный вариант был удобен для использования, а с чисто с политическими целями - как некоторые писали - что-бы "кляти москали" не смогли прочитать. По поводу количества букв в алфавите - если-бы я придумывал свой вариант латиницы для украинского, боюсь, у меня-бы получилось не 26 английских, а около 46-х букв (с циркумфлексами и прочими диакритическими знаками), а в самом минимальном - 42 буквы, считая апостроф - зато каждой фонеме соответствовала своя буква алфавита.

Кстати у японцев, как я понимаю, романдзи и был вариантом отказа от "устаревших" и не прогрессивных китайских иероглифов и перехода на прогрессивный латинский алфавит, но потом они как-то подумали, и решили, что им и так неплохо, а глупые гайдзины пусть мучаются. Китайцы, корейцы, евреи, арабы и прочие индусы тоже не очень торопятся отказываться от своих алфавитов. А из наших бывших соотечественников - те-же грузины и армяне вполне себе используют ни на кого не похожие собственные алфавиты.
« Последнее редактирование: 31-01-2018 13:50 от darkelf » Записан
Aether
Специалист

ru
Offline Offline
Пол: Мужской

« Ответ #18 : 31-01-2018 13:47 » 

Если я правильно помню, то хирагана и катакана имеют одинаковый слоговый состав, но разную графику. Хирагана более плавные закорючки, а катакана более квадратные закорючки. Главный косяк как раз в кандзи, о чём и писал, то есть для перевода в слоговую азбуку иероглифов понятий (в любую: ромадзи, хирагану или катакану) нужно составлять словарь, что для меня является непосильной задачей.

Надеюсь, что без ошибок:

Мост:
   ромадзи: hashi
   кандзи: 橋
   хирагана: はし (ха + си)
   катакана: ハシ (ха + си)

Палочки для еды:
   ромадзи: hashi
   кандзи: 箸
   хирагана: はし
   катакана: ハシ

Как видно, в разговоре смысл одного и того же понятия определяется контекстом, суть моста - соединять что-то с чем-то, поэтому слово одно. Однако, в письме, чтобы разобраться не перечитывая весь текст, ставят разные иероглифы - отдельно для моста и отдельно для столового прибора. Кстати, "shi" и "си" не отражают реального звука, он что-то среднее между обоими вариантами.
Записан
darkelf
Молодой специалист

ua
Offline Offline

« Ответ #19 : 31-01-2018 14:02 » 

Да, в хирагане и катакане одинаковый слоговый состав. Отличается, как Вы правильно сказали - графика и применение. Например, имя Гарри Поттера явно будет писаться катаканой - ハリー・ポッタ, а  союз "и", являющийся служебным словом - хираганой - と. Соответственно "Гарри Поттер и Философский камень" будет: ハリー・ポッターと賢者の石. В итоге даже в заголовке будет и хирагана, и катакана, и кандзи.
« Последнее редактирование: 31-01-2018 14:08 от darkelf » Записан
Aether
Специалист

ru
Offline Offline
Пол: Мужской

« Ответ #20 : 31-01-2018 14:05 » 

По поводу количества букв в алфавите - если-бы я придумывал свой вариант латиницы для украинского, боюсь, у меня-бы получилось не 26 английских, а около 46-х букв (с циркумфлексами и прочими диакритическими знаками), а в самом минимальном - 42 буквы, считая апостроф - зато каждой фонеме соответствовала своя буква алфавита.
Я как раз вверху написал один из вариантов латинизации русского по фонетике, отличающийся от общепринятого английского варианта. Английские лигатуры не соответствуют русским комбинациям, поэтому не несут пользы.

Если не ошибаюсь, то в польском 32 буквы, а в украинском 33. Думаю, вопрос больше в желании, но, по моему мнению, польза есть для украинцев тоже.

Кстати у японцев, как я понимаю, романдзи и был вариантом отказа от "устаревших" и не прогрессивных китайских иероглифов и перехода на прогрессивный латинский алфавит, но потом они как-то подумали, и решили, что им и так неплохо, а глупые гайдзины пусть мучаются. Китайцы, корейцы, евреи, арабы и прочие индусы тоже не очень торопятся отказываться от своих алфавитов. А из наших бывших соотечественников - те-же грузины и армяне вполне себе используют ни на кого не похожие собственные алфавиты.
Ромадзи служит цели изучения японского в англоязычных странах, как у нас русская транслитерация по системе Поливанова. Китайцы не могут отказаться от иероглифов из-за разных диалектов по всей стране, то есть "вода" будет в разных частях страны звучать по разному, но пишется она одним и тем же иероглифом. Японские иероглифы служат для конкретизации слов, которые читаются одинаково, но означают разные понятия, поэтому слоговая азбука есть, но отказаться от кандзи не выходит. Корейцы сделали свою версию алфавита. На Кавказе тему перехода на латинский тоже трут. Грузия, вообще, нечто - каждая этническая группа хочет отделиться и построить свою систему. Индийцы могут позволить себе иметь уникальный алфавит - их численность 1,4 млрд. человек.

Национальные предрассудки живут во многих людях, но на качество жизни влияют знания, а не эмоциональная сторона, основанная часто на религиозных и прочих домыслах.
Записан
darkelf
Молодой специалист

ua
Offline Offline

« Ответ #21 : 31-01-2018 14:19 » 

По поводу количества букв в алфавите - если-бы я придумывал свой вариант латиницы для украинского, боюсь, у меня-бы получилось не 26 английских, а около 46-х букв (с циркумфлексами и прочими диакритическими знаками), а в самом минимальном - 42 буквы, считая апостроф - зато каждой фонеме соответствовала своя буква алфавита.
Я как раз вверху написал один из вариантов латинизации русского по фонетике, отличающийся от общепринятого английского варианта. Английские лигатуры не соответствуют русским комбинациям, поэтому не несут пользы.
В принципе у меня были аналогичные мысли, вплоть до обозначения йотированных звуков двоеточиями, разве-что лучшим вариантом казалось использование не диграфов/триграфов, а диакритиков -
Ч - Č, Ш - Š, Щ - Ŝ и обозначения мягких звуков отдельными буквами - Л - L, Ль - Ĺ, Р - R, Рь - Ŕ ну и т.д.
Записан
Aether
Специалист

ru
Offline Offline
Пол: Мужской

« Ответ #22 : 31-01-2018 14:37 » 

В принципе у меня были аналогичные мысли, вплоть до обозначения йотированных звуков двоеточиями, разве-что лучшим вариантом казалось использование не диграфов/триграфов, а диакритиков -
Ч - Č, Ш - Š, Щ - Ŝ и обозначения мягких звуков отдельными буквами - Л - L, Ль - Ĺ, Р - R, Рь - Ŕ ну и т.д.
С точки зрения рукописного письма это может быть лучше - писать две точки дольше, чем поставить один штрих. А вот смешивать смягчающий знак в ту же гамму уже плохо - теряется очевидность преобразования.

С печатной точки зрения форматирование строк лучше выглядит, когда надсимвольные знаки не нарушают шаг строк. Например, есть такой символ, как ангстрем, кружок которого в ряде шрифтов не помещается в остаток междустрочного интервала. Как итог, система увеличивает междустрочный интервал в месте его использования, что бросается в глаза и выглядит не приятно. Увеличение же общего шага строк ведёт к перерасходу бумаги. Кстати, эта же проблема происходит с индексами: 22, например. Конечно, это связано с применяемыми шрифтами, но кое-что стоит продумать и предусмотреть заранее.


Немного добавлю: так и не нашёл ни одну систему электронной типографии (как приложение, так и библиотеку) без косяков и костылей, особенно в части метрики, например:

координаты зоны текста нормально не считают даже текстовые редакторы и системы CAD. Немного лучше в этом плане выглядит TeX, но решение ёмкое и имеет, в том числе, другие минусы.

* fr_1.jpg (56.31 Кб - загружено 700 раз.)
« Последнее редактирование: 31-01-2018 17:28 от Aether » Записан
Люсь
Модератор

ru
Offline Offline
Пол: Женский

« Ответ #23 : 31-01-2018 23:20 » 

Ой не говорите мне про русский язык и культуру речи... У меня только-только голова начала отходить от всей этой морали...
Да, аутентичные звуки и сам язык при переходе на латинницу теряют. И не упомянули в-четвёртых - очень сложно придётся по крайней мере двум поколениям народов, которые учились на кириллице и не изучали иностранные языки. Я в Узбекистане пережила переход на латинницу - у меня мама совершенно не понимала, где что написано на вывесках и уж тем более в бумагах, а мне приходилось глаза и пальцы ломать при переводе всей бумажной документации с русского языка на узбекский, а с узбекского - на латиницу. Будь проклят тот, кто придумал перейти на латиницу и не автоматизировал этот процесс. Понятнее от этого язык для европейских стран, где используется в основном латиница, всё равно не станет, а часть своей культуры потеряют что Узбекистан, что предстоит и Казахстану, так какой в этом смысл? И да, о том, что в Узбекистане сами узбеки ни хрена не разбираются, какие именно сочетания букв и апострофов заменяют твёрдые и мягкие буквы и звуки с идентичным начертанием, в итоге я полагаю, скоро исчезнут эти апострофы, т.к. их проблематично употреблять каждый раз в письме, а далее вместе с ними исчезнут и соответствующие им звуки и я даже не могу подобрать слова, которым можно будет назвать такой сглаженный в углах "язык". И это я ещё не понимаю глубин узбекского языка и культуры. Но как этническая татарка, представляю, какой это трагедией обернётся для моего языка, если вдруг его вздумают перевести на латиницу, что в общем-то в добровольном виде используется, но истинного татарского звучания отдельных букв не передают. Даже мне трудно правильно произносить их, а от неправильного употребления одного такого звука порой меняется весь смысл слова и в целом фразы... Не знаю, как там с точки зрения пользы для мира или ещё для каких целей, но в культурном и историческом плане я резко против. Это прямой путь к ассимиляции народов.

У нас татары довольно сильно заняты сейчас религиозным образованием, и лоббируют у себя переход на арабскую систему письменности.
Не трынди, я тут в центре Татарстана живу, первый раз слышу про арабскую письменность. Мы тут понимаешь боремся за сохранение хотя бы татарского языка, который такими темпами и с такими законами скоро уже и в разговорном виде исчезнет и останется только в фольклоре среди русскоговорящих этнических татар и среди историков, изучающих историю края по книгам на татарском языке. Кстати, арабская письменность некогда пыталась использоваться для татарского языка, но некоторое время спустя от неё отказались в пользу кириллицы, кстати так же, как и в Узбекистане. А самой первой татарской письменностью были так называемые руны, вроде в некотором виде похожая письменность сейчас используется у армян или у грузин.

Записан

Посторонним просьба не беспокоить!
-------------------------------------------------
O (I) Rh +
Люсь
Модератор

ru
Offline Offline
Пол: Женский

« Ответ #24 : 31-01-2018 23:43 » 

В третьих: Не факт, что новая азбука будет хорошо отображать на письме все фонемы данного конкретного языка. Придется придумывать разные костыли.

Когда-то видел вот такую систему транслитерации, и она показалась весьма удобной:
а - a
б - b
в - v
г - g
д - d
е - ë
ё - ö
ж - j
з - z
и - ı
й - i
к - k
л - l
м - m
н - n
о - o
п - p
р - r
с - c
т - t
у - u
ф - f
х - x
ц - tc
ч - ts
ш - s
щ - cts
ъ - '
ы - y
ь - `
э - e
ю - ü
я - ä

Знаешь, в чём проблема такой системы латинизации кириллицы? В том, что эта система пригодна только для русского языка. Но ни один англичанин или американец в жизни не сможет произнести слова с подряд ищущими сч рщ и иными сочетаниями. А значит помимо того, что зачем-то вместо одной буквы придётся использовать сразу 2 или 3 или даже букву с апострофом - это мало того, что изучить язык, но ещё и изучить правила, относится ли это сочетание букв к определенному звуку, или всё же являются различными рядом стоящими звуками и буквами. Вот головоломка-то! Итак русский язык популярностью не пользуется в мире, а при таком внедрении во всеобщий прогресс и явно все будут шарахаться. Ну вот кому нужны латинизированные славянские чешский, болгарский и прочие языки? Даже мы, пытаясь их читать, ни черта не понимаем.

А ещё, это для русского языка ' - это твёрдый знак, а обратный апостроф - мягкий - кстати кто их различит на письме? А они ведь имеют разное влияние на соседние буквы в русских словах. И вообще непонятно, почему вместо "е" надо использовать латинское "ё", если можно просто заменить "ё" на "ё", а "е" просто оставить "е", и придумать что-нибудь другое для Э )) Ведь значимо это будет только для русского языка. Потому что взять узбекский язык, там эти апострофы ' уже не являются мягким или твёрдым знаком, там они, присоединенные к букве, означают, что их надо по другому произносить. И может быть и можно использовать какие-нибудь ü символы для отображения таких букв, но их тупо нет на клавиатуре, и узбеки и дальше будут вынуждены набирать такие буквы с апострофом, если не поленятся или если хватит мозгов не перепутать звук и букву. Либо же будут использовать такие буквы, но с большим геморроем, из-за чего в своё время я люто возненавидела свою работу, где было много узбекского языка. Прям аж материться охота на этом месте.

Так вот. Я так и не понимаю смысла, зачем? Если разные буквы латиницы для разных языков будут означать совершенно разные звуки и даже буквы? Кому от этого станет легче и понятней? Как это облегчит жизнь народам, даже русскому, в мировом масштабе? Даже если это миллионы человек, которые хотят быть ближе к мировым миллиардам, из которых кстати у половины вовсе не латиница, а своя письменность со своими каракулями и ниипет ))
« Последнее редактирование: 31-01-2018 23:45 от Люсь » Записан

Посторонним просьба не беспокоить!
-------------------------------------------------
O (I) Rh +
Люсь
Модератор

ru
Offline Offline
Пол: Женский

« Ответ #25 : 31-01-2018 23:57 » 

По моему мнению у большего числа вариантов в качестве недостатков было то, что либо калькировали с английского, вплоть до ш - sh, щ - sch, ц - c, ч - ch, либо эти алфавиты придумывали ниразу не лингвисты, а "революционеры", соответственно ни с тем, что-бы придуманный вариант был удобен для использования, а с чисто с политическими целями - как некоторые писали - что-бы "кляти москали" не смогли прочитать.
...
Кстати у японцев, как я понимаю, романдзи и был вариантом отказа от "устаревших" и не прогрессивных китайских иероглифов и перехода на прогрессивный латинский алфавит, но потом они как-то подумали, и решили, что им и так неплохо, а глупые гайдзины пусть мучаются. Китайцы, корейцы, евреи, арабы и прочие индусы тоже не очень торопятся отказываться от своих алфавитов. А из наших бывших соотечественников - те-же грузины и армяне вполне себе используют ни на кого не похожие собственные алфавиты.

 Не могу... Не могу... Не могу...

Спасибо, друг!  Друзья? Ржу, как конь. И полностью поддерживаю, во всех смыслах ))

Записан

Посторонним просьба не беспокоить!
-------------------------------------------------
O (I) Rh +
Люсь
Модератор

ru
Offline Offline
Пол: Женский

« Ответ #26 : 01-02-2018 00:10 » 

Национальные предрассудки живут во многих людях, но на качество жизни влияют знания, а не эмоциональная сторона, основанная часто на религиозных и прочих домыслах.

Я с тобой не согласна и имею на этот счёт довольно пространное мнение, но уже нет сил расписывать всё, что я думаю.
Скажу лишь одно: нации складывались исторически, исходя из ситуаций, в которых находились и из того, какими путями они решали эти ситуации. Поэтому каждая нация генетически имеет тот или иной общенациональный склад характера. Поэтому каждая нация живёт в том или ином месте мира. Поэтому у одной нации такие природные условия проживания, у другой - другие, поэтому кто-то согласен терпеть, кто-то нет и постоянно воюет и режет на меха. (Это моё личное мнение, из моих размышления во время изучения разных сфер жизни народов, ниоткуда не вычитанное и никем мне в голову сформированным не положеное. Я просто встала на место тех людей, что тогда жили, и представила, как бы кто поступил в той или иной ситуации. И мне стало гораздо понятнее, почему так всё устроено в мире, почему такие разные нации и почему войны). Продолжаю. И просто так отказываться от своей культуры, от своей нации, от своего характера в конце концов не каждый-то и согласен будет. Это как взять и из тебя разом выдернуть всё русское и заставить в один день писать и говорить латиницей под страхом смерти. Много радости ты с этого получишь? Это как у твоего ребёнка отобрать махом все его единственные игрушки - матрёшки, балалайки, баяны, гусли, самобранки, берёзы, соловьи. Вот ору-то будет! А ты - папа, поди попробуй его заткни и не сломай ему психику.

Я так понимаю, ты диссертацию пишешь, да? ))
« Последнее редактирование: 01-02-2018 00:12 от Люсь » Записан

Посторонним просьба не беспокоить!
-------------------------------------------------
O (I) Rh +
RXL
Технический
Администратор

ru
Offline Offline
Пол: Мужской

WWW
« Ответ #27 : 01-02-2018 07:49 » 

Люсь, мелкие, но существенные поправки:
* У грузин и армян не руны, это полноценный алфавит. У армянского общий с греческим предок.
* Болгары пользуются кириллицей. Они же ее и создали.
* Чешский и польский вполне себе читабельные. Да, нужно запомнить несколько специфичных букв.
* Насчет умляутов. Точно так же, как с русской клавой:

Э... куда тильду дели? Как бог черепаху... Как с помощью этой клавы программить? С ума сойти...
« Последнее редактирование: 01-02-2018 07:51 от RXL » Записан

... мы преодолеваем эту трудность без синтеза распределенных прототипов. (с) Жуков М.С.
Люсь
Модератор

ru
Offline Offline
Пол: Женский

« Ответ #28 : 01-02-2018 08:23 » 

Ром, я просто не копалась подробно в этих вопросах, которые ты отметил, написала по памяти, и про болгарский, и т.д. Я несла лишь смысл, а не доказательную базу. Про руны нам на истории говорили, подробно я не изучала этот вопрос. Я не говорю, что у грузин и армян руны, я говорю, нечто похожее, вроде как корни письменности одни у этих языков. Если бы не ввели арабскую письменность на территории Татарстана - то язык бы выглядел как те руны. Нам показывали фото словаря с такими древними рунами и их значение на современном татарском, вернее написание, т.к. звучание по большей части сохранилось. Наглядно показали, поэтому запомнилось. Если кому диссертацию писать - мои слова можно использовать лишь как мой личный опыт, как направление, куда рыть, никак не в качестве научной аргументации.
Записан

Посторонним просьба не беспокоить!
-------------------------------------------------
O (I) Rh +
Aether
Специалист

ru
Offline Offline
Пол: Мужской

« Ответ #29 : 01-02-2018 10:28 » 

Но как этническая татарка, ...
Вот, какое отношение имеют татары и их национальные предрассудки к русскому языку? Если всё смотреть через призму национальных интересов, то стоит напомнить, как значительное количество русских коробит факт существования татарской государственности, конституции, и даже собственного президента.

Для русских (носителей русского языка) латинница - это уменьшение нагрузки по изучению графики, учить один алфавит, взамен двух - плюс. Это близкое звучание у большинства букв, что делает изучение многих иностранных языков проще. Это начало модификации языка для цели конкретизации и оптимизации. Для русского человека и кириллица и латинница - обе "чужие" системы, поэтому суждение в вопросе выбора графики может быть только из соображений пользы, а она состоит в том, чтобы быть ближе к более развитым странам.

Не трынди, я тут в центре Татарстана живу, первый раз слышу про арабскую письменность.
"Я в Сирии живу - первый раз слышу про террористов!" Говорю, что знаю воочию.

Кстати, арабская письменность некогда пыталась использоваться для татарского языка, но некоторое время спустя от неё отказались в пользу кириллицы, кстати так же, как и в Узбекистане.
В 922 году булгары (которых потом стали называть татарами) приняли ислам вместе с его атрибутами, то есть перешли на арабское письмо.

В 1552 году Иван Грозный взял Казань, и обратил часть татар в христианство, однако большая часть остались мусульманами, сохранив в том числе и свою письменность. Кириллица входила в обращение по мере общения на русском языке и необходимости ведения документооборота на русском языке.

С 1920-х годов в СССР началась политика кириллизации (принудительной замены графики на кириллицу) национальных письменностей, например, Азербайджан перевели на кириллицу в 1939 году. А занимался этим Совет Народных Комиссаров.

Итого: по меньшей мере 998 лет у татар в ходу была арабская графика. И тебе, как мусульманке, известно, что Коран переводу не подлежит, поэтому арабский и его графика является неотъемлемой культурной чертой мусульман.
Записан
Страниц: [1] 2  Все   Вверх
  Печать  
 

Powered by SMF 1.1.21 | SMF © 2015, Simple Machines