Модернизація китайської мови і писемності
Створення загальнокитайської мови і стандартизація вимови. Упорядкування і проблема ієрогліфічної писемності на сучасному етапі. Перехід до алфавітного письма і проблема орфографії. Система сполучення двох методів машинної обробки китайських текстів.
Рубрика | Иностранные языки и языкознание |
Вид | курсовая работа |
Язык | украинский |
Дата добавления | 22.12.2010 |
Размер файла | 62,2 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
КАФЕДРА МОВ І ЦИВІЛІЗАЦІЙ
ДАЛЕКОГО СХОДУ
Курсова робота на тему:
Модернизація китайської мови і писемності
Київ 2010
Зміст
Вступ
Розділ 1 Загальна мова та стандартизація вимови
1.1 Створення загальнокитайської мови
1.2 Стандартизація вимови
1.2.1 Основні принципи вибору орфоепічних норм для різночитання
1.2.2 Основні принципи вибору читань географічних назв
1.2.3 Значення документу "Сфера й принципи розгляду читань ієрогліфів”
1.3.Критерії рівнів володіння путунхуа
Розділ 2 Упорядкування ієрогліфів і проблема ієрогліфічної писемності на сучасному етапі
2.1 Визначення числа ієрогліфів
2.2 Спрощення й стандартизацію накреслень ієрогліфів
2.3 Стандартизацію читань ієрогліфів
2.4 Стандартизацію структури словників ієрогліфів
Розділ 3 Перехід до алфавітного письма і проблема орфографії
3.1.Різновиди алфавітного письма
3.2 Проблеми орфографії
Розділ 4 Система сполучення двох методів машинної обробки китайських текстів
4.1 Початок дослідження методів обробки китайських текстів
4.2 Способи кодування ієрогліфів
4.3 Новий спосіб "перетворення алфавіту"
Висновки
Анотація
Список використаних джерел
Вступ
З того часу, як у 1840 р. Опіумна війна відкрила двері в самоізольовану Цинську імперію, рік за роком множаться контакти культур Китаю й Заходу, обмін між ними. Спочатку китайцям була відома лише смертоносність західної зброї, потім вони довідалися, що для відновлення зброї необхідно відновити виробництва, нарешті, довідалися й про те, що коріння цих проблем криється у відновленні системи освіти. "Рух 4 Травня" 1919 р. Став кульмінацією просвітительського руху в Китаї. Так само як і в просвітительських рухах на Заході, відновленню системи освіти у Китаї передувало відновлення мови й писемності. На Заході національні мови замінили латинську мову. У Китаї байхуа прийшов на зміну веньяню.
Актуальність теми: Проблема мови й писемності в Китаї набагато складніша, ніж на Заході. Окрім проблеми зближення письмових стилів з розмовною мовою, існує проблема стандартизації вимови загальної мови і її поширення, проблема складності й численності ієрогліфів, за допомогою яких неможливо точно передати звучання слів тощо. Спрощення ієрогліфів, поширення путунхуа, розробка й впровадження проекту фонетичного алфавіту для китайської мови є трьома найважливішими завданнями вже протягом багатьох сотень років. Спрощення ієрогліфів і впровадження алфавіту - це письмовий аспект, поширення путунхуа - мовний аспект. З останніх років правління династії Цин і до тепер ці три завдання виконані поки що тільки частково. Відновлення китайської мови й писемності усе ще триває. Чи потребують відновлення китайська мова й писемність - це питання ще з часу руху за байхуа періоду "4 Травня" є спірним. Після того як рух за байхуа перейшов у рух за спрощення ієрогліфів і перехід до алфавітної писемності, суперечки стають усе більше запеклими й уже поширилися на китаємовні громади в усьому світі. Тому тема моєї роботи актуальна на цей час і буде залишатися актуальною ще протягом багатьох років.
Мета роботи: розглянути основні принципи реформ писемності і машинної обробки китайських текстів, дати оцінку становищу у цій області, яке склалося на цей час.
Методи та завдання роботи: порівнюючи матеріали китайської, української та россійської мов, з огляду на досвід японської мови у цій сфері ми спробуємо:
1. дослідити проблеми, які стають на заваді розповсюдження загальної китайської мови в Китаї та у китаємовних країнах;
2. визначити пункти, що є перешкодою у точному підрахунку ієрогліфів;
3. виділити позитивні і негативні результати реформ спрощення і стандартизації накреслень ієрогліфів;
4. виявити проблеми, які трапляються на шляху вчених- лінгвістів при спробі стандартизації читань ієрогліфів;
5. дослідити, які з методів пошуку ієрогліфів у словниках є найкращими, чому;
6. назвати складності, які виникають при спробах переходу на алфавітну писемність;
7. описати труднощі машинної обробки китайських текстів і способи їх подолання.
Наукова новизна: на матеріалах різних авторів китайської, української, російської мови довести неможливість на даний час переходу до ієрогліфічної алфавітної писемності.
Практичне значення: дослідження проблем таких, як уніфікація читання, уніфікація креслення ієрогліфів, способи роботи з китайськими текстами на ЕВМ, пошук найкращого спосубу знаходження ієрогліфів у словниках полегшує роботу перекладачів та є значною допомогою людям, які пов'язані з китайською мовою.
РОЗДІЛ 1
ЗАГАЛЬНА МОВА ТА СТАНДАРТИЗАЦІЯ ВИМОВИ
1.1 Створення загальнокитайської мови
Загальнокитайська мова спочатку мала назву "гуаньхуа", потім назва була змінена на "гоюй", а в 1955 р. - на "путунхуа". На Тайвані вона як і раніше зветься "гоюй". Термін "путунхуа" існував уже наприкінці династії Цин і спочатку являвся загальною мовою, яку всі можуть розуміти; твердий стандарт був відсутній. В 1955 р. путунхуа дали визначення: "Загальна мова китайської нації, основою якої є північні діалекти, стандартною вимовою - пекінська вимова, граматичною нормою - зразкові твори на байхуа". Зміст зміни назви на путунхуа полягає у тому, що цим виражається рівноправність усіх національностей Китаю, заперечується нав'язування путунхуа національним меншинам. Прийнята в 1982 р. нова Конституція КНР установлює, що "держава поширює путунхуа, який є загальновживаним по всій країні". Якщо розуміти під "загальновживаним по всій країні" і його вживання в районах проживання національних меншин, то зміст терміну "путунхуа" буде близький до того, який несе у собі термін "гоюй". Звичайно, вираження "загальновживаний по всій країні" зовсім не означає насильницького насадження путунхуа в районах проживання національних меншин: адже в цей час він також є маловживаним у районах, де широкого поширення здобули діалекти китайської мови. Загальнокитайська мова в Республіці Сінгапур і в інших ареалах поширення китайської мови за межами КНР називається "хуаюй". Я вважаю, що "хуаюй" - є дуже вдалою назвою, що може використовуватися в будь-якій країні, будь-якому регіоні, у різному оточенні. Той факт, що аж до теперішнього часу китайська мова не має єдиної загальної назви, показує, що, хоча китайська мова має дуже древню історію, загальнокитайська мова усе ще дуже молода. [1, 363 - 375] .
1.2 Стандартизація вимови
Встановлення стандарту вимови - це показник того, що загальна мова досягла "повноліття". Результатом історичного розвитку, у ході якого протягом тисячі із зайвим років при династіях Ляо, Цзинь, Юань, Мін, Цин столицею Китаю був Пекін є те, що « пекінська вимова є стандартною вимовою путунхуа ». В 1913 р. на Конференції по уніфікації вимови ієрогліфів методом голосування, при якому кожна провінція мала один голос, більшістю голосів як стандарт була затверджена не пекінська, а штучно створена вимова. В 1924 р. від цієї штучної вимови відмовилися на користь "стандарту, що ґрунтується на пекінській вимові". Можна сказати, що 1924 р. є "роком повноліття" загальної мови. З 1913 по 1924 р., протягом 10 років, сформувалося розуміння "стандартної вимови, основою якого є пекінська вимова". Визначення путунхуа 1955 р. - це не більш ніж проходження історичної реальності [2,13][3 ,13].
1.2.1 Основні принципи вибору орфоепічних норм для різночитання
У пекінському діалекті існує чимало слів, що мають два й більше читання. Для цих "слів з різноманітним читанням" потрібно встановити стандарт вимови. Заснована в 1956р. Орфоепічна комісія путунхуа в 1957, 1959 і 1962 р. опублікувала три частини "Проекту списку слів з рекомендованим читанням", до яких було включено 170 назв, головним чином назв міст і повітів. В 1963 р. вищезгадані матеріали були видані у вигляді брошури з "Проектом збірного списку слів путунхуа з рекомендованим читанням, що складається із трьох частин" (видавництво Комітету реформи писемності). Надалі робота в цій області протягом тривалого часу перебувала в стані застою. Орфоепічна комісія путунхуа була відтворена й відновила свою діяльність тільки в 1982 р.
В 1956 р. були визначені принципи вибору орфоепічних норм для різночитання. Їхній головний зміст зводиться до наступного:
1. Читання пропонується для слова, а не для ієрогліфа. Наприклад, слово ІЁАЛ "хвиля" має два читання:bolang і polang, які необхідно піддати розгляду. Ієрогліф же ВК хоча й має два читання, але в слові "ефективність" має читання lu, а в слові "керувати" - тільки shuaі, і ці читання не є об'єктом розгляду.
2. Коли деякі читання ряду ієрогліфів у пекінському діалекті не настільки широко поширені, то, навіть при їхній невідповідності з загальними закономірностями розвитку пекінської вимови, їх все-таки можна використовувати; у той же час варто враховувати, наскільки широко дане читання поширене в північних діалектах. Ці читання не відповідають загальним закономірностям, однак використовуються, тому що широко поширені в пекінському діалекті, а також у більшості північних діалектів .
3. Читання вибираються за принципом віднесеності медиалей до категорії кай або хэ, до того ж перевага віддається категорії кай; при цьому як стандарт береться розмовна вимова. Наприклад, ієрогліф БЬ “мокнути” читається lin, а не lun або lun.
4. Ієрогліфи, які в стародавності читалися вхідним тоном і мали на кінці складу глухі приголосні, у пекінському діалекті можуть читатися різними тонами, у тому числі й першим тоном. Для них, як правило, пропонується читання рівним тоном, наприклад знак Оь 'подих' - як xі, »ч 'збити' - jі. В інших випадках кожний ієрогліф розглядається окремо й вибирається найпоширеніше читання.
5. Для кожного складу вибирається, як правило, одне читання, однак невелике число слів зберігає два читання. Наприклад, знак СЄ 'кров' читається xіe і хue [4,241-245].
1.2.2 Основні принципи вибору читань географічних назв
Основні принципи вибору читань географічних назв зводяться до наступного:
1. Якщо місцеве читання географічної назви відрізняється від його пекінського читання, то як стандарт береться пекінське. Наприклад, ієрогліф аd у назві повіту Мэйсянь має місцеве читання mi, а в Пекіні читається meі; ієрогліф ВФ у слові Люэян має місцеве читання luo, а пекінське - lue. Читання цих ієрогліфів змінюється відповідно до фонетичних закономірностей, як стандарт береться пекінське.
2. Якщо деякі ієрогліфи, що позначають географічні назви, мали в минулому певні особливі читання, які зараз співпадають із місцевими, то, виходячи із принципу "ім'я дається хазяїном", читання цих назв змінам більше не підлягають. Наприклад, власне ім'я ЫЄ Сщ читається Yueyang, а не Liyang, ЅеУЭ читається Xіeyu, а не Jіeyu .
3. Якщо ряд ієрогліфів, що позначають географічні назви, мав у минулому особливі читання, з якими сучасні читання не збігаються, то в цьому випадку відповідно до закономірностей співвідношення пекінської й місцевої вимови ці ієрогліфи одержують читання на путунхуа. Наприклад, установлено, що власне ім'я фзШЖ читається Heze (а не Geze).
1.2.3 Значення документу "Сфера й принципи розгляду читань ієрогліфів”
В 1982 р. після поновлення роботи Орфоепічної комісії був додатково розроблений документ "Сфера й принципи розгляду читань ієрогліфів". Його основний зміст:
1. Сфера розгляду
а) Розгляду підлягають тільки читання слів путунхуа, включаючи читання розповсюджених у путунхуа вэньянизмів, чэньюїв, афоризмів; читання діалектних слів (включаючи пекінський місцевий говір) і слова древньокитайскої мови не розглядаються;
б) розглядаються тільки різночитання з розмовної мови, нові читання й слова, що з'явилися лише в останні роки;
в) розглядаються тільки читання складних ієрогліфів, що позначають імена, прізвища людей і географічні назви, які з'явилися в пресі в останні роки.
2. Принципи розгляду
а) При розгляді читань окремих слів необхідно виходити з вимог відповідності закономірностям еволюції фонем пекінського діалекту, а також зручності з погляду вивчення путунхуа у районах, де говорять на діалектах; необхідно виходити також з реальної ситуації, враховуючи вимову, яка звична для більшості мовців. Наприклад, ієрогліф ІҐ 'передавати' у слові ІҐТф»ъ 'радіо' у старих словниках читався BO, а в цей час більшістю читається як BO;
б) при виборі читань імен і прізвищ, географічних назв перевага віддається сучасному читанню ніж старому, більше розповсюдженому ніж менш розповсюдженому, більш звичному для більшості ніж менш звичним; до принципу "ім'я дається хазяїном" необхідно підходити обережно; варто враховувати, чи торкається дане читання діалектного і якщо так, то як воно співвідноситься із читанням на путунхуа. Діалектний варіант у цьому випадку не підходить. Наприклад, власне ім'я ЅОчз діалекту провінції Цзянси не слід транскрибувати Yanshan, тому що в цьому діалекті ієрогліф 'графіт' зі слова З¦ 'олівець' теж читається yan;
в) якщо ієрогліф має одне значення, але кілька читань, то останні також поєднуються в одне за допомогою таких методів, як скорочення, перегляд і доповнення. Наприклад, ієрогліф Цё 'палець; показувати, мати на увазі' читається zhі (у слові ЦёјЧ 'ніготь'), zhі (у слові КЦЦё 'палець'), zhі (у слові Цё 'показувати'). Всі ці читання можна замінити одним - zhiЎЈ
"Проект зведеного списку слів путунхуа з рекомендованим читанням, що складається із трьох частин", був розглянутий ще раз, після чого він придбав характер офіційного документа. Зміст його також було розширено. Розгляд читань(вимови) відбувається, виходячи з огляду на ситуацію, що склалася на континентальному Китаї. Але питання, чи можна застосувати результати цих реформ у інших китаємовних громадах, ще потребує детального вивчення і дослідження.
Вибір орфоепічної норми для різночитанні - це один з аспектів нормалізації китайської мови. Ще один її аспект - упорядкування лексики, головним чином науково-технічної термінології, а також імен і географічних назв, що є фонетичними запозиченнями. Калькування може бути здійснено багатьма способами; для фонетичних запозичень перешкодою служать ієрогліфи- омофони й діалектні читання. Сьогодні, коли швидко розвивається наука й техніка, у широких масштабах здійснюється гуманітарний обмін, нормалізація фонетичних запозичень перетворилася для китайської мови у важливу проблему. Тільки після того, як новий термін проіснує багато років, намічається тенденція до його однакового перекладу. Наприклад, термін "лазер" спочатку переводився методом фонетичного запозичення й читався лайсай, а згодом став переводитися калькою цзигуан, тоді як за межами континентального Китаю він переводиться й по-іншому, наприклад лэйшэ. Після приходу в США до влади Рейгана з'явилися різні способи транскрибування його прізвища, такі, як Лигэнь (Пекін), Лэйгэнь (Тайвань), Легэнь (Гонконг); при цьому використовуються різні ієрогліфи, що читаються також по-різному. В останні роки всі наукові й спеціалізовані організації приділяють велику увагу уніфікації термінології, проводять безліч нарад з питань вибору й твердження термінів, обговорюють проблему скорочення числа термінів- омонімів, видають багато різних термінологічних словників. Це зіграло відому роль у нормалізації, однак попереду ще чекає великий обсяг роботи. Появи в різних китаємовних громадах різних варіантів того самого терміна уникнути важко. Якщо виявиться можливим скоротити розбіжності й збільшити кількість однакових термінів, то використання китайської мови (хуаюй) на міжнародному рівні стане більш зручним.
1.3 Критерії рівнів володіння путунхуа
Ключовою ланкою в поширенні путунхуа є підготовка викладачів. У Пекіні й у всіх провінціях є "курси вивчення путунхуа", обов'язкові для викладачів мови й писемності навчальних закладів усіх типів. Щоб забезпечити більш точну оцінку знань, останнім часом в експериментальному порядку розроблений документ "Критерії рівнів володіння путунхуа". Перший рівень означає вміння вільно вживати стандартний путунхуа, а також точна вимова звуків і тонів при читанні розповсюджених ієрогліфів; обороти мови й інтонація повинні відповідати стандарту, лексика й граматика - бути нормативними; не допускається вживання діалектизмів під час публічних виступів, декламації й у бесідах. Другий рівень означає вміння вживати путунхуа який відповідає стандарту, але можуть проскакувати діалектизми у вимові; звуки й тони при читанні розповсюджених ієрогліфів повинні вимовлятися чітко, неточності в їхній вимові повинні відчуватися й виправлятися мовцям самостійно; обороти у мові й інтонація в цілому повинні бути правильними, лексика й граматика - у цілому відповідати нормі; діалектизми під час публічних виступів, декламаціях й у бесідах не повинні впливати на взаєморозуміння. Третій рівень означає вміння говорити не на стандартному путунхуа; при цьому звуки й тони в основному повинні бути правильними, лексика й граматика - в основному відповідати нормі; вимова під час офіційних виступів і бесідах має в цьому випадку помітний діалектний відтінок, а взаєморозуміння досягає звичайно 90%. Навички володіння путунхуа, які недосягають третього рівня, відносяться до підготовчого рівня, а ті, що перевищують вимоги першого рівня виділяються в особливий рівень. Застосовуючи ці критерії, варто висувати диференційовані вимоги з урахуванням розходжень у місці проживання, професії, віці, національності тієї або іншої особи.
Велика радість чути про значні успіхи в поширенні гоюя на Тайвані, також про те, що росте увага до поширення мови хуаюй у Сінгапурі, уживають відповідні зусилля й у Малайзії, з кожним роком росте число курсів по вивченню цієї мови для населення Гонконгу. Поширення путунхуа на континенті поперемінно переживає періоди бурхливого підйому й занепаду, у різних районах відбувається нерівномірно. Недавно в Конституцію внесене положення про поширення путунхуа. Це є сигналом до того, що китайцям треба зібратися із силами й усіляко проводити таку роботу. Те, що в китаємовних громадах по всьому світу загальній мові надається все більше й більше значення, є досить підбадьорюйочою звісткою; цей є наслідком розвитку транспорту й підвищення культури[1,363-375].
РОЗДІЛ 2
УПОРЯДКУВАННЯ ІЄРОГЛІФІВ І ПРОБЛЕМА ІЄРОГЛІФІЧНОЇ ПИСЕМНОСТІ НА СУЧАСНОМУ ЕТАПІ
2.1 Визначення числа ієрогліфів
Число ієрогліфів постійно й повселюдно зростає, при їхньому народженні про це не повідомляється, а коли в певний момент у них зникає необхідність, то після смерті їх не ховають. В ієрогліфічних словниках мертві й живі знаки перебувають поруч і розходження між ними не фіксуються. Скільки ж ієрогліфів потрібно зрештою використовувати для запису сучасної китайської мови? Ніхто не може цього сказати. Дане явище не слід розглядати як таке. Це питання потребує ретельного вивчення і чітких відповідей.
Перепис населення необхідний. Необхідний і перепис ієрогліфів. При переписі населення листуються тільки живі люди. При переписі ієрогліфів повинні листуватися тільки ієрогліфи сучасної китайської мови. "Визначити розміри ієрогліфічної спадщини, видати повний список ієрогліфів сучасної китайської мови - це стане найбільшою подією в історії китайської писемності!". У словниках ієрогліфів всіх епох число включених у них знаків відомо, однак воно не еквівалентне загальному числу ієрогліфів, що є вживаними. Скільки всього древніх і сучасних ієрогліфів? Важко відповісти на це питання. Якщо провести загальний підрахунок не дивлячись на епохи, то його цінність буде невелика. Терміновим завданням є з'ясування того, скільки всього і яких саме ієрогліфів сучасної китайської мови існує . Це має як практичне, так і наукове значення.
Хоча більшість ієрогліфів створена шляхом комбінацій елементів, після завершення такої комбінації вони стають цілісними самостійними знаками. Ієрогліфи не можна механічно розкладати на частини й з'єднувати. Якщо два ієрогліфи Дѕ 'дерево' з'єднати разом, то вони не стануть правильним ієрогліфом БЦ 'ліс', тому що в останньому накреслення двох знаків Дѕ 'дерево' неоднакове. В ієрогліфах Зл'просити' і Р» 'дякувати' ключем є елемент Я 'мова'. Однак під впливом елементів, що перебувають праворуч від нього, його накреслення не може бути в різних випадках зовсім однаковим. Десять тисяч ієрогліфів - це десять тисяч індивідуальних знаків. Така ситуація у величезному ступені відрізняється від існуючої при алфавітному письмі, де "число слів не обмежене, а число знаків обмежене". Наявність невиразно великої кількості знаків є корінною причиною того, що ієрогліфи важко вчити й незручно використовувати. Тому з'ясування загального числа ієрогліфів сучасної китайської мови є основним змістом роботи в області впорядкування ієрогліфів[5,258].
Деякі говорять, що число ієрогліфів визначити неможливо. Чи вірна така теорія "неможливості"? Астрономи можуть підрахувати, скільки зірок на небі. Географи можуть визначити розміри океану. Чому ж не можна визначити число ієрогліфів? Звичайно, при цьому дослідника очікує безліч проблем. Насамперед - як розмежувати древнє й сучасне. У сучасному байхуа є цитати, ченъюі, слова з вэньяня; "стародавність" це або "сучасність"? Далі, чи треба при визначенні числа ієрогліфів обмежитися тими, які вживаються в друкованих виданнях, або ж включити в підрахунки й ті, які в друкованих виданнях не вживаються? При переписі населення виявилася безліч дивних ієрогліфів у власних іменах, при переписі географічних назв - безліч дивних ієрогліфів, які використовуються для їхнього позначення. У свій час жоден з них не потрапив у словники й книги, навіть їхнє читання є проблемою. Третя проблема: як довести, що "список ієрогліфів", що у майбутньому буде складений, стане "повним списком"? Чи буде він дійсно вичерпним? [6,56-60].
По статистиці, 6600 ієрогліфів покривають 99,999% всіх ієрогліфів, що зустрічаються в сучасних китайських текстах . Четверта проблема полягає в тім, чи можна "обмежити" число ієрогліфів, до якої межі воно може зростати й з якого моменту потрібно відбирати тільки нові слова, не створюючи нових ієрогліфів? Крім того, є й інші проблеми. Ці проблеми мають бути досліджені і треба знайти відповіді на них, хоча це й нелегко.
В 1981 р. у Пекіні опублікований державний стандарт 2312-80 "Основний набір ієрогліфів, закодованих для використання в ЕОМ", у який включено 6763 ієрогліфів: 3755 ієрогліфів першого й 3008 - другого рівнів. У цей час готуються два "допоміжних набори" приблизно по 8000 знаків у кожному; у них включені ієрогліфи в повному накресленні й різні спеціальні ієрогліфи. Усього в цих трьох наборах - більше 23 000 ієрогліфів, що досить для обробки древніх і сучасних текстів. Крім того, є ще більше 34 000 рідкісних ієрогліфів, які надалі можна додатково звести в декілька "резервних наборів", однак практична користь від цього буде невелика. На Тайвані також розроблений подібний за характером набір ієрогліфів. У майбутньому, якщо виявиться можливим уніфікувати критерії віднесення до тієї або іншої категорії, насамперед критерії віднесення того або іншого знака до ієрогліфів сучасної китайської мови, це зробить досить сприятливий вплив на машинну обробку китайських текстів.
Так як "Список ієрогліфів сучасної китайської мови" ще не з'явився, цей, який містить в собі 6763 знаків "Основний набір" можна використовувати в якості його замінника. Однак вони не рівнозначні. "Основний набір" складений на основі частотності вживання ієрогліфів, і за умов частого вживання в нього повинні входити ієрогліфи древнєкитайскої мови й спеціальні ієрогліфи. "Список ієрогліфів сучасної китайської мови" походить від "типу ієрогліфа". Навіть якщо частотність його вживання невелика, то для включення в список досить того, щоб він використовувався в сучасній китайській мові.
Опублікований в 1981 р. у Японії "Список уживаних ієрогліфів" (включає 1954 знака) за характером близький до 3755 ієрогліфів першого рівня "Основного набору". У японській писемності (а не як окремий спосіб письма) є кана, у пресі й популярній літературі можна застосовувати лише ієрогліфи з "Списку вживаних ієрогліфів", крім того, вони можуть бути замінені каною. Тому Японії потрібний тільки "Список уживаних ієрогліфів", а не "Список ієрогліфів сучасної японської мови". У китайській мові інша справа. По підрахунках, 3 800 ієрогліфів покривають 99,9% всіх уживань ієрогліфів у сучасному китайському тексті. Якщо в одній тисячі випадків, що залишилася, можна було б використовувати букви, то в пресі й популярній літературі вживалося б тільки 3755 ієрогліфів першого рівня "Основного набору". Я на власному досвіді відчула цю проблему, під час перекладів спецдокументації дуже часто трапляються ієрогліфи, яких не має у звичайних та електронних словниках. Але щоб зробити власний внесок у розв'язання цієї проблеми у мене ще замало досвіду. Нажаль у цей час це питання не підлягає розгляданню, проблема заслуговує глубокого вивчення.
2.2 Спрощення й стандартизація накреслень ієрогліфів
Спрощення накреслень є природною тенденцією розвитку письма. В історії завжди існували спрощені ієрогліфи. Якщо ієрогліф уживається часто, то в кожному такому випадку виникає безліч спрощених варіантів його накреслення. Коли імперія Цинь об'єднала 6 царств, "у ній з'явилося багато чиновників з великим колом обов'язків, і тому сформувалося, як засіб, що полегшував їхнє спілкування між собою". Зміст наступних змін письмового письма лішу полягає в його спрощенні. Опублікований в 1935 р. "Перший список спрощених ієрогліфів" (324 знака), на жаль, не був застосований. В 1956 р. був виданий "Проект спрощення китайської писемності" (515 спрощених ієрогліфів і 54 спрощених ключів), в 1964 р. за аналогією з попереднім - "Зведений список спрощених ієрогліфів" (2238 знаків), які вже використовуються в популярних друкованих виданнях континентального Китаю й Сингапуру. Застосування в експериментальному порядку опублікованого в 1977р. "Другого проекту спрощення китайської писемності" припинено через велику кількість наявних у ньому недоліків.
Досвід підтверджує, що спрощення має свої позитивні й негативні сторони. Дітям, які почали вивчати китайську писемність, і учням курсів ліквідації неграмотності спрощені знаки подобаються; вони вважають, що такі знаки легко розпізнавати й писати. Учителі початкових шкіл підтримують спрощення, тому що воно полегшує викладання. Ієрогліфи, спрощені до 6-7 рис, як і раніше зрозумілі. При введенні ієрогліфів в ЕОМ по елементах також виникають побоювання щодо їхньої графічної надмірності. Найбільше схвалення зустрічають знаки фонетичної категорії. Багато хто вимагають переходу на систематичне вживання фонетичних ієрогліфів. Це становить позитивний бік спрощення.
Негативна сторона спрощення полягає в тому, що воно привело до збільшення подібності в накресленні різних ієрогліфів. Збільшилося число ієрогліфів- омонімів, наприклад ЗЁ( qіan 'тягти'), ПЛ (xіan 'дрібний'), ёЙ(gвn 'сухий'),ёЙ( gan 'працювати'). Збільшилося число фонетичних частин ієрогліфів, що неточно передають їхнє звучання, наприклад фонетична частина ¶¤(dіng 'цвях') ієрогліфа µЖ (deng 'лампа') - це гірше, ніж фонетична частина µЗ (deng 'підніматися') цього ж ієрогліфа в повному накресленні, фонетична частина ¶Ё (dіng 'обов'язково') ієрогліфа µн(dіan 'мілководне озеро') гірше, ніж фонетична частина µо (dіan 'палац') цього ж ієрогліфа в повному накресленні . Прийняття скорописних накреслень як знаки статутного письма збільшило значеннєве навантаження на риси ієрогліфів. Наприклад, такі ієрогліфи, як Кй 'книга', і¤ 'начальник, довгий' незручно писати й класифікувати по ключах. Заміна одних ієрогліфів іншими, що мають таке ж накреслення, збільшила значеннєву плутанину. При вживанні вэньянизмів проблема ще більше загострюється. У ході реформи писемності спочатку реформувалися тільки "сучасні", але не "древні" ієрогліфи. У бібліотеках є велика кількість старих книг, надрукованих ієрогліфами в повному накресленні. Їх продовжують використовувати в Гонконгу й на Тайвані. Різниться накреслення ієрогліфів у старих і нових книгах, у Китаї й за його межами[5,789][13,548-678].
При проведенні спрощення вихідним є принцип "звичності й зручності". Спрощення ґрунтується на звичках мас, що сформувалися в плин тривалого часу, і тому легко проводиться в життя. Колись ходовий скоропис, що застосовувався, Синшу фактично й ліг в основу накреслення спрощених знаків. Однак принципу "звичності й зручності" бракує раціональності й системності, що породжує безліч недоліків. Треба думати, що здійснення раціонального й системного спрощення виявиться досить важкою справою й може натрапити на протидію сили звички. "Другий проект спрощення китайської писемності" виявилося неможливим увести в дію саме тому, що в ньому мав місце відхід від принципу "звичності й зручності" і відповідно повністю змінився звичний вид ієрогліфів.
Різне накреслення тих самих ієрогліфів негативно позначається на культурному обміні. Проблема скорочення числа таких накреслень, збільшення їхньої однаковості й в остаточному підсумку стандартизація у всіх китаємовних громадах і навіть у Китаї й у Японії є складним, але важливим предметом дослідження.
2.3 Стандартизація читань ієрогліфів
Стандартизацією читань ієрогліфів зайнялася Конференція по уніфікації читань ієрогліфів,яка відбулася ще в перші роки після утворення Китайської республіки. "Розгляд читань" путунхуа може сприяти стандартизації як вимови слів усної мови, так і літературних читань ієрогліфів. Транскрипція різних читань ієрогліфів у різних словниках не збігається, і в цей час ведеться вивчення шляхів її уніфікації. Крім того, є ще проблема "різночитання". В одному зі словників зібрано 7000 ієрогліфів, з яких 700 мають декілька читань. Читання 40% цих ієрогліфів можуть бути уніфіковані. У випадку, якщо це неможливо, виявляється достатнім точно визначити, коли і як читається той або інший ієрогліф, що теж буде стандартизацією.
2.4 Стандартизація структури словників ієрогліфів
Протягом останніх 50 років були розроблені всілякі способи пошуків ієрогліфів у словнику. У цей час чотирма основними способами вважаються: пошук по ключам, пошук по останній рисці, пошук по кутах і фонетичний спосіб. Однак усім їм бракує уніфікованості й твердої стандартизації. Способом, якому необхідно стандартизувати в першу чергу, є пошук ієрогліфів по ключам. У різних словниках застосовуються різні способи пошуку ієрогліфів по ключам, існують розходження в числі ключів, їхньої класифікації, по-різному підраховується кількість рис, різниться порядок їхнього накреслення. Це положення необхідно якнайшвидше змінити.
Коли виникла необхідність уводити ієрогліфи в ЕОМ, украй актуальним стало дослідження способів кодування ієрогліфів. Кодування також здійснюється за принципами, що лежать в основі структури словників ієрогліфів. Про це я розповім нижче.
Протягом останніх 50 років багато з людей у Китаї й за його межами, застосовуючи нові концепції й методи, досліджували впорядкування ієрогліфів й інші проблеми. У результаті нагромадження матеріалу й знань у цей час відбувається становлення "сучасної теорії ієрогліфічного письма" . Традиційна теорія ієрогліфічного письма (стара назва - "мала наука", або "теорія письма"), що займається дослідженням походження накреслень і читань ієрогліфів і вивчає процес їхньої еволюції, є "історичною теорією ієрогліфічного письма». Сучасна теорія ієрогліфічного письма походить зі школи історичної теорії ієрогліфічного письма. Об'єктом її дослідження є особливості ієрогліфів сучасної китайської мови й пов'язані із цим проблеми, метою - обслуговування їхнього вживання зараз і в майбутньому. Проблеми, які досліджуються сучасною теорією ієрогліфічного письма і методи дослідження значно відрізняються від проблем і методів історичної теорії ієрогліфічного письма. Використовуючи як основу лінгвістику, сучасна теорія письма сполучить її з такими суміжними дисциплінами, як кібернетика, статистика, психологія. Це - не зневага або зрада щодо історичної теорії ієрогліфічного письма, а модернізація китайської писемності.
На мій погляд підрахувати кількість ієрогліфів китайської мови не можливо, так як мова жива і постійно змінюється, так і ієрогліфи народжуються нові і помирають маловживані, так дослідження китайських вчених підтверджують мої слова. Реформу стандартизації читань вважаю досить вдалою, так як за 4 роки навчання у моєму досвіді було лише декілька разів, що я не могла знайти значення ієоргліфа, бо він мав декілька читань.
Інша ситуація склалася з реформою стандартизації накреслень ієрогліфів: спрощені ієрогліфи на континентальному Китаї і старі на Тайвані і у Гонконгу. Положення не можна змінити, так склалося історично, що ці частини Китаю йому не належали протягом довгого часу. Уряд Китаю не робить жодних зусиль у вирішенні цієї проблеми, так як Тайвань і Гонконг так і залишаються незалежними, щоб потрапити туди треба оформлювати візу. Тому не відбувається культурний обмін жителів континентального Китаю і цих частин, кожний зберігає свою культуру.
РОЗДІЛ 3
ПЕРЕХІД ДО АЛФАВІТНОГО ПИСЬМА І ПРОБЛЕМА ОРФОГРАФІЇ
3.1 Різновиди алфавітного письма
Опублікований в 1918 р. алфавіт "чжуінь цзиму" (згодом переіменований в "гоінь фухао") мав в історії китайської писемності епохальне значення. На жаль, він став лише допоміжним засобом, а не ввійшов у писемність у якості її складової частини як це відбулося з каною у Японії. При створенні чжуінь цзиму був використаний метод розподілу складу на три, з чим була зруйнована традиція розподілу складу на дві частини - ініціаль і фіналь, що також мало прогресивне значення.
Головний недолік чжуінь цзиму - у тім, що букви цього алфавіту створені з елементів китайського ієрогліфічного письма, а це ускладнює міжнародний обмін. Тому в 1928 р. був розроблений ще один алфавіт - романізований (GR). У романізованому алфавіті латинські букви були "китаїзованими" і використовувалися відповідно до особливостей китайської мови, а не в їхніх звичних функціях в англійській або іншій західній писемності. Якби із самого початку використовувався "спрощений" романізований алфавіт, то зараз, можливо, він застосовувався б скрізь. В 1933 р. у Китаї стала відома розроблена в Радянському Союзі "нова латинізована писемність для північних діалектів", що представляє собою ще одну спробу "китаїзації" букв латинського алфавіту.
Деякі говорять, що опублікований у 1958 р. "Проект фонетичного алфавіту для китайської мови" є спадкоємцем латинізованої нової писемності. Це думка невірна. "Проект фонетичного алфавіту" у своїх основних характеристиках наполовину збігається з романізованим, наполовину - з латинізованим алфавітом, а діакритичні знаки для позначення тонів беруть свій початок у чжуінь цзиму. "Проект" поєднує безліч шкіл, а не є продуктом однієї з них[7,224-253].
Під так званим "переходом на фонетичне письмо” у широкому значенні розуміються будь-які випадки вживання алфавіту, у вузькому - досягнення ним статусу офіційної писемності. Фонетичний алфавіт піньінь цзиму досяг тільки статусу "транскрипції", але не офіційної "алфавітної писемності". Для виправлення недоліків "алфавітної писемності" у Китаї й за кордоном у період з 1958 по 1982 р. було розроблено 1667 проектів "алфавітної писемності для китайської мови". На ділі, не пройшовши етапу "транскрипції", абсолютно неможливо одним махом піднятися на вершину й досягти офіційного статусу "алфавітної писемності". Неможливо відкинути "Проект фонетичного алфавіту для китайської мови" і офіційно затвердити який-небудь інший проект у якості "алфавітної писемності". Протягом минулих 25 років відбувалося широке впровадження фонетичного алфавіту піньінь цзиму. Мимоволі виправивши навіть одну його букву - це може викликати надзвичайну плутанину. Фактично статус цього алфавіту вже не можна похитнути. Щорічно його вивчають десятки мільйонів учнів початкової школи й курсів ліквідації неграмотності. Він застосовується для транскрибування читань ієрогліфів у Сінгапурі й Малайзії. Конференція ООН по стандартизації транскрибування географічних назв і Міжнародна організація стандартизації вже прийняли рішення про використання алфавіту піньінь цзиму як засіб стандартної міжнародної транскрипції китайських слів. Майбутня робота, полягає в удосконаленні викладання алфавіту піньінь цзиму й розширенні сфери його застосування, для того щоб алфавіт використовувався паралельно з ієрогліфами й здійснив свою функцію допоміжної писемності, а не у прагненні здобуття ним офіційного статусу "алфавітної писемності", що не має практичного значення.
3.2 Проблеми орфографії
Запис китайського тексту алфавітом вимагає використання як одиниці мови слова. У словах окремо, як ієрогліфи, писати кожний склад неможливо, так само як і писати всі склади в тексті разом. Орфографія відбиває природний ритм мови. Написано разом чи окремо не представляє проблеми для суспільства, що звикло до алфавітної писемності, але в суспільстві, що звикло до ієрогліфічної писемності, є незнайомою й навіть незбагненною проблемою. З метою розв'язання проблем орфографії й інших проблем алфавітного письма у 1982 р. була створена Комісія з орфографії фонетичного алфавіту для китайської мови. "Орфографія" раніше називалася "правилами накреслення ієрогліфів", з 60- х років поступово вкоренився термін "орфографія". Проблема алфавітного письма китайської мови не в морфемі, а в слові. Відмова від розгляду проблем орфографії алфавітного письма на основі "морфеми як основної одиниці мови, затвердження у якості такої одиниці як слова, представляється нововведенням, що має принципове значення.
Завданнями Орфографічної комісії є розробка правил, редагування словників, впровадження норм алфавітного письма. Давайте звернемося до питання розробки правил.
До правил, які необхідно розробити, відносяться правила основні й спеціальні. У цей час всім зацікавленим у цьому інстанціям відісланий для висловлювання думки "Експериментальний проект основних орфографічних правил алфавітного письма".
Розробка основних правил має під собою основу. В 30- е роки були "правила орфографії слів", призначені для романізованого алфавіту. Такі правила мала й латинізована нова писемність в 30- е роки. За останні 25 років були видані різні друковані матеріали на піньінь цзиму, автори яких отримували правила орфографії на практиці. У цей час основні правила орфографії розробляються на базі минулого досвіду. Варто усунути розбіжності й прийняти все те, що одержало загальне схвалення, зберегти всі переваги й виправити недоліки, а досвід застосування алфавіту сформулювати у вигляді письмових правил, що буде зручно для його подальшого застосування. Алфавітне письмо в принципі призначено для запису звуків мови на слух, а орфографія - це правила запису слів для їхнього сприйняття в писемній формі. Поєднання системи, що ґрунтується на слуховому сприйнятті, із правилами, призначеними для сприйняття слів у писемній формі; запис зрозумілої на слух звукової мови алфавітом у формі, зрозумілої при зоровому сприйнятті, - як у тому, так і в іншому випадку, має багато проблем. Давайте виділемо деякі з них[8,175].
1. Що таке слово? Визначення слова, що було б коштовне в теоретичному відношенні й мало б конкретне практичне значення ще не існує. "Теоретичне слово", яке виділяється у граматиці і "формальне слово",яке пишеться разом, важко об'єднати в рамках одного поняття. Є спеціальний граматичний термін, але спеціального орфографічного терміна не існує, відсутність чіткості в термінології веде в ряді випадків до неточностей. В ідеалі орфографія має потребу в єдиному правилі: одне слово пишеться разом, два слова - окремо. На справді все не так просто. Слова важко розмежувати між собою. Існує багато випадків, коли декілька "теоретичних слів" варто писати, як одне "формальне слово". Наприклад, НјКй№Э 'бібліотека' - це одне слово? Два слова? Три слова? Чому пишеться разом? Що таке №Э 'офіційна установа'? Слово? Морфема? Суфікс? Постпозитивний елемент? Афікс? Показник приналежності до частини мови? Чи таке твердження є логічним: "Іменник (Кй 'книга') і наступний односкладовий показник приналежності до частини мови (№Э) пишуться разом"?
2. Орфографія зв'язана з усіма аспектами мови: її граматикою, семантикою, словотвором, ритмічною організацією. Однак цей зв'язок суперечливий. Не можна враховувати тільки один аспект. При врахуванні декількох аспектів який з них вважати головним? Наприклад, у пропозиції ОТіФ·№Ј¬ДгіФГж 'Я їм рис, а ти хліб' іФ·№ 'їм рис' пишеться окремо, а в словосполученні іФ·№ОКМв 'проблема їжі' іФ·№ пишеться разом. Чи правильно це? Змінилися значення слів, однак дієслівно-об'єктні відносини змін не мають. Чому ж ми виходимо не з дієслівно-об'єктних відносин, а зі значень? Знову ж якщо РЦµЬ 'брати' розуміти µЬµЬ 'молодший брат', то це слово пишеться разом, якщо ж під ним розуміються ёзёз єН µЬµЬ 'старший і молодший брати', то воно пишеться наполовину разом (у середині ставиться дефіс). Чи можна, виходячи з формальних критеріїв, і в тім, і в іншому випадках писати разом? [15,378-383].
3. Важливим процесом, що спостерігається в ритмічній організації китайської мови, є його перетворення у двоскладну мову. Це впливає на орфографію, однак вступає в протиріччя із граматикою й словотвором. Наприклад, назва Лі ТШ ПШ Шуньи сянь 'повіт Шуньи' може вимовлятися як ЛіТШШуньи, а слово сянь 'повіт' при цьому може бути опущено, тоді як назва бјПШТунсянь 'повіт Тунсянь' не може бути скорочене до бјТун (не можна опустити ПШсянь 'повіт'). Як тут писати ПШсянь? Разом? Окремо? Або із двоскдадовим власним ім'ям писати окремо, а з односкладовим - разом? У назвах островів ЕфєъµєПэнхудао й Пэнхуледао ЕобІШмµєписати власне ім'я й ім'я загальне разом, окремо або односкладове ім'я загальне писати із власним ім'ям разом, а двоскладове - окремо? Чому?[14](456,265,734)
4. На орфографію також впливає частотність уживання. Наприклад, числівники й рахункові слова пишутся окремо Иэ±ѕКй(сань бэнь шу 'три книги'), однак Т»ёцигэ (числівник і 'один' з рахунковим словом гэ) за звичкою пишеться разом, тому що воно часто вживається (за характером вживання подібне до невизначеного артикля). Як визначити частотність? Як часто повинне вживатися слово, для того щоб писати його разом?
5. У китайській мові багато "зчіпних слів", які можна писати як окремо так і разом. Як діяти? У вихідній формі писати їх разом, а в її варіантах - окремо? Наприклад, як записувати алфавітом ѕП№Єцзюйгун 'кланятися', ѕПБЛ№Єцзюйле гун 'поклонився', ѕПБЛТ»ёц№Єцзюйле иге гун 'відбив один уклін', ѕПГ»УРцзюй мей ю? - ѕПБЛцзюйле 'поклонився? - поклонився', јёёц№Єцзігэ гун? - Т»ёц№Є иге гун 'скільки уклонів? - один уклін'?
6. Слова з веньяня здебільшого односкладові, їх украй важко сприймати на слух, і за характером вони відрізняються від слів байхуа. Якщо в ченъюях веньяня кожне слово писати окремо, то перестане відчуватися єдність тексту й при їхньому вживанні в байхуа буде порушене зорове сприйняття. У контексті такі слова буде складно відокремити від тих, які стоять перед і за ним, що ускладнить читання й розуміння тексту. У японському "Словнику китайської мови" Кураіси Такесіро ченъюі вэньяня пишуться разом в один суцільний ряд що також представляється занадто громіздким. В останні роки намітилася тенденція до компромісного рішення: писати слова або словосполучення з вэньяня через дефіс, що їх одночасно й з'єднує, і роз'єднує, наприклад: УЮ№«ТЖЙЅYugong-Yі- Shan 'Юй Гун пересуває гору', іНЗ°±Сєу chengqіan- bіhou 'щоб помилки минулого послужили уроком на майбутнє'. Однак і тут виникає побоювання, що доведеться писати занадто багато дефісів. Як бути?
Під час відсутності затверджених правил написання слів в різних друкованих виданнях, які видаються на алфавіті піньінь цзиму написання 85% слів збігається, у написанні 15%, що залишилися є великі розбіжності. Потрібно прагнути до усунення цих розбіжностей за допомогою звичного "загальновживаного" написання, а цього не можна досягти за короткий час.
"Проект фонетичного алфавіту для китайської мови" дає норму запису складів. Орфографія дає норму запису слів і словосполучень. З'єднання "Проекту" з орфографією й стане добре розробленою системою алфавітного письма[10,68-71].
РОЗДІЛ 4
СИСТЕМА СПОЛУЧЕННЯ ДВОХ МЕТОДІВ МАШИННОЇ ОБРОБКИ КИТАЙСЬКИХ ТЕКСТІВ
4.1 Початок дослідження методів обробки китайських текстів
Деякі говорять, що, коли можлива машинна обробка ієрогліфічних текстів, алфавіт більше не потрібний. Але все навпаки. Без алфавіту ЕОМ не могло стати знаряддям підвищення культури широких мас. ЕОМ, що обробляли ієрогліфічні тексти, потребували значних коштів, у них застосовувалися складні операції, одній людині важко було працювати на такій машині. Масове впровадження ЕОМ можливе було тільки у випадку використання машин, що обробляли тексти, записані алфавітом. Це також вигідно й з боку встановлення зв'язку з міжнародною інформаційною системою. Це так само вірно, як і те, що алфавітні друкарські машинки мали масове застосування, а ієрогліфічні могли експлуатуватися не широким колом людей, а лише спеціально підготовленими друкарками в установах. Для того щоб машинна обробка китайських текстів ішла в ногу з часом , необхідно було використовувати систему, що сполучала два методи: обробляла на ЕОМ і ієрогліфічні тексти, і алфавітні. Перший із цих методів варто було застосовувати організаціям, що мали для цього необхідні людські й матеріальні ресурси й до того ж існувала велика потреба у використанні ієрогліфів. Другий - приватними особами, у родині, у шкільних класах, у порівняно невеликих установах.
У той час багатьма організаціями Пекіна проводилися експерименти з метою створення штучного інтелекту. Наприклад, в Академії китайської медицини ЕОМ використовували для постановки діагнозів хворим, ведення історій хвороби, виписки рецептів; в Інституті мовознавства на ЕОМ проводилися експерименти в рамках діалогу "людина - машина"; в Інституті психології за допомогою ЕОМ ставили експерименти по "розумінню китайської мови". У всіх цих експериментах використовували алфавіт, а не ієрогліфи. Чому? Причина дуже проста: обробка ієрогліфічних текстів вимагала дорогого устаткування й складних процедур. Тому система сполучення двох методів фактично вже існувала, причому машини, що обробляли алфавітні тексти, зайняли провідне положення[9,156-157].
Звичайно, це не означило, що не потрібно було розвивати електронно-обчислювальну техніку, яка обробляла б ієрогліфічні тексти. При обробці ієрогліфічних текстів основні труднощі полягали у введенні ієрогліфів в ЕОМ. До теперішнього часу розроблено більше 400 способів введення ієрогліфів в ЕОМ. Вони підрозділяються на три групи:
1) графічні: ієрогліфи вводяться безпосередньо в ЕОМ у порядку черговості по елементах. Цей метод уже затвердився, підходить для використання в таких великих установах, як друкарні;
2) кодування за допомогою числового коду: більше 400 наявних способів належать головним чином саме до цієї групи;
3) перетворення алфавіту.
4.2 Способи кодування ієрогліфів
Способи кодування ієрогліфів за допомогою числового коду також підрозділяються на кілька видів.
1. Кодування елементів. Елементи, з яких складаються ієрогліфи, бувають великими й малими. Великий елемент відповідає, як правило, ключу ієрогліфа, малі елементи утворяться в результаті подальшого розкладання великого. Кожному елементу відповідає певна клавіша на панелі ЕОМ або ж йому дається певний числовий код.
2. Кодування ієрогліфів за їхніми особливими ознаками. У цьому випадку кодуються певні особливі ознаки ієрогліфів, наприклад третій або четвертий кут, перша або остання риска.
3. Кодування по рисках. Ієрогліфи складаються з рисок, які зводяться до декількох основних видів. Кожному такому виду відповідає клавіша на панелі ЕОМ або ж йому дається певний числовий код. Це старий спосіб, що розвивається на новій основі.
4. Числове кодування: кожному ієрогліфу на підставі його місця в словнику, частотності вживання або якої-небудь іншої характеристики дається числовий код. Найбільш старим і розповсюдженим з таких кодів є чотиризначний телеграфний код.
5. Кодування методом комбінації звучання й накреслення: текст вводиться частково за допомогою алфавіту або алфавітних скорочень, частково - ієрогліфами. Такого роду способів надзвичайно багато.
У той час було неможливо використовувати тільки один спосіб введення ієрогліфів в ЕОМ. Звичайно, неможливо було також використовувати 400 або 40 способів. Чим більше способів - тим вужчий ринок збуту відповідної продукції, застосування такої техніки також створювало масу незручностей. Як можна було скоротити число способів? Шлях рішення питання - проведення єдиної політики в області розробки способів введення ієрогліфів в ЕОМ шляхом класифікації цих способів по групах, концентрації, підйому й стандартизації. Класифікація - це об'єднання всіх способів у зазначені п'ять або деякої іншої кількостей груп. Концентрація - це зведення знаннь про ті чи інші особливості введення ієрогліфів в ЕОМ до якогось загального знаменника. Підйом - це проведення колективних досліджень і загальне підвищення рівня розробок. Стандартизація - це затвердження у якості стандарту кращих з таких удосконалених способів. Кожні кілька років проводилася робота по аналізуванню й удосконалюванню. Застосування цього "четирьохступінчастого методу проведення єдиної політики" прискорило розвиток способів уведення ієрогліфів в ЕОМ[11,56-62].
Корінним недоліком методів кодування ієрогліфів за допомогою числового коду були великі витрати розумової енергії. Необхідна була спеціальна підготовка, вивчене легко забувається; якщо володів одним із цих методів - не володів іншим.
4.3 Новий спосіб "перетворення алфавіту"
У нових розробках в області "перетворення алфавіту" числове кодування зовсім не застосовується. Після уведення китайського алфавіту або алфавітних скорочень в ЕОМ машина автоматично перетворює їх в ієрогліфи. Це стосується як окремих знаків, так і написаних ієрогліфами слів, груп і сполучень слів, речень. У таких ЕОМ клавіш стільки ж, скільки в ЕОМ, що обробляють англійський текст. Досить у початковій школі вивчити китайський фонетичний алфавіт - і не потрібно ніякої спеціальної підготовки.
Подобные документы
Місце класичної китайської мови веньянь та байхуа у розвитку китайської мови. Модернізація писемності. Відмінності в граматичному складі веньянь і сучасної китайської мови. Сфера застосування веньянізмів. Фразеологічна система сучасної китайської мови.
дипломная работа [84,2 K], добавлен 27.12.2012Дослідження основних етапів еволюції англійської мови. Вплив кельтської мови на базовий граматичний розвиток англійської, запозичені слова. Діалекти англосаксонських королівств. Виникнення писемності, становлення літератури і лондонського стандарту.
реферат [1,6 M], добавлен 04.01.2011Проблема дотримання сталих мовних норм усної і писемної літературної мови в сучасному суспільстві, свідомого, невимушеного, цілеспрямованого, майстерного вживання мовно-виражальних засобів залежно від мети й обставин спілкування між респондентами.
презентация [2,5 M], добавлен 19.06.2017Мова як найвищий дар людини й цілого народу, талісман їхньої долі, таланту, безсмертя. Деякі аспекти історії виникнення української мови та писемності, докази її давності. Особливості золотої скарбниці української усної народної творчості, її значення.
сочинение [13,6 K], добавлен 21.04.2011Способи перенесення власних імен з однієї мови в систему писемності. Проблема перекладу британських, французьких, українських та російських географічних назв. Переклад назв географічних об’єктів літерами українського алфавіту на прикладах друкованих ЗМІ.
курсовая работа [44,6 K], добавлен 03.10.2014Формування навичок користування всіма аспектами мови в основі навчаня іноземним мовам. Особливості методики викладання іноземної мови на початковому етапі - для молодших школярів. Навички аудіювання, читання, письма та говоріння, особливості фонетики.
курсовая работа [71,2 K], добавлен 23.05.2009Читання як компонент навчання іноземної мови. Читання як культура сприйняття писемного мовлення. Етапи роботи з текстом. Сучасні вимоги до жанрової різноманітності та принципів відбору текстів з іноземної мови. Загаьні переваги автентичних текстів.
контрольная работа [25,9 K], добавлен 08.04.2011Проблема періодизації історії англійської мови. Рання історія Британських островів. Завоювання Британії германцями, скандинавське завоювання. Нормандське завоювання, становлення англійської національної мови. Поширення англійської мови за межі Англії.
реферат [53,5 K], добавлен 16.04.2019Інтернет-мова як відображення нових форм комунікації. Особливості та класифікація інтернет-лексики сучасної китайської мови. Основні причини, які впливають на специфіку китайської інтернет-лексики, щодо труднощів перекладу та її тематичної класифікації.
курсовая работа [131,0 K], добавлен 13.12.2014Постать Б. Грінченка як різнопланового діяча. Традиційні методи упорядкування довідкових видань. Основна організаційно-творча робота над "Словарем української мови". Використання "Словаря української мови" Бориса Грінченка у сучасній лексикографії.
курсовая работа [1,1 M], добавлен 10.06.2011