Корей тілі және компьютерлер - Korean language and computers

Оңтүстік Кореялық Dubeolsik (екі жиынтық типті) стандартты макеті.

Жазу жүйесі Корей, Хангүл, блоктарға бөлінген алфавит слогдар; таңбаларды тек солдан оңға қарай жазу мүмкін емес. Осыған орай, корей тіліндегі кез-келген слогды а-ның слогдық блоктары ретінде көрсету керек қаріп, немесе болуы керек кодталған бөлек. Юникод соңғы нұсқаны қолданады. Мысал ретінде 하 (га) буыны ㅎ (h) және ㅏ (a) таңбаларынан тұрады, бірақ олардың барлығы жеке кодталған.

Солтүстік Кореяның Dubeolsik стандартты макеті

Таңбалардың кодталуы

Жылы RFC 1557, ретінде белгілі әдіс ISO-2022-KR корей таңбаларын 7-биттік кодтау үшін электрондық пошта сипатталды. 8 битке рұқсат етілген жерде EUC-KR кодтауға артықшылық беріледі. Бұл екі кодтау US-ASCII (ISO 646 ) корей стандартымен KS X 1001:1992[1] (бұрын KS C 5601: 1987 деп аталған). Жылы Солтүстік Корея, деп аталатын жеке таңбалар жиынтығы KPS 9566 қолданыста, ол KS X 1001-ге ұқсас.

Халықаралық Юникод стандартта корей тілін ана тілінде бейнелейтін арнайы таңбалар бар хангул фонетикалық жүйе. Юникод қолдайтын екі әдіс бар. Қолданған тәсілі Microsoft Windows әрқайсысының болуы 11,172 слогдардың комбинациясы код және алдын-ала құрылған қаріп таңбасы ретінде. Басқа тәсілі - әріптерді кодтау (жамос Бағдарламалық жасақтама оларды Windows жүйесінде қолданылмайтын дұрыс комбинацияларға қосуға мүмкіндік береді. Әрине, бұрынғы әдіс қаріптің жадын көбірек қажет етеді, бірақ формаларды жақсартуға мүмкіндік береді, өйткені құжаттарды жасау кезінде артықшылық беретін стилистикалық тұрғыдан дұрыс үйлесімдер жасау қиын.

Жай тізбектеу мүмкіндігі де бар (тізбегі) медиальды (-тер) (джунгсонг) - содан кейін а (тізбегі) ақтық (-тер) (джонгсонг) және / немесе а Орта корей биіктік белгісі, қажет болса - үстіне (тізбегі) бастапқы (-тер) (таңдады), егер шрифт медиальді және соңғы болса жамос курсордың немесе каретканың сол жағына ендірілген ені нөлдік аралықпен, осылайша инициалдың астынан немесе оңынан сол жақта пайда болады. Егер буынның көлденең медиалы болса (, , , немесе ), бастапқы тік буынды буындардағы жағдайдан гөрі, вертикаль медиальға сақталуы керек болғандықтан, толық слогта сол жақта пайда болуы мүмкін, ол Ортаңғы бейнелеудің жалғыз жолы болуы мүмкін эстетикалық жағынан нашар көрінеді Корей тіліндегі мәтін, суреттерге, романизацияға, ескірген жамағатты немесе стандартты емес кодировкаларды қолданбай. Алайда қазіргі қаріптердің көпшілігі бұны қолдамайды.

The Юникод стандарт сонымен бірге бірыңғай құруға тырысты CJK қытай тілін көрсете алатын таңбалар жиынтығы (Ханзи ) сонымен қатар жапондықтар (Канджи ) және корей (Ханджа ) арқылы осы сценарийдің туындылары Ханьды біріктіру әр түрлі типографиялық дәстүрлер кейіпкердің сыртқы түріне қатысты үлкен айырмашылықтарды туғызбаса, қытай таңбаларын көрсету үшін тілі мен аймағы бойынша кемсітпейтін процесс - қараңыз Сурет: Xin-jiu-zixing.png жақында пайда болған кейіпкерлердің мысалдары үшін Қытайдағы Қытайда. Ханьды біріктіру біраз сынға ұшырады.

Мәтін енгізу

Корейлік компьютердің пернетақтасында мәтін, әдетте, қажетті батырманы басу арқылы енгізіледі жамағат; операциялық жүйе әр композиттік символды жылдам жасайды. Байланысты IME және пернетақтаның орналасуы, қос дауыссыз дыбыстарды ауыстыру батырмасын ұстап тұрып енгізуге болады. Силлабикалық блокты құрайтын барлық жамағат енгізілген кезде, пайдаланушы пернелер тіркесімін немесе интерфейс түймесін пайдаланып, ханьға немесе басқа арнайы таңбаларға түрлендіруді бастай алады; Бұл үшін Оңтүстік Корея пернетақталарында жеке кілт бар. Кейінгі жартылай автоматтандырылған ханзаны түрлендіруге мәтіндік процессорларда әртүрлі дәрежеде қолдау көрсетіледі.

Басқа тілден пернетақтаны қолданған кезде, көптеген операциялық жүйелер пайдаланушыдан корей пернетақтасының түпнұсқа орналасуын пайдаланып теруді талап етеді, оның ең кең тарағаны 2 (ду) -беолсик. Бұл кейбір басқа тілдерден айырмашылығы, мысалы, жапондықтар, жергілікті емес пернетақталарда романизация жүйесін қолданып мәтін енгізуге болады.

Linux сияқты көптеген операциялық жүйелер мүмкіндік бермейді engine / hangul / hangul-keyboard = 'ro' , нәтижесінде Romaja пернетақтасы пайда болады, мұнда «seonggye» пернесі 성계 болып шығады.[2] Бұл конфигурацияда shift ауысыммен емес, «gg» арқылы алынады. Бұл «jasanGun» кілтіне j 상운 беретін «jasangun» кілтінің орнына 자산 군 алуға мүмкіндік береді.

Ханджа

Жоғарыда аталған конверсия мәселелерінен басқа, кейбір корей қаріптерінде басталатын ханжа жоқ. Сонымен қатар, қазіргі мәтіндік процессорлар қолданушыға қандай қаріпті мәтінде орын алуы мүмкін кез-келген ханзаның резерві ретінде қолдануға болатындығын көрсетуге мүмкіндік бермейді. Бұл жағдайда ханзаның әрбір тізбегі қажетті қаріпте пайда болуы үшін қолмен пішімделуі керек.

Ерекше жағдайлар

Бар мәтін тік жолдарда орындалады HTML немесе мәтіндік процессорлардың көпшілігі нашар немесе мүлдем қолдамайды, дегенмен бұл қазіргі заманғы корей тілі үшін мәселе емес, өйткені ол әдетте көлденеңінен жазылады. 20 ғасырдың екінші жартысына дейін корей тілі тігінен жиі жазылатын. Хангулда жазылған XV ғасыр мәтіндерінде слогдардың сол жағында айқын белгілер болды, олар Юникодқа енгізілген, бірақ қазіргі шрифттердің көпшілігі оларды жеткілікті түрде қолдамайды.

Бөлімін қараңыз таңбаларды кодтау ескірген жамағат үшін жоғарыда.

Бағдарламалар

Корей тіліне қатысты қолдануға арналған арнайы бағдарламаларға мыналар жатады:

Юникодтағы хангул

Юникодтағы хангул жамағаты кейіпкерлері
Unicode-дегі Jamul блогының Hangul үйлесімділігі

Хангул әріптері Unicode сипаттамасының бірнеше бөлек бөліктерінде егжей-тегжейлі көрсетілген:

Hangul Syllables блогы

Юникодтағы Hangul Syllables блогындағы алдын ала құрастырылған буын алгоритмі келесі формула арқылы анықталған:

[(алғашқы) × 588 + (медиальды) × 28 + (соңғы)] + 44032
  • Бастапқы дауыссыздар
  • Орташа дауысты дыбыстар
  • Соңғы дауыссыздар

Мысалы, егер біреу кодтың нүктесін тапқысы келсе « «Юникодта:

  • Бастапқы ㅎ дыбысының мәні 18-ге тең.
  • Медиальды ow дауысының мәні 0-ге тең.
  • Соңғы on дыбысының мәні 4-ке тең.

Осы мәндерді жоғарыдағы формулаға ауыстырғанда [(18 × 588) + (0 × 28) + 4] + 44032 = 54620 шығады. Демек, Unicode мәні ондықта 54620, 한 бойынша таңбалардың сандық анықтамасы, және он алтылық Unicode белгісіндегі U + D55C.

Hangul үйлесімділігі Jamo блогы

Hangul үйлесімділігі Jamo блок - үйлесімділікке бөлінген Юникодтың бөлігі KS X 1001 таңбалар жиынтығы. Әдетте ол кейбір гангул жамағатын бөліп көрсетпей өздігінен бейнелеу үшін қолданылады бастапқы және ақтық.

Хангул Джамо блоктары

Хангул Джамо, Hangul Jamo Extended-A және Hangul Jamo Extended-B блоктар бар алғашқы жамағат, медиальды жамағат және соңғы жамағатоның ішінде ескірген жамағат.

Hanyang жеке пайдалану аймағының коды

Хангул (мәтіндік процессор) қаріптері бар кемелер Hanyang ақпарат және коммуникация. Олардың қаріптері ескірген символдарды Жеке пайдалану аймағы Юникод. Арнайы кодтық нүктелердің орнына жеке пайдалану аймағын пайдаланғанына қарамастан, Ханянның картасы 2007 ж Оңтүстік Кореяда ескірген hangul ұсынудың ең танымал тәсілі.

Hangul 2010 бастап, Ханком ескірген Hanyang PUA коды және Unicode-дағы hangul Jam-ды қолданып ескірген ханул таңбаларын ұсынуды таңдады.

Сондай-ақ қараңыз

Әдебиеттер тізімі

  1. ^ «KS X 1001: 1992» (PDF).
  2. ^ https://github.com/libhangul/ibus-hangul
  3. ^ а б 김치관 (2000 жылғы 2 желтоқсан). 문답 으로 보는 북한 정보화 의 현주소. Tongilnews.com (корей тілінде). Алынған 3 желтоқсан, 2006.
  4. ^ а б c 김효석 (2000 жылғы 2 желтоқсан). «<국회 자료집> 북한 S / W 현황 과 시연 자료». Tongilnews.com (корей тілінде). Алынған 3 желтоқсан, 2006.
  5. ^ Йонхап (7 қаңтар 1998 ж.). 북한 의 컴퓨터 산업 어디 까지 왔나. Tongilnews.com (корей тілінде). Алынған 3 желтоқсан, 2006.[өлі сілтеме ]
  6. ^ «북한 용어 사전: 평양 정보 센터 (PIC)» (корей тілінде). Архивтелген түпнұсқа 2007 жылдың 28 қыркүйегінде. Алынған 3 желтоқсан, 2006.

Сыртқы сілтемелер