5.4 Xö lý cao cÊp vÒ ch÷ ViÖt (phÇn kh«ng b¾t buéc)

Xö lÝ kiÓm tra chÝnh t¶ ch÷ ViÖt

Cã c¸c møc ®é kiÓm tra chÝnh t¶ cho ch÷ ViÖt:

- KiÓm tra viÖc viÕt ®óng tõng ©m tiÕt ch÷ viÕt

- KiÓm tra viÕt ®óng c¸c tõ ghÐp

- KiÓm tra viÕt ®óng c¸c tõ ngo¹i quèc

- Hç trî cung cÊp c¸c tõ ®ång nghÜa hay tr¸i nghÜa

¢m tiÕt ch÷ viÕt

ViÖc kiÓm tra viÕt ®óng cho tõng ©m tiÕt ch÷ viÕt cã thÓ ®­îc thùc hiÖn theo c¸c qui t¾c sinh ra tõng ©m tiÕt ®ã trong tiÕng ViÖt. Còng cã thÓ c¨n cø vµo c¸c b¶ng thèng kª nh÷ng tr­êng hîp cã kh¶ n¨ng ph¸t sinh vÊn ®Ò chÝnh t¶ ®Ó x¸c ®Þnh c¸c vÊn ®Ò cÇn kiÓm tra chÝnh t¶.

MÆt kh¸c, viÖc kiÓm tra nµy còng cã thÓ ®­îc thùc hiÖn th«ng qua tra b¶ng c¸c ©m tiÕt ch÷ viÕt.

Tõ ghÐp

KiÓm tra chÝnh t¶ cho c¸c tõ ghÐp tiÕng ViÖt hiÖn nay vÉn cßn lµ mét vÊn ®Ò ch­a cã c¸ch gi¶i quyÕt còng nh­ cµi ®Æt thËt h÷u hiÖu trªn m¸y tÝnh. Khã kh¨n chÝnh lµ ë chç d¹ng tõ ghÐp kh«ng ®­îc x¸c ®Þnh râ th«ng qua c¸c dÊu hiÖu ph©n c¸ch tõ th«ng th­êng. C¸c tõ ghÐp tiÕng ViÖt ®­îc cÊu t¹o tõ c¸c ©m tiÕt ch÷ viÕt, mçi ©m tiÕt l¹i ®­îc viÕt rêi lÉn nhau. Thµnh thö ®Ó kiÓm tra ®­îc tõ ghÐp cã ®óng chÝnh t¶ kh«ng, cÇn cã thuËt to¸n ®Ó c¾t c©u thµnh ®óng c¸c côm tõ ghÐp cã nghÜa. §iÒu nµy l¹i dÉn ®Õn viÖc ph¶i ph©n tÝch s¬ bé c©u ®Ó ph¸t hiÖn côm tõ. Cã nghÜa lµ cÇn x¸c ®Þnh tõ trong khi nã ch­a cã h×nh thÓ x¸c ®Þnh trong mét x©u kÝ tù.

§Ó gi¶i quyÕt khã kh¨n nµy, cã mét sè h­íng ®· ®­îc ph¸c th¶o. Cã thÓ t×m c¸ch gi¶i quyÕt vÊn ®Ò nµy ë møc ®é ng«n ng÷, cã nghÜa lµ t×m c¸ch lµm ®ång nhÊt tõ ghÐp víi h×nh thøc biÓu diÔn cho nã thµnh mét khèi, thuËn tiÖn cho viÖc ®Þnh biªn. §iÒu nµy dÉn tíi ®Ò nghÞ viÕt liÒn c¸c ©m tiÕt ch÷ viÕt trong mét tõ ghÐp hoÆc dïng mét kÝ hiÖu nèi nµo ®ã ®Ó t¹o thµnh ®¬n vÞ biÓu diÔn liÒn cho c¸c tõ ghÐp chø kh«ng ph¶i lµ mét tËp hîp ch­a x¸c ®Þnh râ c¸c thµnh phÇn ©m tiÕt ch÷ viÕt. Tuy nhiªn râ rµng gi¶i ph¸p nµy cßn gÆp nhiÒu tranh c·i v× ®i ng­îc víi xu h­íng dïng hiÖn t¹i.

Còng cã thÓ t×m c¸ch ®­a vµo m¸y tÝnh tõ ®iÓn chÝnh t¶ cho ch÷ ViÖt víi tÊt c¶ kh¶ n¨ng tæ hîp gi÷a c¸c ©m tiÕt ch÷ viÕt ®Ó t¹o ra c¸c tõ ®· ®­îc thõa nhËn trong ng«n ng÷.

Tõ ngo¹i quèc

Nãi chung c¸c tõ ngo¹i quèc ®­îc ®­a vµo ch÷ ViÖt hoÆc ®Ó nguyªn d¹ng, hoÆc ®­îc phiªn ©m sang c¸ch ®äc tiÕng ViÖt. ViÖc kiÓm tra chÝnh t¶ tõ ngo¹i quèc cã thÓ dùa trªn mét b¶ng thèng kª c¸c tõ ngo¹i quèc ®· dïng th«ng dông.

Mét yªu cÇu kh¸c trong kiÓm tra chÝnh t¶ lµ kh¶ n¨ng ®­a ra nh÷ng lêi gîi ý vÒ c¸c tõ ®óng, khíp víi ng÷ c¶nh ®ang xÐt.

Xö lÝ tõ ®iÓn ch÷ ViÖt vµ CSDL ch÷ ViÖt

§i kÌm víi viÖc s¾p xÕp c¸c tõ lµ viÖc x©y dùng tõ ®iÓn c¸c tõ tiÕng ViÖt trªn m¸y tÝnh. Tõ ®iÓn nµy nªn ®­îc phæ biÕn trong c¸c m¸y tÝnh ®Ó ng­êi dïng cã kh¶ n¨ng lµm phong phó thªm vèn tõ cña m×nh qua lµm viÖc víi m¸y tÝnh. Mét tõ ®iÓn tèi thiÓu x¸c ®Þnh c¸ch viÕt ®óng ng÷ ph¸p cho c¸c tõ lµ cÇn thiÕt. Bªn c¹nh ®ã, c¸c tõ ®iÓn cao cÊp h¬n cã thÓ ®­îc nghiªn cøu ®Ó x©y dùng. Nãi riªng, viÖc x©y dùng mét c¬ së d÷ liÖu tiÕng ViÖt cã tÇm cì lµ ®iÒu nªn tËp trung c«ng søc x©y dùng.

Mét sè tõ ®iÓn song ng÷ gi÷a tiÕng ViÖt vµ c¸c thø tiÕng kh¸c còng lµ ®iÒu cÇn thiÕt x©y dùng. Nãi riªng, mét tõ ®iÓn tin häc nhá ®i kÌm m¸y sÏ cã Ých nhiÒu cho ®¹i ®a sè ng­êi dïng.

Xö lÝ v¨n ph¹m

§©y lµ møc ®é xö lÝ cao cÊp vµ cÇn cã nhiÒu nghiªn cøu chi tiÕt h¬n.

Gãc ®é ®¬n gi¶n nhÊt cña nghiªn cøu vÒ v¨n ph¹m lµ nghiªn cøu t¸ch b¹ch ra c¸c thµnh phÇn cña mét c©u bÊt k×, lÊy ra c¸c tõ hay c¸c ®¬n vÞ côm tõ cã mang mét chøc n¨ng có ph¸p nhÊt ®Þnh.

Xö lý dÞch cã liªn quan tíi ch÷ ViÖt

C¸c vÊn ®Ò dÞch m¸y ®­îc ®Æt ra tr­íc hÕt cho viÖc dÞch Anh-ViÖt, ViÖt-Anh, vµ sau ®ã lµ c¸c ng«n ng÷ kh¸c. Nh÷ng vÊn ®Ò nµy cßn cÇn cã nhiÒu kÕt qu¶ còng nh­ nhãm chuyªn m«n nghiªn cøu thªm.

 

5.6 Xö lÝ trong nhËn d¹ng ch÷ ViÖt

Xö lÝ trong nhËn d¹ng ch÷ ViÖt chñ yÕu lµ c¸c xö lÝ trªn c¸c d¹ng biÓu diÔn ®å ho¹ cña ch÷ ViÖt ®Ó tõ ®ã rót ra ®­îc m· ho¸ t­¬ng øng cho con ch÷ nµy. Qu¸ tr×nh nhËn d¹ng cÇn ph¶i t¸ch b¹ch ®­îc th«ng tin vÒ dÊu thanh vµ th«ng tin vÒ ch÷ c¸i.

Dï kh¶ n¨ng nhËn d¹ng lµ nh­ thÕ nµo, vÉn cÇn mét c«ng ®o¹n cã söa ®æi trùc tiÕp cña ng­êi dïng. C«ng ®o¹n xö lÝ nµy chuyÓn thµnh viÖc sö dông c¸c chøc n¨ng ®­a vµo vµ hiÓn thÞ ch÷ ViÖt nh­ ®· nªu ë trªn.

5.7 Xö lý chuyÓn ®æi m· ch÷ ViÖt

Xö lÝ nµy lµ cÇn thiÕt trong tr­êng hîp vÉn cßn nhiÒu bé m· ch÷ ViÖt ®ang tån t¹i vµ ch­a ®i ®Õn mét thèng nhÊt chung. Nãi chung c¸c chuyÓn ®æi nªn ®­îc thùc hiÖn hai chiÒu ®Ó gióp cho viÖc xö lÝ ®­îc dÔ dµng. Tuy nhiªn mét sè chuyÓn ®æi cã thÓ kh«ng thùc hiÖn ®­îc hai chiÒu do mét sè c¸ch m· ho¸ cho ch÷ ViÖt tr­íc ®©y ®· kh«ng m· ho¸ hÕt cho c¸c thµnh phÇn cña ng«n ng÷ (nh­ thiÕu m· cho dÊu thanh, c¾t xÐn bít mét sè tæ hîp nguyªn ©m vµ dÊu thanh). ViÖc x©y dùng c¸c b¶ng chuyÓn ®æi t­êng minh cho c¸c bé m· lµ ®iÒu cÇn thiÕt.

Trë l¹i Lªn ®Çu trang Xem tiÕp