|
文字處理經驗談一、如何處理無法輸入電腦的漢字一些漢字無法輸入電腦,一般不外乎以下二種情況:一是電腦操作系統所支持的字符集及其相應支持字體的問題,一是輸入法的問題。(一) 編碼字符集、字體、輸入法① GB2313字符集,收入漢字6763箇,符號715箇,總計7478箇字符,這是大陸普遍使用的簡體字符集。楷體-GB2313、仿宋-GB2313、華文行楷等市面上絕大多數字體支持顯示這箇字符集,亦是大多數輸入法所採用的字符集。② BIG-5字符集,收入13060箇繁體漢字,808箇符號,總計13868箇字符,目前普遍使用於臺灣、香港等地區。臺灣教育部標準宋體楷體等港臺大多數字體支持這箇字符集的顯示。③ GBK字符集,又稱大字符集(GB=GuóBiāo國標,K=擴展),包含以上兩種字符集漢字,收入21003箇漢字,882箇符號,共計21885箇字符,包括了中日韓(CJK)統一漢字20902箇、擴展A集(CJK Ext-A) 中的漢字52箇。Windows 9598簡體中文版就帶有這箇GBK.txt文件。宋體、隸書、黑體、幼圓、華文中宋、華文細黑、華文楷體、標楷體(DFKai-SB)、Arial Unicode MS、MingLiU、PMingLiU等字體支持顯示這箇字符集。微軟拼音輸入法2003、全拼、紫光拼音等輸入法,能夠錄入如镕炁夬喆姤赟?昳堃慜靕臹等GBK簡繁體漢字。BIG-5字符集(繁體中文)與GB字符集(簡體中文),編碼不相兼容,產生亂碼。若有亂碼字符出現,可以先把這些亂碼字符複制到Word中,另存爲網頁文件,再打開這箇網頁文件,點右鍵選擇相應的字符編碼,卽能正常顯示,然後再複制到Word中就全正常了。當然,用TEXTPRO之類的軟件就更方便了。④ GB18030字符集,包含GBK字符集、CJK Ext-A 全部6582箇漢字,共計27533箇漢字。宋體-18030、方正楷體(FZKai-Z03)、書同文楷體(MS Song)、香港華康標準宋體(DFSongStd)、華康香港標準楷體、華康楷書體、New Gulim、CERG Chinese Font,以及微軟Windows Vista操作系統提供的宋黑楷仿宋等字體亦支持這箇字符集的顯示。Windows 98支持這箇字符集,以下的字符集則不支持。可以用王碼五筆18030錄入。⑤ 方正超大字符集,包含GB18030字符集、CJK Ext-B中的36862箇漢字,共計64395箇漢字。宋體-方正超大字符集支持這箇字符集的顯示。Microsoft Office XP或2003就自帶有這箇字體。若要單獨安裝字體,選擇:自定義安裝→選擇應用程序的高級自定義→Microsoft Office→Office共用功能→中文字體→中文超大字符集字體,點左鍵選擇“從本機運行全部程序”,其餘內容用左鍵點擊選擇不安裝。⑥ ISO/IEC 10646 / Unicode字符集,這是全球可以共用的編碼字符集,兩者相互兼融,涵蓋了世界上主要語文的字符,其中包括簡繁體漢字,計有:CJK統一漢字20902箇,CJK Ext-A 6582箇,Ext-B 42711箇,共計70195箇漢字。SimSun-ExtB(宋體)、MingLiU-ExtB(細明體)能顯示全部Ext-B漢字。至今僅有采采卷耳制作的“宋體-CJKV全漢字集”一款字體能夠顯示全部70195箇漢字,可用海峰五筆、新概念五筆、倉頡輸入法世紀版、新版的微軟新注音、倉頡輸入法 6.0 版(單碼功能)等輸入法錄入。Ext-C還有2萬多箇漢字。詳情請參閱香港中文大學網站、馬來西亞倉頡之友網站、福建陳清鈺箇人網站。⑦ 漢字構形資料庫2.3版,內含楷書字形60082箇、小篆11100箇、楚系簡帛文字2627箇、金文3459箇、甲骨文177箇、異體字12768組。可以安裝該程序,亦可以解壓後使用其中的字體文件,對於整理某些古代文獻十分有用。如果超出了輸入法所支持的字符集,就無法錄入電腦。如果沒有相應字體的支持,則顯示爲黑框、方框或空白。如果操作系統或應用軟件不支持該字符集,則顯示爲問號(一箇或兩箇)。在網頁上亦存在同樣的情況。(二) 輔助輸入法可以用系統自帶的中文內碼輸入法、增強區位輸入法,錄入相應字符集的漢字。用右鍵點擊屏幕右下角的“語言欄”→設置→添加→輸入法→Chinese (Simplified)-Enhanced Unicode IME,或中文(簡體)-內碼→確定→應用→確定。然後在“語言欄”選擇該輸入法,在屏幕的左下角就會出現狀態欄,可用右鍵點擊查看幫助信息。次外,如果已知一箇字符的內碼,就可以在Word英文輸入法狀態下直接鍵入其內碼,再按下鍵盤中的[Alt+X]組合鍵,就能呈現該字符。若再按下[Alt+X]組合鍵,又可呈現其內碼。因此亦可用此法在Word中查出任何一箇字符的內碼。(三) 難字的處理方法①字符集裏的漢字。對於字符集裏原有的漢字,如果沒有合適的輸入法可供錄入,可以查找:開始→程序→附件→系統工具→字符映射表→勾上“高級查看”→分組→按偏旁部首分類的表意文字。注意字體。找到所要的字後,再點“選擇”和“複製”,粘貼到Word。②字符集外的漢字。對於字符集裏沒有的漢字,除了造字(開始→程序→附件→True Type造字程序)之外,還可以將這些漢字全部做成圖片,插入正文中,調整至與周圍文字相稱,可以不受電腦字符集的限制。Ext-C 區2萬多箇漢字,因爲目前尚無相應字體的支持,無法顯示,但可以用圖片字代替。③圖片字簡易製作法。在 Word 中打出其部件可供截用的字,或顯示屏上的任何內容,按鍵盤上的[Print Screen]鍵,粘貼到畫圖板上(開始→程序→附件),編輯成所需要的字或圖形,或者將這箇圖片字直接剪切粘貼到正文中,亦可剪切、粘貼到Photoshop中(新建文件,編輯→粘貼),以GIF或JPEG格式存儲,然後在Word中插入這箇圖片字,縮小到與周圍文字大小相當,或右鍵點擊圖片,用“設置圖片格式→大小”進行微調,再調整上下位置:格式→字體→字符間距→位置→降低。凡直接可以由部首或幾箇字合成的文字,可以用字符縮放、改變行距(設爲固定值)、調整字符大小及間距的方法,製作成所需要的文字,有些左右結構的字甚至不製作成圖片字亦行。二、給漢字標注拼音 Microsoft Office XP或2003 的Word就有這箇功能。選定要注音的文字,用:格式→中文版式→拼音指南,Word就會在所選文字的上方自動標注拼音。如果出現的是注音符號而不是拼音符號,先選定這些文字,檢查:工具→語言→設置語言,確定是“中文(中國)”而不是“中文(臺灣)”。但Word能夠自動標注拼音的漢字大約兩萬箇,此外漢字的拼音,就只能在所選文字的“格式→中文版式→拼音指南→拼音文字”處用鍵盤錄入了;拼音若有錯誤,亦可以在此處手工更正。可以把“拼音文字”處的拼音,用[Ctrl+C]組合鍵複製,再用[Ctrl+V]組合鍵粘貼到Word中。反之亦可以用這種方法把Word中的拼音複製到“拼音文字”處。可惜Word一次最多只能標注30箇漢字。若要給整篇文檔標注拼音,就只能用“拼音大師”、“中華拼讀王(輕鬆漢字通)”之類的軟件了。中文輸入法的狀態欄一般都有一箇鍵盤符號,用右鍵點擊,選擇“拼音”,就可以錄入那些帶有聲調的字母;點左鍵取消或開啟。三、WPS文檔與Word文檔之間的轉換只要用WPS Office 2002或以上版本,就能徹底解決這箇問題。在程序安裝過程中,注意在“文件關聯設置”處勾上“Microsoft Word文檔”就能實現。安裝完成後,所有的Word文檔都會用WPS來打開。若要改回,用右鍵點擊一箇Word文檔,選擇“打開方式→選擇程序→Word”,再在“始終使用選擇的程序打開這種文件”前打勾就行了。WPS文檔可另存爲Word文檔,亦可用WPS打開Word文檔,再另存爲WPS文檔。當然可以用“RTF格式”文檔作爲中介,但是有些信息會丟失(用另存爲、用復制粘貼,結果不完全一樣)。亦可以另存爲網頁文件,但要還轉爲文本格式,仍有問題。上面所述如有不能實現者,當是操作系統或辦公軟件的緣故,建議升級至Windows XP、Microsoft Office 2003。 寧波廣播電視大學外語系蔣門馬 2005年10月8日定稿 漢字字體下載 一、各種漢字字體 字體名後面的數字,是指能顯示的GBK + CJK-Ext-A + CJK-Ext-B漢字的箇數。GB-2313字符集: 6763箇簡體漢字,715箇符號,總計7478箇字符GBK字符集: 21003箇簡繁體漢字,882箇符號,共計21885箇字符(包含BIG-5字符集:13060箇繁體漢字 + 808箇符號 =13868箇字符)GB18030字符集:GBK字符集 + CJK Ext-A = 27533箇漢字(CJK-A中有52字與GBK中的漢字重復,但內碼不同,在計總數時不算在內)Unicode字符集,CJK:20902箇漢字 (包含在GBK字符集中)Unicode字符集,CJK Ext-A: 6582箇漢字 (包含在GB18030字符集中)Unicode字符集,CJK Ext-B: 42711箇漢字 全部70244箇漢字下載 ( 27533 + 42711 = 70244 ) 1、大陸字體1、华文彩云、华文仿宋、华文琥珀、华文隶书、华文新魏 、华文行楷 67632、楷体_GB2312、仿宋_GB2312 67633、方正舒体 9690 方正姚体 9826 4、幼圆、黑体、隶书、宋体、新宋体 210035、华文楷体、华文宋体、华文细黑、华文中宋 21003 ——————(以上字體MS Office 2003 自帶) 6、FZNew XiuLi-Z11 方正新秀麗繁體(舊字形) 152907、北師大說文小篆、北師大說文重文 11100個 (PDF文本) 此兩款字體包含在“漢字構形資料庫”中。8、宋体-18030、新宋体-18030 21003+ 6582 = 27533http://www.microsoft.com/china/windows2000/downloads/18030.asp9、MS Song 書同文楷體 21003+ 6582 = 27533 (同FZKai-Z03方正楷體簡體版)http://www.fodian.net/tools/mssong.ttf10、FZKai-Z03 方正楷體 21003+ 6582 = 27533此外還造了近5000個在古籍中較常使用的漢字,共計32000編碼漢字,能顯示八卦六十四卦符號。下載簡體中文版的是大陸標準楷體的寫法,下載繁體中文版的是台灣教育部楷體的寫法,兩個字體都是相同的文件名、字體名,除非更改字體名稱,否則沒有辦法兩個同時安裝。http://trial.skqs.com/方正楷體 卽FZKai-Z03繁體版,字體略作修改,並改名。11、宋体-方正超大字符集 21003+6582+36862=64395 (MS Office XP2003 自帶)宋体-方正超大字符集 支持包“Surrogate更新”:http://www.microsoft.com/downloads/details.aspx?displaylang=zh-cn&FamilyID=1A8B048F-C76F-4E55-A0CF-E695CEF87C81 12、UniSongGBK1.00 宋體-全漢字集(簡體中文版)71564 UniSongBig51.00 宋體-全漢字集(繁體中文版)71564 (采采卷耳制作) 2、臺灣字體 1、教育部標準楷書、教育部標準宋體 13063http://www.edu.tw/EDU_WEB/EDU_MGT/MANDR/EDU6300001/bbs/1-4-2/1-4-2.html?FILEID=52968&open2、DFKai-SB 標楷體 21003 http://220.135.202.206/Downloads/Fonts/kaiu.ttf———相關網頁:http://220.135.202.206/Downloads/Fonts/ 3、cwTeXMing臺灣明體13346(舊字形1)。字體有錯誤,慎重使用。http://www.ossacc.org/Download/misc/cwttf-1.0/view明體 卽cwTeXMing的修改版,修改和增加不少漢字,並補入易經符號。4、MingLiU(Win98)、PMingLiU(Win98) 臺灣細明體Win98版 17260 (舊字形2)先下載global IME Chinese Tradional,.解壓縮下載的文件包,會得到字體MingLiu。由於會跟XP系統中的MingLiu重名,可能不能安裝,所以需要用字體工具改字體名。改好名后再安裝。http://www.microsoft.com/windows/ie/downloads/recommended/ime/install.mspx5、MingLiU、PMingLiU臺灣細明體 20923 (舊字形3)(MS Office XP自帶)6、MingLiU、PMingLiU 臺灣細明體 20923 (舊字形4)(MS Office2003 自帶)7、Win2k XP的細明體.(半Unicode半康熙寫法)http://download.microsoft.com/download/win2000platform/SP/SP3/NT5/TW/W2Ksp3.exe http://220.135.202.206/Downloads/Fonts/mingliu.ttc 8、MingLiU (18030) 、PMingLiU (18030) 臺灣新細明體 20923 + 6582 = 27533 (新字形)上述幾種細明體,字形字數不一樣,但字體同名,無法同時安裝。須更改字體名後纔行。9、MingLiU-ExtB、PMingLiU-ExtB 臺灣細明體超集 0 + 0 + 42711 MingLiU-ExtB.part1,MingLiU-ExtB.part2 3、香港字體1、AR PL Mingti2L Big5 明體 13070http://www.filesearching.com/cgi-bin/s?q=bsmi00lp.ttf.gz&t=f&d=&x=0&y=0&l=en2、AR PL KaitiM Big5 楷體 13070http://www.filesearching.com/cgi-bin/s?q=bkai00mp.ttf.gz&t=f&d=&x=0&y=0&l=en3、AR PL ShanHeiSun Uni宋體 17489 + 116 + 5 4、CCCLKaiUt1 華通香港標準楷體 21003 + 567 = 21518 5、DFHKStdKai-B5 華康香港標準楷體 20923 + 6582 = 274536、DFPHKStdKai-B5 華康香港標準新楷體 20923 + 6582 = 274537、DFPHeiMedium-UN 華康中黑體 20923 + 6582 = 274538、DFPKaiShuW5-UN 華康楷書體 20923 + 6582 = 27453 (新字形)9、DFPMingLight-UN 華康細明體 20923 + 6582 = 2745310、DFSongStd 華康標準宋體 21003 + 6582 + 1640 = 29173 http://www.cantonese.org.cn/anl/oncc/data/DFSongStd/11、香港增補字符集Hong Kong Supplementary Character Set-2001 (HKSCS-2001)Ming(for ISO10646)ExtB 香港明體超集http://debian.linux.org.tw/pub/3Anoppix/people/arne/http://www.microsoft.com/hk/hkscs/chinese/default.aspxMing(for ISO10646) http://www.info.gov.hk/digital21/unicode/hkscs/reference_iso10646.html 4、韓國字體1、Batang、BatangChe 韓國明朝體 74812、Gungsuh、GungsuhChe 韓國窮鼠體74813、Dotum、DotumChe 韓國黑體 74814、Gulim、GulimChe 韓國標準圓體 74815、New Gulim 韓國新圓體 21003 + 6582 = 27533(新字形)——————(以上字體:MS Office 2003 自帶)6、New Batang 包含更多的漢字以及old hangul 下載地址:http://kh2.koreanhistory.or.kr/file/download/hanjuk2_1.exe 5、日本字體1、MS Gothic、MS Pgothic、MS UI Gothic 日本黑體 122182、MS Mincho、MS Pmincho 日本明朝體 12218 ——————(以上字體MS Office 2003 自帶)3、QuiMi-mincho日本癸羊明朝體 6696 (舊字形)http://www.asahi-net.or.jp/~sd5a-ucd/freefonts/QuiMi-mincho/QuiMi-2004-0509.tgz 6、其他漢字字體1、Arial Unicode MS 黑體 20925 (MS Office 2003 自帶)2、Bitstream Cyberbit 20936http://www.filesearching.com/cgi-bin/s?q=cyberbit.zip&t=f&d=&l=en&x=0&y=03、CERG Chinese Font 21003+ 6582 = 27533http://cerg1.ugc.edu.hk/cergprod/static/download_font.jsp相關網頁:漢字字體下載頁面:繁體字體:http://www.travelphrases.info/gallery/Fonts_Chinese_Traditional.html 簡體字體:http://www.travelphrases.info/gallery/Fonts_Chinese_Simplified.html 7、Windows Vista 操作系統字體1、Vista字體四種.part1 Vista字體四種.part2 Vista字體四種.part3 (GB-18030,宋體、楷體、仿宋體、黑體) 2、SimSun-ExtB 宋體ExtB SimsunB(CCJE)setup.EXE (宋体-ExtB,采采卷耳修正版)3、臺灣及香港的細明體(GB-18030):mingliu.part1 ,mingliu.part24、臺灣及香港的細明體 Ext-B:mingliub.part1 ,mingliub.part2 二、輸入法1、微軟拼音輸入法2003 (可錄入簡繁體GBK漢字21003箇) MS Office 2003自帶http://www.microsoft.com/downloads/details.aspx?FamilyID=3c381308-e169-41f3-812e-aa8774162795&displaylang=zh-cn2、王碼五筆18030 (可錄入GB18030漢字27533箇)(內含王碼拼音2002,可錄入GBK漢字21003箇) 3、海峰五笔輸入法9.0版 (可錄入70244箇漢字)http://okuc.net/software/SunWb.exe字體文件:UniFonts。內含:Sun-ExtA、SimSun-ExtB兩種宋體。http://okuc.net/software/UniFonts.exe4、菩提五笔Unicode单字版 (可錄入70244箇漢字)http://www2.fodian.net/tools/index.html http://www2.fodian.net/tools/putiwb60.rar5、新概念五筆輸入法 (可錄入70244箇漢字)http://www.shunsoftware.com/download.htm6、微軟新倉頡輸入法http://www.microsoft.com/downloads/details.aspx?FamilyID=37195136-d2b5-4777-97fc-bda5f8aebea2&displaylang=zh-tw7、微軟新注音輸入法 (Microsoft New Phonetic IME)http://www.microsoft.com/downloads/details.aspx?familyid=56DDD600-61B1-492D-82C5-F553BD102B30&displaylang=zh-tw8、微軟輸入法整合器 (Microsoft IMEPad) http://www.microsoft.com/downloads/details.aspx?familyid=BB7FC0EB-E1BF-4585-A77D-C1EF4083C2D0&displaylang=zh-tw9、倉頡輸入法國際版http://www.chinesecj.com/newsoftware/index3.php?Type=1 三、相關網站1、香港中文大學網站 http://www.cse.cuhk.edu.hk/~irg/irg/CJK/CJK.htm2、馬來西亞倉頡之友網站 http://www.chinesecj.com/code/3、陳清鈺網站 http://sbsm.nease.net/4、漢字構形資料庫:2005年8月15日開放漢字構形資料庫2.3版,內含楷書字形60,082個、小篆11,100個、楚系簡帛文字2,627個,金文3,459個、甲骨文177個、異體字12768組。注冊后下載。要先设定 [控制面板] 的 [语言选项] 为 “中國(台灣)”才能安裝。亦可以解壓後使用其中的字體文件。 http://www.sinica.edu.tw/~cdp/http://ckip.iis.sinica.edu.tw/CKIP/tool/http://ckip.iis.sinica.edu.tw/CKIP/tool/hanzicd200508.zip5、台灣微軟的網站 下載區 http://www.microsoft.com/taiwan/download/CHTdownload.htm6、日本今昔文字鏡 含十萬漢字,甲骨文、金文、西夏文、梵文、越南喃字。(日本细明朝风,非Unicode)http://www.mojikyo.org/html/download/ttf/dlttf.html文字鏡专用字符映射表。下載所有的.exe文件,解壓縮,得到字體文件,把字體安裝后,再安裝字符影射表http://www.mojikyo.gr.jp/mojikyo/CMAP/MOCM400.EXE7、文泉驛網絡版《康熙字典》http://wqy.sourceforge.net/cgi-bin/index.cgi?KangXi8、《說文解字》全文檢索版 含篆字 http://www.chinese99.com/xiaozhuan/shuowen/9、支持全部Unicode的字符映射表下载页: www.babelstone.co.uk/Software/BabelMap.html 四、參考過的網頁 1、如何處理無法錄入電腦的漢字http://www.pkucn.com/viewthread.php?tid=140931&extra=page%3D12、一些漢字標準的整理http://www.pkucn.com/viewthread.php?tid=141936&extra=page%3D1http://www.pkucn.com/viewthread.php?tid=141869&extra=page%3D13、windows vista中的字體與輸入法http://www.pkucn.com/viewthread.php?tid=150732&extra=page%3D24、一些漢字、字體/字型、内碼、輸入法資料的整理http://www.pkucn.com/viewthread.php?tid=144689&extra=page%3D15、新細明體更新套件出爐啦!!!http://www.pkucn.com/viewthread.php?tid=142232&extra=page%3D16、各種文字的Unicode字體下載http://www.travelphrases.info/fonts.html7、日本舊字體(康熙字典體)癸羊明朝的下載與安裝http://www.pkucn.com/viewthread.php?tid=141868&extra=page%3D18、臺灣出的康熙細明體 下載http://www.pkucn.com/viewthread.php?tid=142434&extra=page%3D19、方正楷體有兩個版本!http://www.pkucn.com/viewthread.php?tid=142166&extra=page%3D210、尋找,舊字形字庫http://www.pkucn.com/viewthread.php?tid=109502&extra=page%3D211、大家有沒有用过"文字构形资料庫"?http://www.pkucn.com/viewthread.php?tid=130425&extra=page%3D212、[下载]多种免费字体forWinhttp://www.pkucn.com/viewthread.php?tid=136482&extra=page%3D413、extc,那個CNS的全漢字字庫http://www.pkucn.com/viewthread.php?tid=141974&extra=page%3D214、Unicode的[方正新秀麗](Big5) 感謝ExtC提供http://www.pkucn.com/viewthread.php?tid=150776&extra=page%3D215、《今昔文字鏡》與ExtChttp://www.pkucn.com/viewthread.php?tid=149931&extra=page%3D216、BabelPad & BabelMap:重建巴比通天塔 全球文字输入通http://www.pkucn.com/viewthread.php?tid=149383&extra=page%3D417、BabelMap 1.11 較完整簡體漢化http://www.pkucn.com/viewthread.php?tid=150687&extra=page%3D218、win98、winXP細明體可在微軟網站上下載http://www.pkucn.com/viewthread.php?tid=145515&extra=page%3D619、香港字体http://www.pkucn.com/viewthread.php?tid=144284&extra=page%3D520、[下載]宋體增補完成!http://www.pkucn.com/viewthread.php?tid=149094&extra=page%3D321、[下载]宋体-全汉字集1.00正式版(简体)完成! http://www.pkucn.com/viewthread.php?tid=160547&extra=page%3D1 五、字體安裝及改名1. 開始→設置→控制面板→字體→文件→安裝新字體,在文件夾中找到下載的字體文件,勾上“複製到Fonts文件夾”→確定。2. C:WINDOWSFonts→文件→安裝新字體,在文件夾中找到下載的字體文件,勾上“複製到Fonts文件夾”→確定。3、直接把要安裝的字體複制到:Fonts文件夾。3、用 Font Creator 5.0(破解版) 可以修改字體名稱。在 tools--autonaming 處修改。若要用漢字名稱,要把漢字以Unicode内码表示。表示方法:XXXXXXXXX (X為0~F編碼)。如“锧”就要寫成“9527”。4、在Word中錄入漢字,然後按〔Alt+X〕組合鍵,即可呈現該字的Unicode碼。要不然,就得查看BabelMap了。 若發現網頁有任何問題,若有想提供其他的圖書下載,或有其他的問題,請聯系:nirvanajmm104722@163.com 或 nirvana@nbtvu.net.cn 2005年8月19日 宁波广播电视大学外语系 蒋门马 原始链接:http://wyx.nbtvu.net.cn/jmm/index3.htm |
|