文字的編碼

作者:陳雲飛&許文達&夏進

文字的編碼

如第一節所述,電腦是由許多電子元件所組合而成的,而在電子元件中就只有「關」(0)和「開」(1)兩種狀態,因此電腦會將一連串的0或1排列組合成代表不同意義的指令,藉以驅動電腦各元件的動作。

對人類而言的文字、符號等,在電腦中也必須轉譯編碼成為數字,才能讓電腦中的電子元件能夠加以辨識。英文、數字及特殊符號常用的資料表示法有ASCII碼、EBCDIC碼、萬國碼……等。ASCII碼是大多數電腦所採用的,而EBCDIC碼則是IBM、UNIVAC……等某些大型電腦所採用的。另外中文字則大多採用BIG-5碼,但是也有一些是採用倚天碼、電信碼、IBM5550碼等。以下簡要說明各種編碼方式。

(一)美國標準資訊交換碼(ASCII碼)

是目前最為廣泛使用的編碼系統。這套編碼系統以7個位元來表示一個字元符號,能定義出128個不同的字元符號,亦即鍵盤上的大、小寫英文字母、阿拉伯數字、標點符號。由於8個位元可以表示出28=256種資料,因此又將ASCII 碼擴充,多了128個擴充符號字元可用來繪製表格的格線,或印出特殊的字母、符號等。其後,為能表示更多的字元符號,產生了8位元的ASCII碼,稱之為擴充ASCII碼(Extended ASCII Code)。

(二)延伸式二進位交換碼(EBCDIC碼)

延伸式二進位交換碼(Extended Binar y Coded Decimal Interchange Code,簡稱EBCDIC),是由IBM公司所創立的,由8個位元所組成的,因此所能表示的文、數字符號比ASCII碼要多,EBCDIC碼多使用於大型電腦主機上。EBCDIC碼中的每組8位元所代表的字元可分為區域位元(Zone bits)與數字位元(Digit bits)兩部份,如下圖所示。區域位元主要是表示此字元是屬於字母、無正負號的數字、正負符號及一些特殊符號,而數字位元則用來表示阿拉伯數字。

AddThis Sharing

百科問與答

暫無討論