ASCII, Extended dan Unicode
1. ASCII
Kode Standar Amerika untuk Pertukaran Informasi atau ASCII (American Standard Code for Information Interchange) merupakan suatu standar internasional dalam kode huruf dan simbol seperti Hex dan Unicode tetapi ASCII lebih bersifat universal, contohnya 124 adalah untuk karakter "|". Ia selalu digunakan oleh komputer dan alat komunikasi lain untuk menunjukkan teks. Kode ASCII sebenarnya memiliki komposisi bilangan biner sebanyak 8 bit. Dimulai dari 00000000 hingga 11111111. Total kombinasi yang dihasilkan sebanyak 256, dimulai dari kode 0 hingga 255 dalam sistem bilangan
Character Name | Char | Code | Decimal | Binary | Hex |
Null | NUL | Ctrl @ | 0 | 00000000 | 00 |
Start of Heading | SOH | Ctrl A | 1 | 00000001 | 01 |
Start of Text | STX | Ctrl B | 2 | 00000010 | 02 |
End of Text | ETX | Ctrl C | 3 | 00000011 | 03 |
End of Transmit | EOT | Ctrl D | 4 | 00000100 | 04 |
Enquiry | ENQ | Ctrl E | 5 | 00000101 | 05 |
Acknowledge | ACK | Ctrl F | 6 | 00000110 | 06 |
Bell | BEL | Ctrl G | 7 | 00000111 | 07 |
Back Space | BS | Ctrl H | 8 | 00001000 | 08 |
Horizontal Tab | TAB | Ctrl I | 9 | 00001001 | 09 |
Line Feed | LF | Ctrl J | 10 | 00001010 | 0A |
Vertical Tab | VT | Ctrl K | 11 | 00001011 | 0B |
Form Feed | FF | Ctrl L | 12 | 00001100 | 0C |
Carriage Return | CR | Ctrl M | 13 | 00001101 | 0D |
Shift Out | SO | Ctrl N | 14 | 00001110 | 0E |
Shift In | SI | Ctrl O | 15 | 00001111 | 0F |
Data Line Escape | DLE | Ctrl P | 16 | 00010000 | 10 |
Device Control 1 | DC1 | Ctrl Q | 17 | 00010001 | 11 |
Device Control 2 | DC2 | Ctrl R | 18 | 00010010 | 12 |
Device Control 3 | DC3 | Ctrl S | 19 | 00010011 | 13 |
Device Control 4 | DC4 | Ctrl T | 20 | 00010100 | 14 |
Negative Acknowledge | NAK | Ctrl U | 21 | 00010101 | 15 |
Synchronous Idle | SYN | Ctrl V | 22 | 00010110 | 16 |
End of Transmit Block | ETB | Ctrl W | 23 | 00010111 | 17 |
Cancel | CAN | Ctrl X | 24 | 00011000 | 18 |
End of Medium | EM | Ctrl Y | 25 | 00011001 | 19 |
Substitute | SUB | Ctrl Z | 26 | 00011010 | 1A |
Escape | ESC | Ctrl [ | 27 | 00011011 | 1B |
File Separator | FS | Ctrl \ | 28 | 00011100 | 1C |
Group Separator | GS | Ctrl ] | 29 | 00011101 | 1D |
Record Separator | RS | Ctrl ^ | 30 | 00011110 | 1E |
Unit Separator | US | Ctrl _ | 31 | 00011111 | 1F |
Space | | | 32 | 00100000 | 20 |
Exclamation Point | ! | Shift 1 | 33 | 00100001 | 21 |
Double Quote | " | Shift ‘ | 34 | 00100010 | 22 |
Pound/Number Sign | # | Shift 3 | 35 | 00100011 | 23 |
Dollar Sign | $ | Shift 4 | 36 | 00100100 | 24 |
Percent Sign | % | Shift 5 | 37 | 00100101 | 25 |
Ampersand | & | Shift 7 | 38 | 00100110 | 26 |
Single Quote | ‘ | ‘ | 39 | 00100111 | 27 |
Left Parenthesis | ( | Shift 9 | 40 | 00101000 | 28 |
Right Parenthesis | ) | Shift 0 | 41 | 00101001 | 29 |
Asterisk | * | Shift 8 | 42 | 00101010 | 2A |
Plus Sign | + | Shift = | 43 | 00101011 | 2B |
Comma | , | , | 44 | 00101100 | 2C |
Hyphen / Minus Sign | - | - | 45 | 00101101 | 2D |
Period | . | . | 46 | 00101110 | 2E |
Forward Slash | / | / | 47 | 00101111 | 2F |
Zero Digit | 0 | 0 | 48 | 00110000 | 30 |
One Digit | 1 | 1 | 49 | 00110001 | 31 |
Two Digit | 2 | 2 | 50 | 00110010 | 32 |
Three Digit | 3 | 3 | 51 | 00110011 | 33 |
Four Digit | 4 | 4 | 52 | 00110100 | 34 |
Five Digit | 5 | 5 | 53 | 00110101 | 35 |
Six Digit | 6 | 6 | 54 | 00110110 | 36 |
Seven Digit | 7 | 7 | 55 | 00110111 | 37 |
Eight Digit | 8 | 8 | 56 | 00111000 | 38 |
Nine Digit | 9 | 9 | 57 | 00111001 | 39 |
Colon | : | Shift ; | 58 | 00111010 | 3A |
Semicolon | ; | ; | 59 | 00111011 | 3B |
Less-Than Sign | < | Shift , | 60 | 00111100 | 3C |
Equals Sign | = | = | 61 | 00111101 | 3D |
Greater-Than Sign | > | Shift . | 62 | 00111110 | 3E |
Question Mark | ? | Shift / | 63 | 00111111 | 3F |
At Sign | @ | Shift 2 | 64 | 01000000 | 40 |
Capital A | A | Shift A | 65 | 01000001 | 41 |
Capital B | B | Shift B | 66 | 01000010 | 42 |
Capital C | C | Shift C | 67 | 01000011 | 43 |
Capital D | D | Shift D | 68 | 01000100 | 44 |
Capital E | E | Shift E | 69 | 01000101 | 45 |
Capital F | F | Shift F | 70 | 01000110 | 46 |
Capital G | G | Shift G | 71 | 01000111 | 47 |
Capital H | H | Shift H | 72 | 01001000 | 48 |
Capital I | I | Shift I | 73 | 01001001 | 49 |
Capital J | J | Shift J | 74 | 01001010 | 4A |
Capital K | K | Shift K | 75 | 01001011 | 4B |
Capital L | L | Shift L | 76 | 01001100 | 4C |
Capital M | M | Shift M | 77 | 01001101 | 4D |
Capital N | N | Shift N | 78 | 01001110 | 4E |
Capital O | O | Shift O | 79 | 01001111 | 4F |
Capital P | P | Shift P | 80 | 01010000 | 50 |
Capital Q | Q | Shift Q | 81 | 01010001 | 51 |
Capital R | R | Shift R | 82 | 01010010 | 52 |
Capital S | S | Shift S | 83 | 01010011 | 53 |
Capital T | T | Shift T | 84 | 01010100 | 54 |
Capital U | U | Shift U | 85 | 01010101 | 55 |
Capital V | V | Shift V | 86 | 01010110 | 56 |
Capital W | W | Shift W | 87 | 01010111 | 57 |
Capital X | X | Shift X | 88 | 01011000 | 58 |
Capital Y | Y | Shift Y | 89 | 01011001 | 59 |
Capital Z | Z | Shift Z | 90 | 01011010 | 5A |
Left Bracket | [ | [ | 91 | 01011011 | 5B |
Backward Slash | \ | \ | 92 | 01011100 | 5C |
Right Bracket | ] | ] | 93 | 01011101 | 5D |
Caret | ^ | Shift 6 | 94 | 01011110 | 5E |
Underscore | _ | Shift - | 95 | 01011111 | 5F |
Back Quote | ` | ` | 96 | 01100000 | 60 |
Lower-case A | a | A | 97 | 01100001 | 61 |
Lower-case B | b | B | 98 | 01100010 | 62 |
Lower-case C | c | C | 99 | 01100011 | 63 |
Lower-case D | d | D | 100 | 01100100 | 64 |
Lower-case E | e | E | 101 | 01100101 | 65 |
Lower-case F | f | F | 102 | 01100110 | 66 |
Lower-case G | g | G | 103 | 01100111 | 67 |
Lower-case H | h | H | 104 | 01101000 | 68 |
Lower-case I | I | I | 105 | 01101001 | 69 |
Lower-case J | j | J | 106 | 01101010 | 6A |
Lower-case K | k | K | 107 | 01101011 | 6B |
Lower-case L | l | L | 108 | 01101100 | 6C |
Lower-case M | m | M | 109 | 01101101 | 6D |
Lower-case N | n | N | 110 | 01101110 | 6E |
Lower-case O | o | O | 111 | 01101111 | 6F |
Lower-case P | p | P | 112 | 01110000 | 70 |
Lower-case Q | q | Q | 113 | 01110001 | 71 |
Lower-case R | r | R | 114 | 01110010 | 72 |
Lower-case S | s | S | 115 | 01110011 | 73 |
Lower-case T | t | T | 116 | 01110100 | 74 |
Lower-case U | u | U | 117 | 01110101 | 75 |
Lower-case V | v | V | 118 | 01110110 | 76 |
Lower-case W | w | W | 119 | 01110111 | 77 |
Lower-case X | x | X | 120 | 01111000 | 78 |
Lower-case Y | y | Y | 121 | 01111001 | 79 |
Lower-case Z | z | Z | 122 | 01111010 | 7A |
Left Brace | { | Shift [ | 123 | 01111011 | 7B |
Vertical Bar | | | Shift \ | 124 | 01111100 | 7C |
Right Brace | } | Shift ] | 125 | 01111101 | 7D |
Tilde | ~ | Shift ` | 126 | 01111110 | 7E |
Delta | | | 127 | 01111111 | 7F |
2. Extended
Extended ASCII character Set adalah karakter yang terdiri dari 128 buah karakter, yang dimulai dari 128 hingga 255.
Dibawah ini adalah table Extended character set:
3. UNICODE
Unicode dikembangkan pada awal tahun 1990. Unicode memakai 2 byte (16bit) untuk setiap karakter, tidak hanya sekedar 1 byte (8 bit). Selain mampu membaca 256 karakter ASCII, Unicode juga bisa menerima 65.536 kombinasi karakter.
Set karakter Unicode mampu menampung lebih dari satu juta karakter (220 = 1.048.576). Akan tetapi, saat ini hanya 65.535 karakter yang pertama yang mampu direpresentasikan pada komputer (65.535 karakter pertama dari Unicode sering disebut dengan istilah UCS- 2 atau Universal Character Set-2). Karakter 0 sampai dengan 65.535 menampung karakter-karakter dari alfabet-alfabet yang belum punah (Latin, Kanji, Devanagari, dan lain sebagainya) sedangkan karakter 65.536 sampai dengan 1.048.575 menampung karakter-karakter dari alfabet-alfabet yang sudah punah (misalnya hieroglyph dan beberapa karakter Cina yang sangat jarang digunakan). Terdapat lebih dari 256 karakter di dunia sepert kode cyrillic, hebrew, arabic, chinese, japanese, korean dan thailand, dan karakter baru kadang-kadang ditemukan. Dengan menggunakan kode 16-bit (216 = 65.535) diharapkan karakter-karakter tersebut dapat terwakili.
Set karakter Unicode dialokasikan untuk lebih dari satu alfabet. Bahkan, Unicode Consortium menargetkan untuk mengkodekan seluruh alfabet yang ada di dunia. Set karakter Unicode ini diharapkan dapat menjadi standar set karakter pada semua komputer di masa depan. Karena Unicode mampu merepresentasikan semua alfabet yang ada di dunia ini, maka secara teori seluruh set karakter lainnya tidak diperlukan lagi. Unicode mampu mengkodekan berbagai karakteristik alfabet. Mulai dari alfabet Latin yang sederhana, alfabet Arab yang ditulis sambung-menyambung (cursive) dari kanan ke kiri, alfabet Cina yang ditulis dari atas ke bawah, dan alfabet India yang memiliki huruf vokal yang letaknya di atas-bawah-depan-belakang dari konsonan.
Dec | Hex | Unicode | Char | Name |
0 | 0 | U+0000 | NUL | Null |
1 | 1 | U+0001 | STX | Start of Header |
2 | 2 | U+0002 | SOT | Start of Text |
3 | 3 | U+0003 | ETX | End of Text |
4 | 4 | U+0004 | EOT | End of Transmission |
5 | 5 | U+0005 | ENQ | Enquiry |
6 | 6 | U+0006 | ACK | Acknowledge |
7 | 7 | U+0007 | BEL | Bell |
8 | 8 | U+0008 | BS | BackSpace |
9 | 9 | U+0009 | HT | Horizontal Tabulation |
10 | 0A | U+000A | LF | Line Feed |
11 | 0B | U+000B | VT | Vertical Tabulation |
12 | 0C | U+000C | FF | Form Feed |
13 | 0D | U+000D | CR | Carriage Return |
14 | 0E | U+000E | SO | Shift Out |
15 | 0F | U+000F | SI | Shift In |
16 | 10 | U+0010 | DLE | Data Link Escape |
17 | 11 | U+0011 | DC1 | Device Control 1 (XON) |
18 | 12 | U+0012 | DC2 | Device Control 2 |
19 | 13 | U+0013 | DC3 | Device Control 3 (XOFF) |
20 | 14 | U+0014 | DC4 | Device Control 4 |
21 | 15 | U+0015 | NAK | Negative acknowledge |
22 | 16 | U+0016 | SYN | Synchronous Idle |
23 | 17 | U+0017 | ETB | End of Transmission Block |
24 | 18 | U+0018 | CAN | Cancel |
25 | 19 | U+0019 | EM | End of Medium |
26 | 1A | U+001A | SUB | Substitute |
27 | 1B | U+001B | ESC | Escape |
28 | 1C | U+001C | FS | File Separator |
29 | 1D | U+001D | GS | Group Separator |
30 | 1E | U+001E | RS | Record Separator |
31 | 1F | U+001F | US | Unit Separator |
32 | 20 | U+0020 | [Space] | Space |
33 | 21 | U+0021 | ! | Exclamation mark |
34 | 22 | U+0022 | " | Quotes |
35 | 23 | U+0023 | # | Hash |
36 | 24 | U+0024 | $ | Dollar |
37 | 25 | U+0025 | % | Percent |
38 | 26 | U+0026 | & | Ampersand |
39 | 27 | U+0027 | ' | Apostrophe |
40 | 28 | U+0028 | ( | Open bracket |
41 | 29 | U+0029 | ) | Close bracket |
42 | 2A | U+002A | * | Asterisk |
43 | 2B | U+002B | + | Plus |
44 | 2C | U+002C | , | Comma |
45 | 2D | U+002D | - | Dash |
46 | 2E | U+002E | . | Full stop |
47 | 2F | U+002F | / | Slash |
48 | 30 | U+0030 | 0 | Zero |
49 | 31 | U+0031 | 1 | One |
50 | 32 | U+0032 | 2 | Two |
51 | 33 | U+0033 | 3 | Three |
52 | 34 | U+0034 | 4 | Four |
53 | 35 | U+0035 | 5 | Five |
54 | 36 | U+0036 | 6 | Six |
55 | 37 | U+0037 | 7 | Seven |
56 | 38 | U+0038 | 8 | Eight |
57 | 39 | U+0039 | 9 | Nine |
58 | 3A | U+003A | : | Colon |
59 | 3B | U+003B | ; | Semi-colon |
60 | 3C | U+003C | < | Less than |
61 | 3D | U+003D | = | Equals |
62 | 3E | U+003E | > | Greater then |
63 | 3F | U+003F | ? | Queston mark |
64 | 40 | U+0040 | @ | At |
65 | 41 | U+0041 | A | Uppercase A |
66 | 42 | U+0042 | B | Uppercase B |
67 | 43 | U+0043 | C | Uppercase C |
68 | 44 | U+0044 | D | Uppercase D |
69 | 45 | U+0045 | E | Uppercase E |
70 | 46 | U+0046 | F | Uppercase F |
71 | 47 | U+0047 | G | Uppercase G |
72 | 48 | U+0048 | H | Uppercase H |
73 | 49 | U+0049 | I | Uppercase I |
74 | 4A | U+004A | J | Uppercase J |
75 | 4B | U+004B | K | Uppercase K |
76 | 4C | U+004C | L | Uppercase L |
77 | 4D | U+004D | M | Uppercase M |
78 | 4E | U+004E | N | Uppercase N |
79 | 4F | U+004F | O | Uppercase O |
80 | 50 | U+0050 | P | Uppercase P |
81 | 51 | U+0051 | Q | Uppercase Q |
82 | 52 | U+0052 | R | Uppercase R |
83 | 53 | U+0053 | S | Uppercase S |
84 | 54 | U+0054 | T | Uppercase T |
85 | 55 | U+0055 | U | Uppercase U |
86 | 56 | U+0056 | V | Uppercase V |
87 | 57 | U+0057 | W | Uppercase W |
88 | 58 | U+0058 | X | Uppercase X |
89 | 59 | U+0059 | Y | Uppercase Y |
90 | 5A | U+005A | Z | Uppercase Z |
91 | 5B | U+005B | [ | Open square braket |
92 | 5C | U+005C | \ | Backslash |
93 | 5D | U+005D | ] | Close square bracket |
94 | 5E | U+005E | ^ | Caret/hat |
95 | 5F | U+005F | _ | Underscore |
96 | 60 | U+0060 | ` | Grave accent |
97 | 61 | U+0061 | a | Lowercase a |
98 | 62 | U+0062 | b | Lowercase b |
99 | 63 | U+0063 | c | Lowercase c |
100 | 64 | U+0064 | d | Lowercase d |
101 | 65 | U+0065 | e | Lowercase e |
102 | 66 | U+0066 | f | Lowercase f |
103 | 67 | U+0067 | g | Lowercase g |
104 | 68 | U+0068 | h | Lowercase h |
105 | 69 | U+0069 | i | Lowercase i |
106 | 6A | U+006A | j | Lowercase j |
107 | 6B | U+006B | k | Lowercase k |
108 | 6C | U+006C | L | Lowercase l |
109 | 6D | U+006D | m | Lowercase m |
110 | 6E | U+006E | n | Lowercase n |
111 | 6F | U+006F | o | Lowercase o |
112 | 70 | U+0070 | p | Lowercase p |
113 | 71 | U+0071 | q | Lowercase q |
114 | 72 | U+0072 | r | Lowercase r |
115 | 73 | U+0073 | s | Lowercase s |
116 | 74 | U+0074 | t | Lowercase t |
117 | 75 | U+0075 | u | Lowercase u |
118 | 76 | U+0076 | v | Lowercase v |
119 | 77 | U+0077 | w | Lowercase w |
120 | 78 | U+0078 | x | Lowercase x |
121 | 79 | U+0079 | Y | Lowercase y |
122 | 7A | U+007A | z | Lowercase z |
123 | 7B | U+007B | { | Open brace |
124 | 7C | U+007C | | | Pipe |
125 | 7D | U+007D | } | Close |
126 | 7E | U+007E | ~ | Tilde |
127 | 7F | U+007F | DEL | Delete |