ASCII ( akronym for American Standard Code for Information Interchange , bokstavelig talt "amerikansk standardkode for utveksling av informasjon") er en kode for tegnkoding . Den første utgaven av ASCII- standarden ble utgitt av American National Standards Institute (ANSI) i 1963 [1] , så koden gjennomgikk en større revisjon i 1967 [2] . Den siste oppdateringen dateres tilbake til 1986 [3] . På italiensk uttales det aschi / ˈaski / eller asci / ˈaʃʃi / [4] , mens den opprinnelige engelske uttalen er askey / ˈæski / .
Asteroid 3568 ASCII har fått navnet sitt fra denne tegnkodingen.
US-ASCII refererer til et 8-biters tegnkodingssystem, ofte brukt i datamaskiner, foreslått av IBM -ingeniøren Bob Bemer i 1961 , og deretter akseptert som en standard av ISO , med navnet ISO/IEC 646 .
Den opprinnelige spesifikasjonen basert på 7 - bits koder ble fulgt opp gjennom årene av mange forslag til 8-bits utvidelser, med sikte på å doble antall tegn som kan representeres. På IBM PC- er kalles en av disse utvidelsene, nå de facto standard , utvidet ASCII eller høy ASCII . I denne utvidede ASCII-en er de tilføyde tegnene for eksempel aksentvokaler, semigrafiske symboler og andre symboler av mindre vanlig bruk, også designet for å tilpasse seg spesifisitetene til de forskjellige språkene [5] . Utvidede ASCII-tegn er kodet i såkalte kodetall .
Etterfølgerstandarden til ASCII er UTF-8 , som har blitt den viktigste Unicode-kodingen for internett i henhold til W3C , som, selv om den ikke forhindrer andre kodinger (så lenge de er korrekt deklarert), anbefaler den og bruker den nesten systematisk i eksemplene [ 6] , og gir også instruksjoner for konvertering av dokumenter (som den ikke gir for alle kodinger) [7] . Denne Unicode-kodingen , som nå er universelt akseptert av hvert nytt program, tilbyr interessante funksjoner takket være det faktum at den bruker kontrollbiten til den gamle ASCII mer effektivt. Mens den forbereder ham for pensjonisttilværelsen, har UTF-8 på en eller annen måte gjort ASCII mye lengre ved å inkorporere den i en koding som er mer egnet til dagens behov. Faktisk er kommunikasjon på hundrevis av språk, og dessuten kan forskjellige språk eksistere side om side i samme dokument, eller i samme program: tenk på direktemeldingsprogramvare som kan inneholde kontakter fra forskjellige deler av verden hvis navn vises riktig.
UTF-8 skiller seg faktisk fra andre Unicode-kodinger fordi den bruker den gamle paritetsbiten til ASCII, ikke som en kontrollbit, men som en indikator: den analyserer hver byte, og hvis det er 0 i stedet for den gamle paritetsbiten, så byte vil bli lest som 7-bit ASCII og teoretisk kompatibel selv av utdaterte programmer; Imidlertid, hvis den nåværende byten begynner med 1, vil den bli sammenkoblet til neste byte (eller til de følgende, i virkeligheten er mekanismen litt mer kompleks). På denne måten klarer den å inkludere alle alfabetene til levende språk, noen døde og kan potensielt utvides til å representere enda andre (faktisk blir den ofte oppdatert).
Fordelen er at det er mulig å skrive en tekst på italiensk og bruke et litt høyere antall byte sammenlignet med en utvidet ASCII-koding (bare de aksenterte bokstavene vil oppta 2 byte); en tekst på kinesisk språk vil ha hvert tre-byte-tegn, med tall, bokstaver, tegnsetting og andre ASCII-tegn i enkeltbyte-teksten.
Følgende tabell er for amerikansk ASCII-kode, ANSI X3.4-1986 ( ISO 646 International Reference Version ). Desimalkodene 0 til 31 og 127 er tegn som ikke skrives ut (kontrolltegn ). 32 tilsvarer tegnet "mellomrom". Kodene 32 til 126 er utskrivbare tegn.
Spor | Oktal | Desimal | Heksadesimal | |||||
---|---|---|---|---|---|---|---|---|
000 0000 | 000 | 0 | 00 | NUL | ␀ | ^ @ | \ 0 | Null karakter |
000 0001 | 001 | 1 | 01 | SOH | ␁ | ^ A | ☺ | |
000 0010 | 002 | 2 | 02 | STX | ␂ | ^ B | ☻ | |
000 0011 | 003 | 3 | 03 | ETX | ␃ | ^ C | ♥ | |
000 0100 | 004 | 4 | 04 | EOT | ␄ | ^ D | ♦ | |
000 0101 | 005 | 5 | 05 | ENQ | ␅ | ^ E | ♣ | |
000 0110 | 006 | 6 | 06 | ACK | ␆ | ^ F | ♠ | |
000 0111 | 007 | 7 | 07 | HYGGELIG | ␇ | ^ G | \til | • |
000 1000 | 010 | 8 | 08 | BS | ␈ | ^ H | \b | ◘ |
000 1001 | 011 | 9 | 09 | ␉ | ^ jeg | \t | ○ | |
000 1010 | 012 | 10 | 0A | LF | ␊ | ^ J | \ n | ◙ |
000 1011 | 013 | 11 | 0B | VT | ␋ | ^ K | \ v | ♂ |
000 1100 | 014 | 12 | 0C | FF | ␌ | ^ L | \f | ♀ |
000 1101 | 015 | 1. 3 | 0D | CR | ␍ | ^ M | \ r | ♪ |
000 1110 | 016 | 14 | 0E | SÅ | ␎ | ^ N | ♫ | |
000 1111 | 017 | 15 | 0F | JA | ␏ | ^ O | ☼ | |
001 0000 | 020 | 16 | 10 | DLE | ␐ | ^ P | ► | |
001 0001 | 021 | 17 | 11 | DC1 | ␑ | ^ Q | ◄ | |
001 0010 | 022 | 18 | 12 | DC2 | ␒ | ^ R | ↕ | |
001 0011 | 023 | 19 | 1. 3 | DC3 | ␓ | ^ S | ‼ | |
001 0100 | 024 | 20 | 14 | DC4 | ␔ | ^ T | ¶ | |
001 0101 | 025 | 21 | 15 | NAK | ␕ | ^ U | § | |
001 0110 | 026 | 22 | 16 | SYN | ␖ | ^ V | ▬ | |
001 0111 | 027 | 23 | 17 | ETB | ␗ | ^ W | ↨ | |
001 1000 | 030 | 24 | 18 | KAN | ␘ | ^ X | ↑ | |
001 1001 | 031 | 25 | 19 | EM | ␙ | ^ Y | ↓ | |
001 1010 | 032 | 26 | 1A | UNDER | ␚ | ^ Z | → | |
001 1011 | 033 | 27 | 1B | ESC | ␛ | ^ [ | ← | |
001 1100 | 034 | 28 | 1C | FS | ␜ | ^ \ | ∟ | |
001 1101 | 035 | 29 | 1D | GS | ␝ | ^] | ↔ | |
001 1110 | 036 | 30 | 1E | RS | ␞ | ^^ | ▲ | |
001 1111 | 037 | 31 | 1F | OSS | ␟ | ^ _ | ▼ | |
111 1111 | 177 | 127 | 7F | AV | ␡ | ^? | Slett (slett key-bakspace) |
Spor | okt | des | Hex | Glyph |
---|---|---|---|---|
010 000 | 040 | 32 | 20 | Rom |
010 0001 | 041 | 33 | 21 | ! |
010 0010 | 042 | 34 | 22 | " |
010 0011 | 043 | 35 | 23 | # |
010 0100 | 044 | 36 | 24 | $ |
010 0101 | 045 | 37 | 25 | % |
010 0110 | 046 | 38 | 26 | & |
010 0111 | 047 | 39 | 27 | ' |
010 1000 | 050 | 40 | 28 | ( |
010 1001 | 051 | 41 | 29 | ) |
010 1010 | 052 | 42 | 2A | * |
010 1011 | 053 | 43 | 2B | + |
010 1100 | 054 | 44 | 2C | , |
010 1101 | 055 | 45 | 2D | - |
010 1110 | 056 | 46 | 2E | . |
010 1111 | 057 | 47 | 2F | / |
011 0000 | 060 | 48 | 30 | 0 |
011 0001 | 061 | 49 | 31 | 1 |
011 0010 | 062 | 50 | 32 | 2 |
011 0011 | 063 | 51 | 33 | 3 |
011 0100 | 064 | 52 | 34 | 4 |
011 0101 | 065 | 53 | 35 | 5 |
011 0110 | 066 | 54 | 36 | 6 |
011 0111 | 067 | 55 | 37 | 7 |
011 1000 | 070 | 56 | 38 | 8 |
011 1001 | 071 | 57 | 39 | 9 |
011 1010 | 072 | 58 | 3A | : |
011 1011 | 073 | 59 | 3B | ; |
011 1100 | 074 | 60 | 3C | < |
011 1101 | 075 | 61 | 3D | = |
011 1110 | 076 | 62 | 3E | > |
011 1111 | 077 | 63 | 3F | ? |
Spor | okt | des | Hex | Glyph |
---|---|---|---|---|
100 0000 | 100 | 64 | 40 | @ |
100 0001 | 101 | 65 | 41 | TIL |
100 0010 | 102 | 66 | 42 | B. |
100 0011 | 103 | 67 | 43 | C. |
100 0100 | 104 | 68 | 44 | D. |
100 0101 | 105 | 69 | 45 | Og |
100 0110 | 106 | 70 | 46 | F. |
100 0111 | 107 | 71 | 47 | G. |
100 1000 | 110 | 72 | 48 | H. |
100 1001 | 111 | 73 | 49 | DE |
100 1010 | 112 | 74 | 4A | J |
100 1011 | 113 | 75 | 4B | K. |
100 1100 | 114 | 76 | 4C | L |
100 1101 | 115 | 77 | 4D | M. |
100 1110 | 116 | 78 | 4E | Nei. |
100 1111 | 117 | 79 | 4F | ELLER |
101 0000 | 120 | 80 | 50 | P. |
101 0001 | 121 | 81 | 51 | Q |
101 0010 | 122 | 82 | 52 | R. |
101 0011 | 123 | 83 | 53 | S. |
101 0100 | 124 | 84 | 54 | T. |
101 0101 | 125 | 85 | 55 | U |
101 0110 | 126 | 86 | 56 | V. |
101 0111 | 127 | 87 | 57 | W |
101 1000 | 130 | 88 | 58 | X |
101 1001 | 131 | 89 | 59 | Y |
101 1010 | 132 | 90 | 5A | Z |
101 1011 | 133 | 91 | 5B | [ |
101 1100 | 134 | nittito | 5C | \ |
101 1101 | 135 | 93 | 5D | ] |
101 1110 | 136 | 94 | 5E | ^ |
101 1111 | 137 | 95 | 5F | _ |
Spor | okt | des | Hex | Glyph |
---|---|---|---|---|
110 0000 | 140 | 96 | 60 | ` |
110 0001 | 141 | 97 | 61 | til |
110 0010 | 142 | 98 | 62 | b |
110 0011 | 143 | 99 | 63 | c |
110 0100 | 144 | 100 | 64 | d |
110 0101 | 145 | 101 | 65 | Og |
110 0110 | 146 | 102 | 66 | f |
110 0111 | 147 | 103 | 67 | g |
110 1000 | 150 | 104 | 68 | h |
110 1001 | 151 | 105 | 69 | de |
110 1010 | 152 | 106 | 6A | j |
110 1011 | 153 | 107 | 6B | k |
110 1100 | 154 | 108 | 6C | L |
110 1101 | 155 | 109 | 6D | m |
110 1110 | 156 | 110 | 6E | n |
110 1111 | 157 | 111 | 6F | eller |
111 0000 | 160 | 112 | 70 | s |
111 0001 | 161 | 113 | 71 | q |
111 0010 | 162 | 114 | 72 | r |
111 0011 | 163 | 115 | 73 | s |
111 0100 | 164 | 116 | 74 | t |
111 0101 | 165 | 117 | 75 | u |
111 0110 | 166 | 118 | 76 | v |
111 0111 | 167 | 119 | 77 | w |
111 1000 | 170 | 120 | 78 | x |
111 1001 | 171 | 121 | 79 | y |
111 1010 | 172 | 122 | 7A | z |
111 1011 | 173 | 123 | 7B | { |
111 1100 | 174 | 124 | 7C | | |
111 1101 | 175 | 125 | 7D | } |
111 1110 | 176 | 126 | 7E | ~ |
Det er også en type kunst, kalt ASCII-kunst , som består i å lage bilder med tegnene i alfabetet som får en grov gråskala ved å bruke fyllingen av tegnet.