PočítačeProgramování

ASCII (americký standardní kód pro výměnu informací) - základní kódování textu pro latinskou abecedu

Podle Mezinárodní telekomunikační unie v roce 2016 tři a půl miliardy lidí využívalo internet s touto nebo takovou pravidelností. Většina z nich si ani neuvědomuje, že zprávy odeslané prostřednictvím počítačů nebo mobilních gadgetů, stejně jako texty, které se zobrazují na všech typech monitorů, jsou vlastně kombinacemi 0 a 1. Takové zobrazení informací se nazývá kódování. Poskytuje a velmi usnadňuje provádění jeho ukládání, zpracování a přenosu. V roce 1963 bylo vyvinuto americké kódování ASCII, které je předmětem tohoto článku.

Prezentace informací v počítači

Z pohledu libovolného elektronického počítače je text kolekcí jednotlivých symbolů. K jejich počtu patří nejen písmena, včetně velkých písmen, ale také interpunkční znaménka, čísla. Kromě toho se používají speciální symboly "=", "&", "(" a mezery.

Sada symbolů, které tvoří text, se nazývá abeceda a jejich počet je moc (označeno jako N). Pro jeho určení použijte výraz N = 2 ^ b, kde b je počet bitů nebo informační váha určitého symbolu.

Ukazuje se, že abeceda s kapacitou 256 znaků umožňuje reprezentovat všechny potřebné symboly.

Vzhledem k tomu, že 256 je osmá síla dvou, hmotnost každého symbolu je 8 bitů.

Jednotka 8 bitů se nazývá 1 bajt, takže je obvyklé říci, že binární kód libovolného znaku v textu uloženém v počítači zaujímá jeden bajt paměti.

Jak se provádí kódování

Veškeré texty se vkládají do paměti osobního počítače klávesami klávesnice, na kterých jsou napsána čísla, písmena, interpunkční znaménka a další symboly. V paměti jsou přenášeny v binárním kódu, tj. Každý znak je přizpůsoben obvyklému lidskému desítkovému kódu od 0 do 255, což odpovídá binárnímu kódu - od 00000000 do 11111111.

Byte-byte znakové kódování umožňuje procesoru provádět zpracování textu přístup každý znak zvlášť. Současně stačí 256 znaků pro zobrazení všech informací o znaku.

Kódování znaků ASCII

Tato zkratka v angličtině znamená americký standardní kód pro výměnu informací.

Již při úsvitu automatizace bylo zřejmé, že můžete přijít s celou řadou způsobů kódování informací. Avšak pro přenos informací z jednoho počítače do druhého bylo nutné vytvořit jeden standard. Takže v roce 1963 se ve Spojených státech objevila tabulka kódování ASCII. V něm je jakýkoli symbol počítačové abecedy přiřazen sériové číslo v binární reprezentaci. Zpočátku bylo kódování ASCII používáno pouze ve Spojených státech a poté se stalo mezinárodním standardem pro PC.

Obsah tabulky

Kódy ASCII jsou rozděleny do dvou částí. Mezinárodní standard je pouze první polovinou této tabulky. Obsahuje symboly s pořadovými čísly od 0 (zakódované jako 00000000) do 127 (kód 01111111).

Pořadové číslo

N

ASCII kódování textu

Symbol

0 - 31

0000 0000 - 0001 1111

Symboly s číslem N od 0 do 31 se nazývají správci. Jejich funkcí je "řídit" proces výstupu textu na monitor nebo tiskové zařízení, dává zvukový signál atd.

32 - 127

0010 0000 - 0111 1111

Znaky s číslem N od 32 do 127 (standardní část tabulky) - velká a malá písmena latinské abecedy, 10 číslic, interpunkční znaménka, stejně jako různé závorky, komerční a další symboly. Symbol 32 označuje mezeru.

128 až 255

1000 0000 - 1111 1111

Symboly s číslem N od 128 do 255 (alternativní část tabulky nebo kódové stránky) mohou mít různé varianty, z nichž každá má své vlastní číslo. Kódová stránka slouží k zadání národních abeced, které se liší od latiny. Zejména je pomocí ASCII kódován pro ruské znaky.

V kódovací tabulce se písmena velkých a malých písmen vzájemně sledují v abecedním pořadí a čísla jsou ve vzestupném pořadí hodnot. Tento princip je také zachován pro ruskou abecedu.

Ovládací prvky

Tabulka kódování ASCII byla původně vytvořena pro příjem a přenos informací přes zařízení, které nebylo používáno dlouho, jako teletyp. V souvislosti s tím bylo neptání zahrnuto do znakové sady, které se používalo jako příkazy pro ovládání tohoto zařízení. Podobné příkazy byly použity v takových předkomputerových zprávách jako Morseovský kód a tak dále.

Nejběžnější symbol teletypu je NUL (00, "nula"). Je stále používán ve většině programovacích jazyků, označující znak konce řádku.

Kde se používá kódování ASCII

Americký standardní kód je potřebný nejen pro psaní textových informací z klávesnice. Používá se také v grafické podobě. Obzvláště v programu ASCII Art Maker představují obrázky různých rozšíření řadu znakových znaků ASCII.

Podobné produkty mají dva typy: provádění funkcí grafických editorů konverzí obrázků na text a konverze "výkresů" do grafiky ASCII. Například známý smajlík je živým příkladem kódovacího symbolu.

ASCII lze také použít při vytváření dokumentu HTML. V takovém případě můžete zadat určitou sadu znaků a při zobrazení stránky se na obrazovce zobrazí symbol, který odpovídá tomuto kódu.

ASCII je také potřebná k vytvoření vícejazyčných stránek, protože znaky, které nejsou součástí konkrétní národní tabulky, jsou nahrazeny kódy ASCII.

Některé funkce

Pro kódování textových informací v kódování ASCII bylo původně použito 7 bitů (jedna byla prázdná), dnes však funguje jako 8bitová.

Písmena umístěná ve sloupcích v horní a spodní části se vzájemně liší pouze o jeden bit. To výrazně snižuje složitost ověřování.

Použití ASCII v sadě Microsoft Office

Je-li to nezbytné, lze tento typ kódování textových informací použít v textových editorech společnosti Microsoft, jako je například Poznámkový blok a Office Word. Při psaní však v tomto případě nebude možné používat některé funkce. Například nelze provádět tučné tónování, protože kódování ASCII zachovává pouze význam informací a ignoruje jeho obecný vzhled a tvar.

Standardizace

ISO přijala normy ISO 8859. Tato skupina definuje osmbitové kódování pro různé jazykové skupiny. Zejména ISO 8859-1 je rozšířená ASCII, která je tabulkou pro Spojené státy a západní Evropu. A ISO 8859-5 je tabulka používaná pro cyrilika, včetně ruštiny.

Z mnoha historických důvodů nebyl standard ISO 8859-5 používán příliš dlouho.

Pro ruský jazyk v současné době se kódování skutečně používá:

  • CP866 (kód Strana 866) nebo DOS, což je často nazýváno alternativním kódováním GOST. Aktivně se používal až do poloviny 90. let minulého století. V tuto chvíli se téměř nepoužívá.
  • KOI-8. Kódování bylo vyvinuto v letech 1970-80 a v současné době je standardem pro poštovní zprávy v RuNetu. To je široce používán v operačním systému Unix rodiny, včetně Linuxu. "Ruská" verze KOI-8 se nazývá KOI-8R. Navíc existují verze pro jiné cyriliky, například ukrajinské.
  • Kód Strana 1251 (CP 1251, Windows - 1251). Byl vyvinut společností Microsoft Corporation a poskytuje ruskou jazykovou podporu v prostředí Windows.

Hlavní výhodou prvního standardu CP866 byla zachování pseudografických znaků ve stejných pozicích jako v Extended ASCII. To umožnilo provozovat nezměněné textové programy, zahraniční produkci, například slavný Norton Commander. V současné době se CP866 používá pro programy vyvinuté v systému Windows, které pracují v režimu celé obrazovky nebo v textových oknech, včetně FAR Manager.

Počítačové texty napsané v kódování CP866 jsou v poslední době poměrně vzácné, ale používají se pro názvy ruských souborů ve společnosti Vindous.

"Unicode"

V současné době je toto kódování nejrozšířenější. Unicode kódy jsou rozděleny do oblastí. První (od U + 0000 do U + 007F) obsahuje znaky sady kódů ASCII. Poté sledujte oblasti značek různých národních scénářů, stejně jako interpunkční znaménka a technické symboly. Kromě toho je část kódů Unicode vyhrazena v případě, že je třeba v budoucnu zahrnout nové symboly.

Nyní víte, že v kódování ASCII je každá postava reprezentována jako kombinace 8 nula a jedna. Pro nespecialisty se tato informace může zdát zbytečná a nezajímavá, ale nechcete vědět, co se děje "v mozku" vašeho PC?

Similar articles

 

 

 

 

Trending Now

 

 

 

 

Newest

Copyright © 2018 cs.birmiss.com. Theme powered by WordPress.