Značka Meta Charset v jazyku HTML5

Nastavenie kódovania znakov v jazyku HTML5

Pred zavedením kódu HTML5 nastavte kódovanie znakov na dokument s elementrequiredyou, aby ste napísali trochu podrobný riadok zobrazený nižšie. Toto je prvok Meta Charset, ak ste na svojej webovej stránke používali HTML4:

Čo je dôležité všimnúť v tomto kóde sú uvozovky, ktoré vidíte okolo atribútu content : content = " text / html; charset = iso-8859-1 " . Rovnako ako všetky atribúty HTML tieto úvodzovky definujú hodnotu atribútu, čo naznačuje, že celý textový reťazec / html; charset = iso-8959-1 je obsah tohto elementu.This je správny HTML a je to, ako tento reťazec mal byť napísaný. To je tiež ťažko dlhé a škaredé! To tiež nie je niečo, čo by ste pravdepodobne pamätali z vrcholu svojej hlavy! Vo väčšine prípadov by weboví vývojári museli skopírovať a prilepiť tento kód z jednej stránky do akejkoľvek inej, ktorú vyvíjali, pretože písanie tohto dokumentu od začiatku sa veľa pýtalo.

HTML5 skracuje prídavné položky & # 34;

HTML5 nielen pridalo do jazyka nový počet prvkov , ale výrazne zjednodušilo aj syntax HTML, vrátane prvku Meta Charset. S HTML5 môžete pridať kódovanie znakov s oveľa ľahšie zapamätateľnou syntaxou pre prvok META, ktorý vidíte nižšie:

Porovnaj túto zjednodušenú syntax s tým, čo sme napísali na začiatku tohto článku, starú syntax používanú pre HTML4 a uvidíte, ako veľmi jednoduchšie píšete a pamätáte verziu HTML5. Namiesto toho, aby ste to museli skopírovať a vložiť z existujúcej lokality do novej, na ktorej pracujete, je to absolútne niečo, čo si ako sprostredkovateľ webových stránok môžete spomenúť. Táto úspora času veľa nie je veľa, ale keď zoberiete do úvahy ostatné oblasti syntaxe, ktoré HTML5 zjednodušené, úspory sa pridajú!

Vždy zahrňte kódovanie znakov

Vždy by ste mali obsahovať kódovanie znakov pre vaše webové stránky, a to aj v prípade, že ste niekedy nemali určiť zvláštne znaky . Ak nezahŕňate kódovanie znakov, vaše stránky sa stanú zraniteľnými útokmi skriptovania medzi webovými stránkami pomocou protokolu UTF-7.

V tomto scenári, anattacker vidí, že vaša lokalita nemá definované kódovanie znakov, a tak zablokuje prehliadač, aby si myslel, že kódovanie znakov na stránke je skutočne UTF-7. Ďalej útočník injektuje na webovú stránku kódované skripty UTF-7 a vaša stránka je napadnutá. To je samozrejme problematické pre všetkých zúčastnených, od vašej firmy až po vašich návštevníkov. Dobrou správou je, že je jednoduchý problém sa vyhnúť - jednoducho nezabudnite pridať kódovanie znakov na všetky vaše webové stránky.

Kde pridať kódovanie znakov

Kódovanie znakov pre webovú stránku by malo byť prvým riadkom prvku vášho HTML.To zabezpečuje, že prehliadač vie, čo je kódovanie znakov predtým, ako urobí čokoľvek iného na stránke, než aby určil, doctype a určil, že je to Stránka HTML. Váš HTML by mal čítať:

...

Použitie záhlavia HTTP pre dodatočné zabezpečenie

Môžete tiež zadať kódovanie znakov v hlavičkách HTTP. Je to ešte bezpečnejšie ako pridanie do stránky HTML, ale mali by ste mať prístup k konfiguráciám servera alebo k súborom .htaccess, čo znamená, že budete musieť pracovať s poskytovateľom webových služieb na získanie tohto typu prístupu zmeny pre vás. Prístup je tu skutočne výzvou. Samotná zmena je jednoduchá, takže každý poskytovateľ hostingu by mal byť schopný urobiť túto zmenu za vašu relatívne ľahko.

Ak používateApache, môžete nastaviť predvolenú sadu znakov pre všetky vaše stránky pridaním: AddDefaultCharset UTF-8 do vášho koreňového súboru .htaccess . Apačová predvolená znaková sada je ISO-8859-1 .