Ako používať značky Meta Charset na kódovanie znakov v HTML5

Pred zavedením HTML5, nastavenie kódovania znakov v dokumente pomocou prvku vyžadovalo, aby ste napísali trochu podrobný riadok, ako je vidieť nižšie. Toto je element Meta Charset, ak ste na svojej webovej stránke používali HTML4:


Čo je dôležité si v tomto kóde všimnúť, sú úvodzovky, ktoré vidíte okolo obsah atribút: obsah ="text / html; znaková sada = iso-8859-1". Rovnako ako všetky atribúty HTML, aj tieto úvodzovky definujú hodnotu atribútu, čo znamená, že celý reťazec text / html; znaková sada = iso-8959-1 je obsah tohto prvku. Toto je správne HTML a práve tak sa mal písať tento reťazec. Je tiež nepraktický dlhý a škaredý! Tiež to nie je niečo, na čo by ste si pravdepodobne pamätali z celej hlavy!

Vo väčšine prípadov by vývojári webu museli skopírovať a vložiť tento kód z jedného webu na akýkoľvek nový, ktorý vyvíjali, pretože jeho písanie od začiatku vyžadovalo veľa.

HTML5 odstraňuje ďalšie „veci“

HTML5 nielenže pridal do jazyka niektoré nové prvky, ale tiež výrazne zjednodušil veľkú časť syntaxe HTML, vrátane prvku Meta Charset. Pomocou HTML5 môžete pridať kódovanie svojich znakov s oveľa ľahšie zapamätateľnou syntaxou pre 

instagram viewer
META prvok, ktorý vidíte nižšie:


Porovnajte túto zjednodušenú syntax s tým, čo sme napísali na začiatku tohto článku, starou syntaxou používanou pre HTML4, a uvidíte, o koľko jednoduchšie je písať a pamätať si verziu HTML5. Namiesto toho, aby ste to potrebovali skopírovať a vložiť z existujúceho webu na akýkoľvek nový, na ktorom ste pracovali, je to absolútne niečo, na čo si ako front-endový webový vývojár pamätáte. Táto úspora času nemusí byť veľa, ale keď vezmete do úvahy ďalšie oblasti syntaxe, ktoré HTML5 zjednodušili, úspory sa sčítajú!

Vždy zahrňte kódovanie znakov

Pre svoje webové stránky by ste mali vždy zahrnúť kódovanie znakov, aj keď nikdy nepoužívate žiadne špeciálne znaky. Ak nezadáte kódovanie znakov, váš web sa stane zraniteľným voči útoku skriptovania medzi webmi pomocou UTF-7.

V tomto scenári útočník vidí, že váš web nemá definované žiadne kódovanie znakov, a tak podvedie prehliadač, aby si myslel, že kódovanie znakov stránky je UTF-7. Ďalej útočník vloží na webovú stránku skripty kódované UTF-7 a váš web bude napadnutý. To je problematické pre všetkých zúčastnených, od vašej spoločnosti až po vašich návštevníkov. Dobrou správou je, že sa nemusíte vyhnúť jednoduchému problému - nezabudnite na všetky svoje webové stránky pridať kódovanie znakov.

Kam pridať kódovanie znakov

Kódovanie znakov pre webovú stránku by malo byť prvým riadkom vašich kódov HTML

element. To zaisťuje, že prehľadávač vie, čo je kódovanie znakov, skôr ako urobí čokoľvek iné na stránke, okrem toho, aby určil doctype a identifikoval, že ide o stránku HTML. Váš kód HTML by mal čítať:




...

Používanie hlavičiek HTTP pre extra zabezpečenie

Môžete tiež určiť kódovanie znakov v hlavičkách HTTP. To je ešte bezpečnejšie ako jeho pridanie na stránku HTML, musíte však mať prístup ku konfiguráciám servera alebo .htaccess súbory, čo znamená, že na získanie tohto druhu prístupu alebo na vykonanie zmien v nich môže byť potrebné spolupracovať s poskytovateľom hostenia na vašom webe ty. Prístup je tu výzvou. Samotná zmena je jednoduchá, takže každý poskytovateľ hostingu by mal byť schopný túto zmenu za vás vykonať relatívne ľahko.

Ak používate Apache, môžete nastaviť predvolenú znakovú sadu pre celý svoj web pridaním: AddDefaultCharset UTF-8 k tvojmu koreňu .htaccess spis. Predvolená znaková sada Apache je ISO-8859-1.