Kā izmantot meta rakstzīmju tagus rakstzīmju kodēšanai HTML5

Pirms HTML5, iestatot rakstzīmju kodējumu dokumentā ar elementu, jums bija jāraksta nedaudz izteiksmīgāka rindiņa, kas redzama zemāk. Šie ir Meta Charset elementi, ja savā tīmekļa vietnē izmantojāt HTML4:


Šajā kodā ir svarīgi pamanīt pēdiņas, kuras redzat ap saturu atribūts: saturs ="teksts / html; rakstzīme = iso-8859-1". Tāpat kā visi HTML atribūti, arī šīs pēdiņas nosaka atribūta vērtību, norādot, ka visa virkne teksts / html; rakstzīme = iso-8959-1 ir saturu šī elementa. Šis ir pareizs HTML un tas, kā šī virkne bija domāta rakstīšanai. Tas ir arī smagnējs garš un neglīts! Tas arī nav tas, ko jūs, visticamāk, atcerētos no galvas!

Vairumā gadījumu tīmekļa izstrādātājiem šis kods būs jākopē un jāielīmē no vienas vietnes jebkurā jaunajā vietnē, kuru viņi izstrādāja, jo šī raksta sagatavošana no jauna prasīja daudz.

HTML5 izgriež papildu "sīkumus"

HTML5 valodai ne tikai pievienoja dažus jaunus elementus, bet arī ievērojami vienkāršoja lielu HTML sintakses daļu, ieskaitot elementu Meta Charset. Izmantojot HTML5, varat pievienot rakstzīmju kodējumu ar daudz vieglāk iegaumējamu 

instagram viewer
META elements, kuru redzat zemāk:


Salīdziniet šo vienkāršoto sintaksi ar to, ko mēs rakstījām šī raksta sākumā, veco sintaksi, ko izmantoja HTML4, un jūs redzēsiet, cik daudz vieglāk ir rakstīt un atcerēties HTML5 versiju. Tā vietā, lai to nokopētu un ielīmētu no esošās vietnes jebkurā jaunā vietnē, pie kuras strādājāt, tas ir pilnīgi kaut kas tāds, ko jūs kā front-end tīmekļa izstrādātājs varētu atcerēties. Šis laika ietaupījums, iespējams, nav daudz, taču, ņemot vērā citas HTML5 vienkāršotās sintakses zonas, ietaupījumi tomēr palielinās!

Vienmēr iekļaujiet rakstzīmju kodējumu

Jūsu tīmekļa lapām vienmēr jāiekļauj rakstzīmju kodējums, pat ja jūs nekad to nedomājat izmantot īpašās rakstzīmes. Ja neiekļaujat rakstzīmju kodējumu, jūsu vietne kļūst neaizsargāta pret vairāku vietņu skriptu uzbrukumu, izmantojot UTF-7.

Šajā scenārijā uzbrucējs redz, ka jūsu vietnei nav definēts rakstzīmju kodējums, tāpēc tas maldina pārlūku domāt, ka lapas rakstzīmju kodējums ir UTF-7. Pēc tam uzbrucējs injicē UTF-7 kodētus skriptus tīmekļa lapā, un jūsu vietne tiek uzlauzta. Tas ir problemātiski visiem iesaistītajiem, sākot no jūsu uzņēmuma un beidzot ar apmeklētājiem. Labā ziņa ir tā, ka tā ir vienkārša problēma, no kuras jāizvairās - noteikti pievienojiet rakstzīmju kodējumu visām savām tīmekļa lapām.

Kur pievienot rakstzīmju kodējumu

Rakstzīmju kodējumam vietnei jābūt jūsu HTML pirmajai rindai

elements. Tas nodrošina, ka pārlūks zina, kas ir rakstzīmju kodējums, pirms tā lapā veic kaut ko citu, izņemot dokumenta tipa noteikšanu un HTML lapas identifikāciju. Jūsu HTML vajadzētu būt šādam:




...

HTTP galvenes izmantošana papildu drošībai

Varat arī norādīt rakstzīmju kodējumu HTTP galvenēs. Tas ir pat drošāk nekā pievienošana HTML lapai, taču jums vajadzētu būt piekļuvei servera konfigurācijām vai .htaccess faili, kas nozīmē, ka jums, iespējams, būs jāsadarbojas ar jūsu vietnes mitināšanas pakalpojumu sniedzēju, lai iegūtu šāda veida piekļuvi vai liktu viņiem veikt izmaiņas jūs. Piekļuve šeit ir izaicinājums. Izmaiņas pašas par sevi ir vienkāršas, tāpēc jebkuram mitināšanas pakalpojumu sniedzējam vajadzētu būt iespējai veikt šīs izmaiņas jums salīdzinoši viegli.

Ja jūs izmantojat Apache, varat iestatīt noklusējuma rakstzīmju kopu visai vietnei, pievienojot: AddDefaultCharset UTF-8 līdz jūsu saknei .htaccess failu. Apache noklusējuma rakstzīmju kopa ir ISO-8859-1.