Sebelum pengenalan HTML5, pengaturan pengkodean karakter pada dokumen dengan elemen mengharuskan Anda untuk menulis baris yang agak bertele-tele seperti yang terlihat di bawah ini. Ini adalah elemen Meta Charset jika Anda menggunakan HTML4 di halaman web Anda:
Yang penting diperhatikan dalam kode ini adalah tanda kutip yang Anda lihat di sekitar kandungan atribut: konten="teks/html; charset=iso-8859-1". Seperti semua atribut HTML, tanda kutip ini menentukan nilai atribut, yang menunjukkan bahwa seluruh string teks/html; charset=iso-8959-1 adalah kandungan dari elemen ini. Ini adalah HTML yang tepat, dan begitulah seharusnya string ini ditulis. Itu juga sangat panjang dan jelek! Itu juga bukan sesuatu yang mungkin Anda ingat dari atas kepala Anda!
Dalam kebanyakan kasus, pengembang web harus menyalin dan menempelkan kode ini dari satu situs ke situs baru yang mereka kembangkan karena menulis ini dari awal membutuhkan banyak hal.
HTML5 Memotong "Barang" Ekstra
HTML5 tidak hanya menambahkan beberapa elemen baru ke bahasa tetapi juga sangat menyederhanakan banyak sintaks HTML, termasuk elemen Meta Charset. Dengan HTML5, Anda dapat menambahkan pengkodean karakter Anda dengan sintaks yang lebih mudah diingat untuk
META elemen yang Anda lihat di bawah ini:Bandingkan sintaks yang disederhanakan dengan apa yang kami tulis di awal artikel ini, sintaks lama yang digunakan untuk HTML4, dan Anda akan melihat betapa lebih mudahnya menulis dan mengingat versi HTML5. Alih-alih perlu menyalin dan menempel ini dari situs yang ada ke situs baru yang sedang Anda kerjakan, ini benar-benar sesuatu yang, sebagai pengembang web front-end, dapat Anda ingat. Penghematan waktu ini mungkin tidak banyak, tetapi ketika Anda mempertimbangkan area sintaksis lain yang disederhanakan HTML5, penghematannya memang bertambah!
Selalu Sertakan Pengkodean Karakter
Anda harus selalu menyertakan pengkodean karakter untuk halaman web Anda, bahkan jika Anda tidak pernah berniat untuk menggunakannya karakter spesial. Jika Anda tidak menyertakan pengkodean karakter, situs Anda menjadi rentan terhadap serangan skrip lintas situs menggunakan UTF-7.
Dalam skenario ini, penyerang melihat bahwa situs Anda tidak memiliki pengkodean karakter yang ditentukan, jadi ini menipu browser untuk berpikir bahwa pengkodean karakter halaman adalah UTF-7. Selanjutnya, penyerang menyuntikkan skrip yang disandikan UTF-7 ke halaman web, dan situs Anda diretas. Ini bermasalah bagi semua orang yang terlibat, dari perusahaan Anda hingga pengunjung Anda. Kabar baiknya adalah bahwa ini adalah masalah sederhana yang harus dihindari - pastikan untuk menambahkan pengkodean karakter ke semua halaman web Anda.
Tempat Menambahkan Pengodean Karakter Character
Pengkodean karakter untuk halaman web harus menjadi baris pertama HTML Anda
elemen. Ini memastikan bahwa browser mengetahui pengkodean karakter sebelum melakukan hal lain pada halaman selain untuk menentukan doctype dan mengidentifikasi bahwa itu adalah halaman HTML. HTML Anda harus membaca:
...
Menggunakan Header HTTP untuk Keamanan Ekstra
Anda juga dapat menentukan pengkodean karakter di header HTTP. Ini bahkan lebih aman daripada menambahkannya ke halaman HTML, tetapi Anda harus memiliki akses ke konfigurasi server atau .htaccess file, yang berarti Anda mungkin perlu bekerja sama dengan penyedia hosting situs web Anda untuk mendapatkan akses semacam ini atau meminta mereka membuat perubahan untuk kamu. Akses adalah tantangan di sini. Perubahan itu sendiri sederhana, jadi penyedia hosting mana pun harus dapat melakukan perubahan ini untuk Anda dengan relatif mudah.
Jika Anda menggunakan Apache, Anda dapat mengatur set karakter default untuk seluruh situs Anda dengan menambahkan: TambahkanDefaultCharset UTF-8 ke akarmu .htaccess mengajukan. Set karakter default Apache adalah ISO-8859-1.