HTML KODLAMASI (KARAKTER KÜMELERİ)

Hazırlayan: Berk ÇABUK

HTML Nedir ?

HTML, web sayfalarının tasarımı ve içeriğinin oluşturulmasında kullanılan bir dildir. HTML kodları, sayfanın metnini, resimlerini, videolarını ve diğer içeriklerini düzenleyerek web sayfalarını oluşturur. Bu kodlar, "etiketler" adı verilen karakter kümesi kullanılarak yazılır.
HTML etiketleri, "<" ve ">" işaretleri arasında yazılan karakterlerden oluşur. Her etiket, açılış etiketi ve kapanış etiketi olmak üzere iki bölümden oluşur. Açılış etiketi "<" işareti ile başlar ve ">" işareti ile biter. Kapanış etiketi ise, "<" işaretinin yanına bir "/"" eklenerek açılır ve ">" işareti ile kapatılır. Örneğin, "<p>" açılış etiketi ile başlayan bir paragraf etiketi, "</p>" kapanış etiketi ile sonlanır.

Tabloda basit bir HTML kodu örneği verilmiştir.
Bu örnek kod, bir HTML belgesinin temel yapısını gösterir. Etiketlerin ne işe yaradığını kısaca açıklayacak olursak:
<!DOCTYPE html>: Bu etiket, belgenin HTML5 standardında yazıldığını belirtir.
<html>: Bu etiket, belgenin başlangıcını ve sonunu belirler.
<head>: Bu etiket, sayfanın başlık bilgilerini içerir. Örneğin, sayfa başlığı.
<title>: Bu etiket, sayfa başlığıdır. Tarayıcı sekmesinde görüntülenir.
<body>: Bu etiket, sayfanın gövde bölümünü belirler.
<h1>: Bu etiket, bir başlık etiketidir. Sayfada büyük bir başlık oluşturur.
<p>: Bu etiket, bir paragraf etiketidir. Sayfada bir paragraf oluşturur.
<img>: Bu etiket, bir resim etiketidir. Sayfada bir resim görüntüler. src özelliği, resmin kaynak dosyasının yolunu belirtirken, alt özelliği ise resmin açıklamasını içerir.

HTML kodlama, bu örnek kodda gösterildiği gibi basit bir karakter kümesi kullanarak gerçekleştirilir. Etiketlerin nasıl kullanıldığını öğrenmek, bir HTML belgesi oluşturmak için ihtiyacınız olan temel adımlardır.

Karakter kümelerini yeni öğrenmeye başlayanlar için ipuçları:

HTML karakter kümeleri, metin içinde kullanılan özel karakterlerdir.
HTML kodları içinde özel bir anlamı olan karakterlerdir ve bunlar metinlerin biçimlendirilmesi için kullanılır.
HTML karakter kümelerinin bir listesi mevcuttur ve internet üzerinden kolayca erişilebilir.
Bazı örnek karakterler şunlardır: "<" (Küçük Ayraç), ">" (Büyük Ayraç), "&" (Ve), """ (Tırnak işareti), "'" (Tek Tırnak işareti) gibi.
Bu karakterleri kullanarak metinler oluşturabilirsiniz.
HTML karakter kümelerinin doğru kullanımı, web sayfalarınızın görünümünü etkileyebilir, bu nedenle doğru kullanımı öğrenmek önemlidir.
HTML karakter kümelerinin kullanımı, öğrenmesi kolay ve pratik yaparak öğrenmek daha etkili olacaktır.

Karakter Kodlama Nedir ?

Karakter kodlaması kavramı bir çeşit kodlama sistemi kullanılarak kodlanmış karakter gruplarını temsil etmektedir.
Soyutlama düzeyi ve kullanıldığı bağlama bağlı olarak karakterlere karşılık gelen kod noktaları ve bunların oluşturdukları kod alanı, bit örüntüleri,oktetler, doğal sayılar, elektrik sinyalleri vb. şeklinde algılanabilir.
Metinsel verilerin işlenmesi, depolanması ve iletimi esnasında karakter kodlamaları kullanılır.
ASCII ilk karakter kodlama standartıdır.Bu internet üzerinde kullanılabilecek 127 farklı alfanümerik karakterleri tanımlar. ASCII desteklenen sayılar (0-9) , ingilizce harfleri (AZ) ve benzeri bazı özel karakterler (!, $, +, -, (, ), @, <, >, !, $, +, -, ( ), @, < >) .
ANSI (Windows-1252) Orijinal Windows karakter kümesi oldu. Bu 256 farklı karakter kodlarını destekledi.
ISO-8859-1 Aynı zamanda 256 farklı karakter kodlarını desteklenen HTML 4 için ayarlanan varsayılan karakterdi.
ANSI ve ISO sınırlı olduğundan, varsayılan karakter kodlama HTML5'teki UTF-8 olarak değiştirilmiştir.

HTML Charset Özellik

Doğru bir HTML sayfasını görüntülemek için bir web tarayıcı sayfasında kullanılan karakter kümesini bilmesi gerekir.

Bu belirtilen <meta> etiketi:

Türkçe Karakterleri Destekleyen Charset Kullanımı

HTML editörleri, Türkçe karakterleri destekleyen charset kullanıldığında, Türkçe klavye ile doğrudan yazı yazmayı mümkün kılar. Örneğin, "ş" harfi gibi Türkçe karakterler, HTML kodları içinde doğrudan yazılabilecektir. Bu, Türkçe karakterleri kullanmak için özel bir işlem yapılmasına gerek kalmadan kolayca yapılabilir.
Türkçe karakterleri destekleyen bir charset kullanmak, dünya çapında ziyaretçilere aynı şekilde görünmesini sağlar. Bunun nedeni, bu charset'in dünya genelinde tanınması ve kullanılmasıdır. Örneğin, UTF-8 charset'i Türkçe karakterleri destekler ve dünya genelinde kullanılan bir charset'tir. Bu nedenle, Türkçe karakterler içeren bir web sayfası, dünyanın herhangi bir yerindeki bir kullanıcı tarafından görüntülendiğinde aynı şekilde görüntülenecektir.
Bu nedenle, Türkçe karakterler içeren bir web sitesi oluştururken, charset olarak UTF-8 veya Türkçe karakterleri destekleyen başka bir charset kullanılması önerilir. Bu, Türkçe karakterlerin doğrudan kullanımına izin verir ve dünya çapındaki kullanıcılara aynı şekilde görüntülenmesini sağlar.

Yandaki kodda, "UTF-8" charset'i kullanılmaktadır ve "Ş, Ğ, Ç, Ö, Ü, İ" gibi Türkçe karakterler içermektedir. Bu kodu bir HTML editöründe oluşturabilir ve farklı tarayıcılarda açarak karakterlerin doğru bir şekilde göründüğünü gözlemleyebilirsiniz.
Bu şekilde, Türkçe karakterleri destekleyen bir charset kullanarak, Türkçe karakterlerin doğrudan kullanımı mümkün hale gelir ve dünya çapındaki kullanıcılara aynı şekilde görüntülenmesi sağlanır.

ASCII Karakter Kümesi

Tarihi :

ASCII, üretiliş hikayesi olarak 1874 yılında Émile Baudot tarafından telgrafta kullanılmak üzere patentli bir program olan Baudot kodundan gelmektedir. (Saniyedeki modülasyonlar için "baud" terimi, modem iletim hızlarını belirtmek için kullanılır ve bu onun isminden türetilir.)

Açılımı ve Çalışma Prensibi :

ASCII, "Bilgi Değişimi İçin Amerikan Standart Kodu" anlamına gelmektedir. ASCII bir karakter kodlamasıdır ve sayısal kodları kullanarak karakterleri temsil etmek için standart bir yol sağlar. Bunlar arasında büyük ve küçük harfler, İngilizce harfler, sayılar ve noktalama işaretleri bulunur.
ASCII, her karakteri temsil etmek için 7 bit kullanır. Örneğin, bir büyük harf "T" 84 sayısıyla temsil edilir ve küçük bir harf "t" 116 ile temsil edilir. Diğer klavye tuşları da standart ASCII değerleriyle eşlenir. Örneğin, Escape (ESC) tuşu 27, Sil (DEL) tuşu 32 olarak temsil edilir. ASCII kodları yukarıda listelenen ondalık sayılar yerine onaltılık değerler olarak da görüntülenebilir. Örneğin, Onaltılı tuştaki Escape tuşunun ASCII değeri "1B" ve Delete tuşunun onaltılık değeri "7F" dir.
ASCII 7 bit kullandığından, yalnızca 2 ^ 7 veya 128 değeri destekler. Bu nedenle, standart ASCII karakter kümesi 128 karakterle sınırlıdır. Bu tüm standart İngilizce harfleri, sayıları ve noktalama işaretlerini temsil etmek için yeterli olsa da, tüm özel karakterleri veya karakterleri diğer dillerden temsil etmek yeterli değildir. 8 bit değerleri veya 256 karakteri destekleyen Extended ASCII bile, tüm dilleri doğru bir şekilde temsil etmek için yeterli karakter içermemektedir. Bu nedenle, Latin-1 (ISO-8859-1), UTF-8 ve UTF-16 gibi diğer karakter setleri daha fazla karakter gerektiren belgeler ve web sayfaları için yaygın olarak kullanılır.

ASCII Tablosu :

ASCII tablosu, 0 ile 127 arasında değerlere sahip olan 128 karaktere sahiptir. Bu nedenle, ASCII'de bir karakteri temsil etmek için 7 bit yeterlidir; ancak, çoğu bilgisayar tipik olarak bir ASCII karakteri için 1 bayt (8 bit) ayırır. Bir bayt, 0 ile 255 arasındaki bir sayı aralığına, karakter kümesinin boyutunda veya bir işaret bitinde büyümeye yer bırakır. Sonuç olarak, bir karakter veri tipi isteğe bağlı olarak işaretli değerleri temsil edebilir; Ancak, şimdilik karakter veri tiplerinin işaretsiz olduğunu, yani pozitif tamsayı değerlerinin 0-127 aralığında olduğunu varsayıyoruz.
ASCII tablosunda, 0 - 31 ve 127 arasındaki ondalık değerlerin yazdırılamayan kontrol karakterlerini temsil ettiğini unutmayın. Diğer tüm karakterler bilgisayar tarafından basılabilir, yani ekranda gösterilebilir veya yazıcılara yazdırılabilir ve bunlara yazdırılabilir karakterler denir. Tüm basılabilir karakterler ve birçok kontrol karakteri, klavyede karşılık gelen tuşları yazarak bilgisayara girilebilir. Karakter sütunu, basılması gereken tuşları gösterir.

ANSI Karakter Kümesi (Windows-1252) :

ANSI karakter seti, 1900'lerin başlarına dayanan bir gönüllü kuruluş olan Amerikan Ulusal Standartlar Enstitüsü (ANSI) tarafından geliştirilen bir dizi standart karakterdir. Bilgisayar endüstrisinde tutarlı standartlar oluşturmak için ANSI karakter setleri geliştirilmiştir.
ANSI karakter kümesi, Windows işletim sistemlerinde Windows 95 ve Windows NT aracılığıyla kullanılan standart karakter kümesiydi ve bundan sonra Unicode kabul edildi. ANSI, çoğu ASCII / Unicode formatlarında olduğu gibi aynı sayısal kodları paylaşan 218 karakterden oluşur.
1.0 -127 değerleri için ASCII ile aynıdır.

2.128 -159 değerleri için karakter özel bir kümesi vardır.

3.UTF-8 ile 160 -255 değerleri için aynıdır.

Seçilmiş bir karakter seti oluşturma fikrinin merkezinde, standart üreticilerinin sete hangi dil ve uluslararası karakter türlerinin dahil edilmesi gerektiğine karar vermeleri gerektiğidir. Örneğin, standart komiteleri, belirli bir karakterin diğer karakterler tarafından etkili bir şekilde oluşturulup oluşturulmayacağına karar verebilir, bu durumda dahil edilemeyebilir.
ANSI karakter kümesi gibi standartlaştırılmış karakter grupları oluşturmak, hizmetlerin sunumunda, platformlar arası geliştirme ve programlamada daha fazla tutarlılık ve verimlilik sağlar.

ISO-8859-1 Karakter Kümesi

0 -127 arasındaki değerler için ASCII ile aynıdır.
0-31,128-159 arasında olan değerleri kullanmaz.
160 – 255 arasındaki değerler için UTF-8 ile aynıdır.

UTF-8 Karakter Kümesi

UTF-8, elektronik iletişim için kullanılan değişken uzunluklu bir karakter kodlama standardıdır. Unicode Standardı tarafından tanımlanan ad, Unicode (veya Evrensel Kodlu Karakter Kümesi ) Dönüşüm Biçimi – 8-bit'ten türetilmiştir .
UTF-8 -8 bitlik bir Unicode dönüşüm biçimidir.Unicode karakterlerini değişken sayıda 8 bitten oluşan bayt (kod birimi) gruplarıyla kodlamakta kullanılır. Rob Pike ve Ken Thompson tarafından geliştirilmiştir.
0 ila 127 arasındaki değerler için ASCII ile aynıdır.
128’den 159’a kadar olan değerleri kullanmaz.
160 ile 255 arasındaki değerler için hem ANSI hem de ISO-8859-1 ile aynıdır.
10.000’den fazla farklı karakterle 256 değerinden devam eder.

Page updated

Report abuse