A UNICODE egy nemzetközi szabvány, amelyet arra hoztak létre, hogy a világ összes írott karakterét – betűket, számokat, írásjeleket, szimbólumokat – egységesen tudjuk ábrázolni számítógépes rendszerekben. Míg korábban minden operációs rendszer vagy program külön saját karakterkódolást használt (pl. ASCII, Latin-1, ISO-8859-2), a UNICODE célja, hogy minden karakterhez egyedi számkódot (azaz kódpontot) rendeljen, függetlenül attól, milyen nyelvről vagy írásrendszerről van szó.
Ez azért különösen hasznos, mert a számítógépek közötti adatcsere során így nem veszik el, nem sérül, és nem torzulnak el a karakterek – például ázsiai, cirill, arab, görög vagy éppen magyar ékezetes betűk sem.
A UNICODE egy karaktertér, amely több mint 140.000 különböző karaktert, jelet és szimbólumot tartalmaz. Minden karakterhez egy egyedi szám (ún. kódpont) tartozik, például a nagy A betűhöz: U+0041, az “á” betűhöz: U+00E1, a szívecske szimbólumhoz: U+2665.
Példák a UNICODE karakterekre
- Angol nagy A: U+0041 → „A”
- Magyar “á” betű: U+00E1 → „á”
- Orosz “б” betű: U+0431 → „б”
- Japán “日” (“nap” jelentése): U+65E5 → „日”
- Görög “Ω” (Omega): U+03A9 → „Ω”
- Szívecske szimbólum: U+2665 → „♥”
- Hóember: U+2603 → „☃”
- Mosolygós emoji: U+1F600 → „😀”
UNICODE szinonimák
A UNICODE szónak nincsenek közvetlen magyar szinonimái, mert ez egy speciális technológiai szabvány neve. Néha az emberek egyszerűen „egységes karakterkódolás”-ként vagy „internacionális karakterkészlet”-ként emlegetik, de ezek nem hivatalos szinonimák.
Összefoglalva:
A UNICODE egy univerzális, szabványos karakterkódolási rendszer, amely lehetővé teszi, hogy a világ bármely írott nyelvét és szimbólumát egységesen és hibamentesen kezelhessük és jeleníthessük meg informatikai rendszerekben. Ajánlott minden programozással, weboldalkészítéssel vagy nemzetközi kommunikációval foglalkozónak ismernie!