728x90
개요
프로그래밍에서 문자를 표현하는 방법에는 여러 표준이 존재하지만, 그중 가장 널리 사용되는 두 가지는 아스키 코드와 유니코드입니다.
아스키 코드는 간단한 문자 표현에 자주 사용되며 익숙하지만, 유니코드는 개념만 알고 정확한 범위나 역할이 모호하여 본 글에서 정리하고자 합니다.
아스키(ASCII) 코드란❓
아스키(ASCII)는 영어를 기반으로 한 7비트 문자 인코딩 표준으로, 컴퓨터 시스템에서 문자와 기호를 표현하기 위한 방식입니다.
총 128개의 문자를 지원합니다. 여기에는 영어 대소문자, 숫자, 그리고 특수 문자가 포함됩니다.
아스키 코드는 주로 영어 알파벳과 일부 특수 문자를 다루기 때문에, 다른 언어나 기호를 표현하는 데는 한계가 있습니다.
유니코드(Unicode)란❓
유니코드(Unicode)는 전 세계의 모든 문자, 기호, 이모지 등 모든 문자를 표현할 수 있도록 설계된 국제 문자 인코딩 표준입니다.
유니코드는 16비트(최대 32비트)로 문자를 표현하며, U+0000부터 U+10FFFF까지의 범위에서 총 약 143,859개의 문자를 지원합니다. 이를 통해 영어, 한글, 중국어, 아랍어, 이모지 등 다양한 언어와 문자를 모두 표현할 수 있습니다.
유니코드는 다양한 문자 집합을 하나로 통합하여 다국어 환경에서도 호환될 수 있도록 설계되었습니다. 유니코드는 아스키 코드의 문자들을 포함하고 있기 때문에, 아스키 코드와 호환됩니다.
유니 코드 예시
public class UnicodeExample {
public static void main(String[] args) {
char letter = '가'; // 유니코드 문자
int unicodeValue = letter;
System.out.println("Character: " + letter);
System.out.println("Unicode Value: U+" + Integer.toHexString(unicodeValue));
}
}
실행 결과
Character: 가
Unicode Value: U+AC00
아스키(ASCII) 코드와 유니코드(Unicode)의 차이점
1. 지원 문자 범위
- 아스키 코드는 영어 및 일부 특수 문자만 지원하는 반면,
- 유니코드는 전 세계 모든 언어를 지원하며, 이모지, 수학 기호, 기타 특수 문자도 포함합니다.
2. 문자 코드의 크기
- 아스키 코드는 7비트로 문자 하나를 표현할 수 있어, 총 128개의 문자만을 다룹니다.
- 유니코드는 16비트(최대 32비트)로, 약 143,859개의 문자까지 표현할 수 있습니다.
3. 호환성
- 아스키 코드는 유니코드의 첫 128개 문자와 완전히 호환됩니다.
- 즉, 아스키 코드로 표현된 문자는 유니코드에서도 동일한 값을 가집니다.
- 그러나 유니코드는 아스키 코드보다 훨씬 더 많은 문자와 기호를 지원합니다.
4. 유연성
- 아스키 코드는 영어와 기호 중심이라, 다국적 언어나 다양한 문자에 대응하지 못합니다.
- 유니코드는 다국적 문자 및 다양한 기호들을 모두 표현할 수 있어, 글로벌 애플리케이션에 필수적입니다.
'TIL,일일 회고' 카테고리의 다른 글
[TIL, 일일 회고] 2024.01.17 - Docker Volume Create 명령어로 볼륨 직접 생성하기 (0) | 2025.01.17 |
---|---|
[TIL, 일일 회고] 2025.01.16 - Java 앞 뒤 공백 제거하기 : strip() vs trim() (1) | 2025.01.16 |
[TIL, 일일 회고] 2025.01.14 - 읽기 전용 볼륨이란? :도커에서 데이터 수정 방지 설정하기 (0) | 2025.01.14 |
[TIL, 일일 회고] 2025.01.13 - 자바에서 동일성과 동등성의 차이 이해하기 (0) | 2025.01.13 |
[TIL, 일일 회고] 2025.01.12 - ${PWD}와 $(pwd) 차이점 알아보기 (0) | 2025.01.12 |