Database Theory: Bộ ký tự và đối chiếu là gì

2022-03-20 16:06:19

Trong bài đăng này, tôi đang chia sẻ lý thuyết Cơ sở dữ liệu nhỏ về Bộ ký tự và đối chiếu.
Vì chúng tôi là Chuyên gia cơ sở dữ liệu và đã có kinh nghiệm với “Đối chiếu” trong SQL Server và MySQL.
Tôi nhận thấy rằng Chuyên gia cơ sở dữ liệu mới hơn và trung cấp có nghi ngờ và thắc mắc về Bộ ký tự và đối chiếu.

Hãy để tôi xóa điều này bằng một ghi chú tự nhiên.

What is Character Set?

A Character Set is nothing but just a list of symbols and encodings.

Ví dụ: latin1 và UTF-8 là bộ ký tự truyền thống nhất.
Sử dụng latin1, bạn sẽ có thể viết tất cả các từ tiếng Mỹ vì latin1 chứa tất cả các ký tự ASCII, đủ để viết một từ tiếng Anh. Ngược lại, với ASCII, bạn sẽ không thể viết tất cả các từ của các ngôn ngữ cụ thể Tây Âu vì ví dụ, các ký tự như 'ë', 'õ', 'Ñ' bị thiếu.

Một Bộ ký tự mã hóa các ký tự để chúng vừa với bộ nhớ. Ví dụ: ký hiệu euro, €, sẽ được mã hóa là 0xa4 và trong UTF-8, nó sẽ là 0xe282ac.

What is Collation?

A collation is a set of rules for comparing characters in a character set. Nó cũng đã quy định cho việc sắp xếp các ký tự và thứ tự thích hợp của hai ký tự khác nhau giữa các ngôn ngữ.
Một đối chiếu so sánh hai chuỗi như, nếu một từ lớn hơn một từ khác và sắp xếp tương ứng.

Nếu bạn đang sử dụng bộ ký tự “latin1”, bạn có thể sử dụng đối chiếu “latin1_swedish_ci”.
Bạn phải chọn đối chiếu đúng vì đối chiếu sai có thể ảnh hưởng đến hiệu suất cơ sở dữ liệu của bạn.

Bây giờ hãy tạo một cơ sở dữ liệu trong MySQL bằng cách sử dụng Bộ ký tự và đối chiếu:

Xem thêm:


Chia sẻ: