03-07-2011, 08:48
|
|
|
חבר מתאריך: 25.08.03
הודעות: 9,114
|
|
ציטוט:
במקור נכתב על ידי dorM
BOM זהו תו.
|
לא נכון להגדיר זאת כך
(character זה תו...).
BOM הינו תו בקרה המצורף לעתים לקבצי יוניקוד.
ב-UTF-16 זה נחוץ, כיון שתו זה מציין את סדר קידוד התווים (Byte Order Mark). מתחילת הקובץ לסופו או להיפך (big-endian / little-endian).
וב-utf-8 הוא מיותר, כי תקן זה עצמו קובע כיוון קבוע, אבל תוכנות מסויימות, בעיקר (או רק) ב-Windows, בכל זאת קובעות תו זה בתחילת הקובץ, על מנת לזהות אותו כקידוד יוניקוד.
כאמור, בקידוד utf-8 תו זה מיותר, ולכן רצוי להשתמש רק בתוכנות שלא מצרפות תווים מיותרים ללא ידיעת המשתמש.
|