14-09-2005, 20:20
|
|
|
חבר מתאריך: 10.09.04
הודעות: 1,032
|
|
העלת סוגיה מעניינת...
דבר ראשון צריך להבין את ההבדלים בין ANSI ל-Unicode:
ליוניקוד יתרונות וחסרונות. כיום כל המערכות ההפעלה החדשות עובדות עם יוניקוד (החל מגרסת NT).
היתרון של יוניקוד על ascii הוא, שב-ascii תווך התווים הוא מאוד קטן, כך שהאות א (בכתב העיברי) תיראה כ-à (בכתב מערבי).
כתיבה ביוניקוד מאפשרת למשתמשים מכל העולם לקרוא ולכתוב בעברית (או בכל שפה אחרת), לא משנה סוג מערכת ההפעלה עליה הם עובדים או המקום בו הם נמצאים.
החיסרון היחידי בקידוד הזה הוא שהוא Double Byte מה שאומר שדף אינטרנט שיהיה כתוב בקידוד הזה יהיה כבד יותר מדף שכתוב ב-ascii.
היתרון הברור ביוניקוד הוא שהוא מכיל כמות תווים אדירה שמתאימה למרבית השפות (כ-65,536 תווים). בקישור הבא: http://www.unicode.org/iuc/iuc10/x-utf8.html ניתן לראות דף אחד שמשתמש בקידוד אחד שמתאים לשפות רבות.
ההגדרה בדף צריכה להיות "charset=utf-8. וכמובן לשמור בפורמט הנכון (Unicode או utf-8 תלוי בעורך). כמו כן, ביוניקוד ניתן להגדיר חתימת BOM (בתרגום, Byte Order Mark).
BOM למעשה, מגדיר מידע בתחילת הדף אשר אומר לקוראי המסמך (דפדפנים או טכנולוגיית צד שרת) שהדף הינו בפורמט יוניקוד, ועוד מידע מועיל. קישור להגדרה המלאה: http://www.unicode.org/faq/utf_bom.html#22.
ל-ANSI יש את היתרון של חיסכון במשקל דף (עד כמה שההבדל קטן ולא משמעותי).
יוניקוד הינו המתאים ביותר לעבודה עם צד-שרת ומסדי נתונים מהסיבה שרוב (אם לא כל) הטכנולוגיות מגדירות את הקידוד אותו הן מעבדות (כברירת מחדל) כיוניקוד. מה שהופך את העבודה עם שרתים בחו"ל לקלה וללא תקלות.
כל מה שכתבתי לא ממש מכסה את הנושא, אבל זו נקודת התחלה טובה לדיון בנושא.
בהודעה זו נטיתי קצת לכיוון היוניקוד, אבל אני בטוח שמישהו יבוא לתת את הצד השני
כמה קישורים מועילים:
1. החלק ב-W3C שמדבר על הקידוד והאינטרנט - http://www.w3.org/TR/html401/charset.html#encodings
2. ארגון יוניקוד, שמגדיר את התקן - http://unicode.org
_____________________________________
|