07-08-2007, 18:39
|
|
|
חבר מתאריך: 17.05.05
הודעות: 7,321
|
|
Unicode זה צורה של הגדרת תווים עפ"י מה שקבעו אנשים מסויימים.
לדוגמא, ב-Unicode התו "א" שווה ל- U+05D0 (אם אני לא טועה).
אבל UTF-8, UTF-7, UCS-4 וכדו', הם דרכים שונות לאחסן את התווים.
כשאתה קובע קידוד windows-1255, אתה למעשה מאחסן את התווים בדרך שונה, שלא מתאימה לקודי Unicode, ובגלל זה נוצר בלאגן ...
זה לא מספיק לקרוא את המאמר הנ"ל (שהבאת בקישור) פעם אחת. צריך לקרוא את זה שוב ושוב עד שאתה מפנים...קראתי את זה 3 פעמים (לא רצוף) ועדיין לא הצלחתי להפנים לגמרי את הכל.
|