13-10-2009, 21:40
|
|
|
חבר מתאריך: 26.10.04
הודעות: 331
|
|
הצגת עמוד עם charset משתנה
שלום,
אני מדפיס תוכן מתוך עמוד אנטרנט אצלי...
אני משתמש ב
קוד:
StreamReader sr = new StreamReader(myResponse.GetResponseStream(), System.Text.Encoding.Default);
זה נחמד כאשר אני עובד עם עמודים שה charset שלהם זהה לברירת מחדל של המחשב שלי..
הבעיה מתחילה שאני עובד פתאום עם עמוד מאתר שמקודד ב UTF-8 ... ובשביל לראות את תהוכן אני צריך לשנות את השורה ל :
קוד:
StreamReader sr = new StreamReader(myResponse.GetResponseStream(), System.Text.Encoding.UTF8);
עכשיו, ברור שאני לא יודע מראש כל פעם מה הקידוד... אני מנסה למצוא דרך להבין מה ה charset של הדף בשביל שאוכל לפתוח אותו בצורה הנכונה... כמובן שאם אני משאיר את UTF-8, אז בעמודים שמקודדים עם windows-1255 (זה של העברית אם אני זוכר כן ?) אז אני רואה סימני שאלה...
כמובן אצרף את הקוד הרלוונטי בשלמותו :
קוד:
HttpWebRequest myRequest = (HttpWebRequest)WebRequest.Create(URL);
myRequest.Method = "GET";
WebResponse myResponse = myRequest.GetResponse();
StreamReader sr = new StreamReader(myResponse.GetResponseStream(), System.Text.Encoding.Default);
string result = sr.ReadToEnd();
אז... איך אני מגלה את ה charset ומציג בהתאם ? בתודה מראש !
|