
01-12-2008, 20:51
|
|
|
|
חבר מתאריך: 15.08.06
הודעות: 1,561
|
|
"ביטוי רגולרי" זה תשובה די טובה במקרה הזה
תתחיל עם לינקים שמתחילים עם http:// ואז אתה מוצא אותו עד WHITESPACE כלשהו (סלאש n, סלאש t, סלאש s).
אחרכך אתה יכול לחפש משהו-נקודה-משהו (נקודה משהו) ולבדוק אם הסיומת היא תקנית - 3-4 אותיות שהן com, edu, org וכו' (יש רשימה פה - תלחץ על gTLD), או 2 אותיות - ואז זה סיומת של מדינה (אותו קישור, תלחץ על ccTLD).
הגיוני שזה יביא לך גם דברים לא קשורים, אבל יותר מזה לא נראה לי שיש מה לעשות.
אתה גם יכול להעביר ביטויים כאלה דרך parse_url ולראות אם מתקבל לך משהו שדומה לHOST/PATH
_____________________________________
!!אזהרה!!
ההודעה עלולה להכיל שברי אגוזים ו/או איברי דגים כלשהם
!!אזהרה!!
|