איך התוכנה יודעת לזהות את סוג המשתנה? char, int וכד'

ציטוט:

חשבתי שכל פקודה [ כלומר חלק של קוד שמסתיים בנקודה-פסיק ( ; ) ] מתחלקת לכמה פקודות ASM וזהו...

כן, זה נכון, אבל זה תהליך מאוד מייגע P: וארוך.
הקהילה עצמה של קומפיילרים מאוד קטנה (יחסית), ויש רק כמה מאוד גדולים וטובים (לדוג', הקומפיילר של אינטל, gnu compiler collection (gcc...) , visual studio ועוד ), אין הרבה אנשים שמצליחים לכתוב טכניקות חדשות או דברים חדשים בנושא, וזה מאוד מקשה על העניין (אבל כאן אני אכנס לחפירה אחרת אם אתה מעוניין לקרוא עוד על זה חפש בגוגל את

ציטוט:

Compilers: Principles, techniques & tools

של Aho , אחד הספרים הכי מעניינים וטובים שקראתי בנושא, וגם את

ציטוט:

Crenshaw's let's write a compiler!

(בפסקל, אבל עדיין מגניב))

ציטוט:

הכי התפלאתי מהקטע שצריך לנחש את המידע ( wtf? ). הרי חייב להיות מצב בו מידע יכול להיות מיוצג ע"יי דברים שונים.

שוב, זה לא ממש לנחש, אל תשכח שכל טיפוס עדיין מיוצג בדברים שדיי קלים לייצוג (32בייט, 16, ועד ביט אחד), יש הרבה מאוד שיטות שרובן עד כמה שאני זוכר משתמשות בהיריסטיקה (אני לא בטוח שאני כתבתי את נכון אפילו), או אפילו כותבים parser בשביל שיזהה את המידע עצמו
וישווה אותו עם case studies שיהיו טיפוסיים. אתה תיראה שזה מאוד קל לזהות לדוגמא float נגד int בגלל floating point exception וכל מיני שטויות אחרות

ציטוט:

זה כמו לחפש מפתח במערך לפי ערך מסוים שיש במערך... הערך הזה יכול להופיע 500 פעם במערך באיבריו השונים, אבל המפתח יכול להיות קיים פעם אחת. ואז יש אפשרויות התאמה רבות ולא יודעים לאיזה איבר במערך להתייחס...

אני לא ממש הבנתי למה אתה מתכוון, אבל שוב - זה קשה, זה סיוט, יכולים להיות התנגשויות -כן, אין ספק, אבל עדיין מצליחים לזהות טיפוסים שונים. לרוב ע"י המשתמש, ולא המתכנת, כלומר אם לדוג' בgdb - אתה תזהה בעצמך סטרינג ותייצג אותו עם x/s $0xaddress ולא x/i $0xaddress , או שתנסה את שניהם ותיראה מה יותר הגיוני, שוב - יש מצב ששניהם יתאימו וזה ידרוש עוד התאמה וניתוח, אבל עדיין זה קטע של הבנה מה יותר הגיוני.

ציטוט:

בשלב של האופטימיזציה, הקומפיילר יענו הופך ביטויים כמו:
קוד:
if (foo == 0)
לביטויים כמו:
קוד:
if (!foo)
מהבחינה של קוד האסמבלי?

לא, שלב האופטימיזציה זה שלב שבא אחרי שהתחלנו להפיק קוד שניראה דומה לאסמבלר, ואם ניקח דוגמא - למשל, יש לך את הקוד
קוד:
i = i + 1;
הוא לא יעשה
קוד:
add i,1
אלא
קוד:
inc i
ציטוט:

האם זהו ה- disassembler ? כלומר התוכנה שהופכת קוד מכונה לקוד אסמבלר?
יענו עם זה אתם מצליחים לדעת מהו קוד האסמבלי של תוכנית?
אבצע חיפוש והורדה, תודה.

כן, זה disassembler, הינה כמה ממש טובים : (לינוקס/ווינדוז):
http://www.eresi-project.org/ [זה בכלל פרוייקט ממש מושקע, חלק מהאדמינים עשו חלקים ממנו לתזה שלהם בתואר]
http://www.gnu.org/software/gdb/
http://www.kdbg.org/
http://www.microsoft.com/whdc/DevTo...ng/default.mspx
http://en.wikipedia.org/wiki/DTrace
יש עוד הרבה מאוד, כמו ollydbg שהוא מאוד קלאסי (וגם בה עם קוד מקור, מה שיותר שווה),
קשה למצוא היום דיסאסמבלר שהוא חופשי וגם טוב, IDE הוא אחד הטובים מבחינת דיקומפיילר (כלומר - מבצע גם ניתוח, ולא העברת של קוד מכונה לאסמבלר חופשי), אבל הוא לא קוד פתוח, kdbg הוא אחד הטובים וגם קוד פתוח, אפשר ללמוד ממנו הרבה מאוד.
אם יצא לך להסתכל בסורס (ואחרי יום או יומיים אתה תראה שזה לא קשה כזה להבין), אתה תראה שרוב הדיקומפיילרים מאוד דומים - קוראים את הקובץ לבאפר, ומתחילים לעבור עליו - בכל פעם שאוספים מספיק מידע - מוציאים את זה למבנה אחר.
מה ששונה מכל אחד הוא דרך הייצוג שלהם למבנה שיצא, או שיכנס. כדי להבין איך הם עוברים עליו אני מאוד מציע לך את intel architecture documentation [שאני אישית הדפסתי אותו בבצפר P: [ זה לא הרבה דפים, בערך 30 כל השאר זה סתם דברים שלא צריך כדי להבין את הקוד] ]

ציטוט:

בנוגע ל-GCC, הורדתי את זה (מקוה שהורדתי את הדבר הנכון) אבל לא הבנתי איך מפעילים את זה :s
יש לי gcc-4.3.2 אבל על איזה קובץ ללחוץ? אין אפילו readme שמדריך אותך :/
אז בסוף הורדתי ++Dev-C

אתה יודע שאתה צריך לקמפל אותו כדי להריץ, כן ? זה מאוד מייגע לדעתי לקמפל דבר כזה, אני מאוד ממליץ לך להוריד אחד עם package manager שהוא
אין על dev-cpp אם יותר נוח לך אפילו תשתמש בVS , כל אחד מה שהוא אוהב, הדבר היחיד שיהיה שונה זה האסמבלר, לפעמים הwarnings (אבל אלה דברים שאתה לא צריך )

---
עריכה וטיפה חפירה,
רק בשביל לתת טיפה עוד מידע, למי שלא יודע, הקוד עצמו לרוב לא נמצא במבנה ישיר, וחלק, flat במונחים טכניים, וזה ממש סיוט - תלוי בקומפיילר, וכאן זה סיוטו של כל כותב דיקומפיילר - להתחיל לנתח איפה הקוד מתחיל ואיפה הוא נגמר, VS עושה הרבה מאוד רעש למתכנת ולדבג תכנה כזו תהיה מאוד סיוט. כמו כן כל הקומפיילרים שואפים שיהיה alignment כך שרוב הפעמים אתם תראו שהגישה לebp/esp היא מאוד נורמאלית, ולפעמים משתנים שלוקחים 2 בתים לפעמים יקחו 6 או שמונה, תלוי בקומפיילר, בגירסא, וכ' (gcc הוסיפו ב2005/6 ערך canary לדוג', ב2007 הם הוסיפו הגנה אוטומטית לstack frames שלהם, שימוש שונה ברגיסטרים (הם אף פעם לא השתמשו בedx לדוג' לצרכים כאלו עד עכשיו))

---
עוד דבר, אחד ואחרון, מבטיח
gcc הוא לא רק קומפיילר לC , מה שהופך את הקוד שלו למאוד מסורבל ולא נקי, לכן אם איי פעם תנסה לעשות לו דיסאסמבלינג אתה תראה שזה מאוד קשה להבין אפילו איך הוא מתחיל (כלומר, מ .init / _init _ start וכ' ), הוא מוסיף הרבה מאוד sections (איך כותבים את זה בעברית?), שזקוקים לשפות אחרות כמו פורטראן וכ'.
יאללה, סיימתי.

אפשרויות משלוח הודעות

אתה לא יכול לפתוח אשכולות חדשים

אתה לא יכול להגיב לאשכולות

אתה לא יכול לצרף קבצים

אתה לא יכול לערוך את ההודעות שלך

קוד vB פעיל

סמיילים פעיל

קוד [IMG] פעיל

קוד HTML כבוי

כלי אשכול	חפש באשכול זה
הצג גירסת הדפסה שלח דף זה ב E-Mail	חפש באשכול זה: חיפוש מתקדם
מצבי תצוגה	דרג אשכול זה
עבור למצב לינארי מצב כלאיים עבור למצב משורשר	דרג אשכול זה:

הדף נוצר ב 0.06 שניות עם 10 שאילתות
צור קשר - Fresh - למעלה