שתף קטע נבחר

סקירה: מעבד ארבע ליבות של אינטל - חלק ב'

האם מעבד הגיימרים QX6700 מצדיק את מחירו הגבוה ומציע ערך מוסף אמיתי בהרצת משחקים? כמה רחוק מאחוריו ניצבת הגירסה המוזלת, Q6600? ומה עושים עם הרעש הבלתי נסבל של מערכת הקירור?

בכתבה הקודמת הצגנו את המעבדים החדשים של אינטל, Core 2 Extreme QX6700 ו- Core 2 Extreme Q6600 (שהכרזתו הרשמית צפויה לתחילת השנה). הצגנו גם את מערכת הבדיקה שלנו, עליה יתבססו תוצאות המבחנים שנציג הפעם.

 

כתבה זו, יחד עם קודמתה, הן תקציר של הכתבה "ככה זה כשיש ארבע" שפורסמה במקור באתר HWZone. מפאת קוצר היריעה, בחרנו להביא כאן תמצית של תוצאות המבחנים. את התוצאות המלאות ניתן למצוא בכתבה המקורית.

 

המבחנים בהם השתמשנו

מטרתם של מבחני ביצועים כמו אלו שערכנו, היא להראות את השפעת המעבד על הביצועים הסופיים של התצורה השלמה. בהמשך נתייחס באופן ספציפי למאפיינים של כל אחד מהמבחנים ברשימה שלהלן (בכתבה המקורית ב-HWZone אפשר למצוא הרחבה נוספת). בינתיים נדגיש את החלוקה הכללית של סוגי המבחנים.

 

ראשית, ישנם מבחנים שונים שבודקים יכולות שונות של המעבד ושל המערכת השלמה. חלק מהמבחנים שאת תוצאותיהם נציג כאן בודקים באופן ספציפי יכולות שקשורות להרצת תלת-מימד ומשחקים, דחיסת קבצים, יישומים מדעיים ועוד. אחרים מנסים להעריך את הביצועים הכוללים של המחשב.

 

חלק מהמבחנים בהם השתמשנו הם מבחני יישומים המבוססים על קוד אמיתי של תוכנות פופולריות, במטרה להעריך במדוייק את הביצועים הצפויים בהרצה שלהן. אחרים, הם מבחנים סינתטיים שבנויים מקוד "פיקטיבי" שאמור לדמות את הפעולה של תוכנות כאלו. הם מספקים אינדיקציה כללית, פחות מדוייקת, אבל חושפים לעיתים יכולות של החומרה שהיישומים הקיימים עדיין לא מנצלים במלואן.

 

רשימת המבחנים בהם השתמשנו:

  • SiSoft Sandra 2007
  • ScienceMark 2.0
  • SuperPi 1.5
  • Cinebench 9.5
  • PCMark 2005
  • SYSMark 2004 SE
  • WinRAR 3.6
  • 3DMark 2001
  • 3DMark 2006
  • Counter Strike: Source VST
  • F.E.A.R Multiplayer Demo
  • Doom 3
  • Quake 4
  • Half Life 2: Episode 1
  • Far Cry
  • Battlefield 2
  • Call Of Duty 2

 

תוצאות המבחנים

SiSoft Sandra 2007. בתוצאות מבחני המעבד שמבצעת התוכנה הזו קל לראות שמדובר במעבד שונה. QX6700 וגם Q6600, השיגו תוצאות כמעט כפולות מה-Core 2 X6800 הדו-ליבתי. בכל אופן, המבחנים של Sandra הם "סינתטיים", ולכן יכולים לספק אינדיקציה חלקית ולא מדוייקת על ההבדלים האמיתיים בביצועים בזמן-אמת.

 

בבדיקות רוחב הפס וה-Latency לזיכרון קיבלנו, שלא במפתיע, תוצאות כמעט זהות.

זה בעיקר משום שבקר הזיכרון בו הם משתמשים זהה, ונמצא בערכת השבבים, על הלוח.

 

PCMark 2005 ו-BAPCO SYSMark2004. שני המבחנים האלה מזכירים מאד את המבחנים של Sandra, אבל אמורים להיות קצת יותר מתוחכמים. PCMark מבית FutureMark , כולל בין השאר התייחסות לביצועים במצבי ריבוי משימות. מבחן SYSMark של BAPCO, מדמה לא רק התנהגות של יישומים משרדיים, בהם אין צורך בעיבוד מקבילי, אלא גם יישומי עיבוד תמונה, וידאו ותלת-מימד, בהם העיבוד המקבילי מתבקש. בכל אופן, בשני המבחנים קיבלנו תוצאות דומות מאד: מעבדי ה-Quad לא היו עדיפים על מעבדי Core 2 Duo בשום צורה.

 

ScienceMark 2.0. במבחן הזה, המדמה יישומים מדעיים אופייניים (סימולציות של קירובים מתמטיים ומצבים פיזיקליים, קידוד), קיווינו לראות ניצול יעיל של ארבע הליבות. בפועל, קיבלנו מהמעבדים הדו-ליבתיים והארבע-ליבתיים תוצאות דומות, משום שבשני המקרים התוכנה ניצלה רק ליבה אחת.

 

Cinebench. המבחן הזה מבצע הדמיה של עיבוד תמונה תלת-מימדי, בדומה לזה שנעשה בתוכנות כמו 3D Studio Max ו-Maya. אחד היתרונות שלו עבורנו, היא האפשרות לבחון שימוש ביותר מליבה אחת לביצוע Rendering של גופים וטקסטורות.

 

כאן ציפינו לראות יתרון משמעותי של מעבדי ה-Quad ולא התאכזבנו: בביצוע באמצעות ליבה

 אחת (1 CPU) הם אמנם הציגו ביצועים פושרים קצת, אבל בביצוע מרובה-הליבות (X CPUs) הם הציגו ביצועים טובים עד 60 אחוז ממעבדי Core 2 Duo.

 

WinRAR 3.6. המבחן המבוסס על תוכנת הדחיסה הפופולרית, בגירסה חדשה שמנצלת את ריבוי-הליבות, הצליח לסחוט ממעבדי ה-Quad שיפור ביצועים של כ-50 אחוזים.

 

כפי שניתן לראות בתמונה, WinRAR יודעת לנצל את כל ארבע הליבות, למרות שלא בצורה מושלמת.  

 

3DMark 2001, 3DMark 2006. מבחני הביצועים לתלת-מימד מבית FutureMark מספקים, כמעט מזה עשור, אינדיקציה טובה ליכולות של כרטיסים גרפיים, לוחות-אם ומעבדים, שמאפשרת לנחש כיצד יריצו משחקים חדשים.

 

בחרנו להריץ לא רק את גירסה 2006 העדכנית, אלא גם את גירסה 2001 שמושפעת יותר מביצועי המעבד ופחות מביצועי הכרטיס הגרפי.

 

להפתעתנו, התוצאות שקיבלו QX6700 ו-E6700 בגירסת 2001 היו נחותות מאלו של מעבדי Core 2 Duo. מבחני 3DMark 2006 דווקא הצליחו לנצל את הליבות הנוספות, מה שהתבטא בתוצאות גבוהות ב-45 עד 60 אחוזים במבחן המעבד (אם כי בתוצאה הסופית, כפי שניתן לראות, אין לכך ביטוי רב).

 

F.E.A.R Multiplayer Demo. המשחק הזה אמור לתמוך בריבוי ליבות, אבל במבחן

 המבוסס עליו גילינו שהוא עושה שימוש רק בשתי ליבות מתוך הארבע ולא מנצל את היכולות של מעבדי ה-Quad.

 

Doom 3. המשחק הפופולרי הפיק מהליבות הנוספות שיפור מינורי של פחות מ-5 אחוזים בביצועים.

 

משחקים נוספים. Quake 4 שמבוסס על אותו מנוע משחק של חברת ID Software, כמו Doom 3, ואמור לנצל את ריבוי הליבות, עשה זאת בצורה חלקית.

 

הוא השתמש בשתי ליבות בלבד, ומדי פעם בליבה שלישית. התקורה של חלוקת העומסים הביאה בסופו של דבר לכך שמעבדי ה-Quad הפגינו ביצועים נמוכים ב-2 עד 5 אחוזים ממעבדי ה-Duo.

 

ב-Call Of Duty 2 וב-Half Life 2: Episode 1 נתקלנו בתופעה דומה.

 ב-Battlefield 2 וב-Far Cry התוצאות הייתה גרועות עוד יותר: ירידה של 7-20 אחוזים בביצועים למעבדי ה-Quad Core בהשוואה לדגמים הדו-ליבתיים.

 

הביצועים באוברקלוקינג

אוברקלוקינג של מעבד רב-ליבתי הוא מעניין במיוחד, משום שכל הגדלה של התדר מוכפלת פי כמה - בהתאם למספר הליבות. שיפור הביצועים יכול להיות גדול, אבל מדובר במשימה מורכבת, גם למעבד וגם למערכת הקירור.

 

את האוברקלוקינג ביצענו על גבי לוח ה-Bad Axe 2 של אינטל, כמו את שאר הבדיקות, אך את גוף הקירור שקיבלנו עם המעבד החלפנו ב-Big Typhoon VX שהוכיח את עצמו מאד בבדיקות הקודמות שלנו.

 

השתמשנו במכפיל המקורי של המעבד (x10) והצלחנו להעלות את תדר ה-FSB עד ל-370MHz. זו הייתה המהירות הגבוהה ביותר בה המחשב הצליח לאתחל אבל פעולתו הייתה מאד לא יציבה (תמונה מצד ימין).

  

הורדנו מעט את תדר המעבד והגענו ל-3650MHz. כמעט GHz שלם מעל לתדר המקורי, ואם מכפילים בארבע הליבות יוצא שקיבלנו תוספת שוות ערך כמעט למעבד E6400.

 

עד כמה התוספות הזו השפיעה? ב-Super Pi, כמו במבחן במהירות השעון הרגילה, לא ראינו הבדל ניכר. ב-CineBench זכינו בקיצוץ של 2 שניות נוספות בזמן הביצוע (15 אחוז ביצועים). ב-3DMark 2006 השיפור היה גדול עוד יותר: 1300 נקודות, שהן כמעט 20 אחוזי שיפור.

 

השתמשנו באוברקלוקינג גם כדי לבדוק את הטענה של אינטל, שארכיטקטורת אפיק הזיכרון שלה אינה מהווה צוואר בקבוק עבור מעבדי ה-Quad: האצנו את תדר ה-FSB ל-1333MHz, בלי להעלות את תדר המעבד או הזיכרון. כעת, בדקנו את ההשפעה בשתי תוכנות שעושות שימו בכל בכל ליבות המעבד: CineBench ו-WinRAR.

 

בראשונה השיפור היה זניח. בשנייה הוא היה גדול יותר, אבל עדיין לא משמעותי. המסקנה שלנו היא שאינטל צודקת: רוחב הפס של אפיק ה-FSB מספיק, בינתיים, גם למעבדי ה-Quad החדשים.

 

הספק, חום ואוורור

ההספק הממוצע של מעבדי Core 2 Quad עומד על כ-130 וואט, בדיוק פי שניים ממעבד Core 2 Duo ממוצע. זה אומר גם פליטת חום כפולה, והפתרון של אינטל היה להאיץ את מהירות המאוורר לכ-4000rpm (לעומת 200-2500rpm במאוורר שמגיע עם מעבדי ה-Core 2 Duo).

 

זה עובד, אבל המחיר הוא רעש בלתי נסבל. המערכת שהרצנו כללה גם כרטיס גרפי מסוג X1900XTX עם הקירור המקורי של ATI, שנבחר אינספור פעמים כרועש ביותר בתעשייה. המאוורר של אינטל הצליח להאפיל עליו. לכן עברנו להשתמש ב-Big Typhoon VX. מלבד המנוחה לאוזניים, אפשר לראות את השיפור הניכר בטמפרטורות.

 

בדקנו גם את ההספק בפועל, כדי להעריך איזה ספק דרוש לחיה מרובעת-הליבות. את הבדיקה ערכנו ללא עומס על הכרטיס הגרפי, תוך שימוש בתוכנת SP2004 כדי להעמיס עבודה על המעבד בלבד. בדקנו את צריכת ההספק בשלושה מצבים: ללא עומס כלל (פעולה רגילה), עומס על שתי ליבות בלבד (דימוי מעבד דו-ליבתי רגיל מסדרת ה-Core 2 Duo) ועומס מלא על כל ארבע הליבות.

 

במצב של עומס מלא, המעבד צרך פחות או יותר 130 וואט והמערכת כולה הגיעה לכ-250 וואט. אבל אם מוסיפים לכך כרטיס גרפי ומספר דיסקים קשיחים, אפשר להגיע במצבים קיצונים בקלות לצריכה של 600 וואט.

 

ניצול זיכרון המטמון

מאפיין מרכזי בעיצוב של מעבדי ה-Quad, המשפיע רבות על הביצועים, הוא אופן השימוש בזיכרון המטמון (L2 Cache). כאשר כפולי הליבה הראשונים הגיעו לשוק, הביקורת היתה שרוב היישומים לא מותאמים לעיבוד מקבילי מרובה נימים (Multi-threaded).

 

כיום השאלה הזו שוב עולה. חלק גדול מהיישומים לא בנויים לריבוי-ליבות. גם אלה שמפתחיהם חילקו את הקוד שלהם לשניים, כדי שיתאים למעבדים כפולי-ליבה, לא בהכרח ירוצו מהר יותר על מעבדים בני ארבע ליבות. יש שני פתרונות שמאפשרים להריץ יישומים כאלה טוב יותר על ה-Quad. הראשון: שני חלקי התוכנה ירוצו על אותו צמד-ליבות ויחלקו אותו זיכרון מטמון. השני: כל אחד מחלקי התוכנה ירוץ על צמד ליבות נפרד, וייהנה מכמות כפולה של מטמון זמין.

 

לטובת היישומים שהותאמו כבר למעבדים כפולי-ליבה, בחרה אינטל באפשרות 2 - כדי להבטיח שתהיה להם גישה לזיכרון מטמון גדול יותר. החיסרון של הפתרון הזה הוא שהוא אינו מנצל את תכונת ה-Smart Cache, המאפשרת לכל זוג ליבות להחליף נתונים ישירות. כאשר שני קטעי הקוד רצים על ליבות ששייכות לזוגות נפרדים, התקשורת בין הליבות המבצעות את העיבוד היא דרך אפיק ה-FSB.

 

זה פתרון איטי יותר, שגם פוגע ברוחב-הפס הזמין של אפיק ה-FSB לתקשורת בין המעבד לזיכרון. חבל שאינטל לא בחרה להפיץ דרייבר למעבד, שהיה בוחן אילו אפליקציות רצות במערכת ההפעלה בכל רגע נתון והיה מחליט איך להריץ אותן - על זוג ליבות צמוד או על ליבות נפרדות.

 

סיכום ומסקנות

על רקע התוצאות במבחני הביצועים, מתבקשת השאלה: מדוע אינטל טרחה להציג את המעבדים האלה דווקא עכשיו. המסקנה העיקרית שלנו היא שמדובר קודם כל בהפגנת כוח. בשוק הביתי לפחות, אין דרישה אמיתית למוצרים האלה, ואם ב-IDF טרחה אינטל להדגיש את החשיבות של מוצר ה-Extreme הארבע-ליבתי לשוק הגיימרים, אז התוצאות שלנו משכנעות: לעת עתה זהו השוק שירוויח ממנו הכי פחות.

 

נכון לעכשיו, התועלת האמיתית של ה-Quad Core מחוץ לשרתים, היא בגרפיקה, קידוד ודחיסה. אלו התחומים בהם התוכנות יודעות היום לנצל את הליבות הנוספות. כמובן שזה עשוי להשתנות עם הזמן - לפני פחות משנה המצב עם המעבדים הדו-ליבתיים הרי היה דומה, ועם הזמן מפתחי המשחקים ילדו מן הסתם לנצל את ריבוי הליבות טוב יותר.

 

מה גם שהתמחור של Core 2 Extreme QX6700 סביב ה-1000 דולר, קרוב מאד לתמחור של X6800 הדו-ליבתי. אם אתם מתלבטים בין שני אלה, אז אין ספק ש-QX6700 הוא השקעה טובה יותר לטווח הארוך (כלומר: שנתיים או מקסימום שלוש שנים). 

 

לפנייה לכתב/ת
 תגובה חדשה
הצג:
אזהרה:
פעולה זו תמחק את התגובה שהתחלת להקליד
מומלצים