جدیدترین پردازنده اینتل برای مراکز داده معرفی شد: 144 هسته با مصرف بهینه انرژی

معرفی Intel Xeon 6 «Sierra Forest»: معماری E-Core برای مقیاسپذیری و بهرهوری در مراکز داده
اینتل در ژوئن ۲۰۲۴ خانوادهٔ Xeon 6 را معرفی کرد و با شاخهٔ Sierra Forest تمرکز خود را بر هستههای کممصرف و متراکم (E-core) گذاشت. هدف اصلی ارائهٔ توان پردازشی بالا بهازای هر وات و هر رک برای بارهای کاریِ مقیاسپذیرِ ابری، سرویسهای وب، میکروسرویسها و زیرساختهای کانتینری است. Sierra Forest نخستین نسل از زئونهای صرفاً E-core بهشمار میآید. بسته به پلتفرم، تا ۱۴۴ هسته در یک سوکت (سری ۶۷۰۰E) موجود است. در گونهٔ بالاتر، تا ۲۸۸ هسته (سریهای AP) را در اختیار میگذارد.
جایگاه معماری: E-core برای توان عملیاتی و چگالی
اینتل با Xeon 6 دو «مسیر» را تفکیک کرد: مسیر E-core با Sierra Forest برای چگالی و بهرهوری انرژی، و مسیر P-core با Granite Rapids برای بارهای حساس به تأخیر و کارایی تکهستهای. همین تفکیک، امکان تطبیق دقیقتر سختافزار با ماهیت بار کاری را فراهم میکند. بهعنوان نمونه، سرویسهای وبِ stateless، CDN، سرویسهای API با ترافیک بالا و سرورهای کش به هستههای متعدد سبک نیاز دارند. در حالیکه شبیهسازیها، پایگاهدادههای تحلیلیِ سنگین و استنتاجهای پیچیدهٔ AI به هستههای قدرتمندتر P-core نیازمندند. اینتل در معرفی رسمی، Crestmont را بهعنوان ریزمعماری هستههای E-core در Sierra Forest ذکر کرد. منابع فنی مانند Tom’s Hardware همین موضوع را تأیید میکنند.
ریزمعماری و سازماندهی هستهها
Sierra Forest برای رسیدن به چگالی بالای هستهها، از E-coreهای تکریسمانی بهره میگیرد. هستهها در خوشههایی با کشِ اشتراکی سازمان مییابند تا هزینهٔ سربارِ اشتراک داده کاهش یابد. این امر کارایی در بارهای موازی را افزایش میدهد. منابع فنی همچنین به پیکربندی کش سطح یک و دو و سه در سطح خوشه اشاره میکنند (L1 دستور و داده، و L2/L3 اشتراکی در سطح خوشه). هدف از این پیکربندی کاهش تأخیر میان هستههایی است که دادههای مشابه را دستبهدست میکنند.
فناوری ساخت و پیامدهای انرژی
Sierra Forest روی فرآیند Intel 3 تولید میشود. این گرهٔ فرایندی بهبودهای محسوسی در کارایی بر واحد توان ارائه میکند. ارائهدهندگان خدمات ابری از این مزیت استفاده میکنند. آنها از تراکم بیشتر ماشینهای مجازی یا پادهای Kubernetes در هر سوکت بهره میبرند و همزمان هزینهٔ انرژی و خنکسازی رک را کنترل میکنند. گزارشهای روز معرفی تمرکز پررنگ اینتل بر بازده انرژی را نشان میدهد. همچنین، بهبودهای کارایی/وات را در ردههای کاری وب، پایگاهداده و مدیا ترانسکدینگ مستند میکند.
پلتفرمها، سوکتها و مسیر مقیاسپذیری
اینتل دو پلتفرم سختافزاری را هدف گرفته است:
-
Sierra Forest-SP (Beechnut City) با سوکت LGA-4710 برای بازار «اصلیِ سرور»؛ این بستر تا ۱۴۴ هسته، ۸ کانال DDR5، و در بسیاری از پیکربندیها ۸۸ مسیر PCIe 5.0 را در اختیار میگذارد. سری Xeon 6 6700E روی همین بستر عرضه میشود.
-
Sierra Forest-AP (Avenue City) با سوکت LGA-7529 برای چگالی بسیار بالا؛ این بستر تا ۲۸۸ هسته و ۱۲ کانال DDR5 را پشتیبانی میکند و مسیرهای PCIe/CXL بیشتری ارائه میدهد.
دربارهٔ I/O، منابع رسمی اینتل برای Xeon 6 E-core به PCIe 5.0 و CXL 2.0 اشاره میکنند. بسته به کلاس سیستم (تعداد سوکتها و نوع پلتفرم)، گزارشها به ۹۶ مسیر PCIe 5.0 (و تا ۶۴ مسیر CXL 2.0) در مستندات اینتل و همچنین به ۸۸ یا ۱۳۶ مسیر PCIe 5.0 در گزارشهای تحلیلی اشاره دارند. اعداد دقیق به بُرد، سوکت و پیکربندی بستگی دارد.
خطوط محصول و نمونههای مشخصات
سری Xeon 6 6700E چندین مدل را دربر میگیرد؛ از ۶۴ هسته تا ۱۴۴ هسته. فرکانس بوست این مدلها عموماً در بازهٔ ~۲.۶ تا ~۳.۲ گیگاهرتز قرار میگیرد که برای کلاس «توان عملیاتیِ موازی» بهینه است. این وضعیت نسبت کارایی/وات را بالا نگه میدارد. رسانههای تخصصی از نمونههایی مانند 6766E و 6780E بهعنوان مدلهای ۱۴۴ هستهای یاد کردهاند. این مدلها در سیستمهای دو سوکته نیز بهکار میروند.
نکتهٔ مهم برای برنامهریزی ظرفیت: در بسیاری از بارهای کاری ابری، تعداد هستهٔ مؤثر و پایداری کارایی تحت بارهای همزمان از فرکانس تکهستهای اهمیت بیشتری دارد. Sierra Forest با تکریسمانی بودن هر هسته، پیشبینیپذیری زمانبندی را در محیطهای چندمستاجری (multi-tenant) بهبود میدهد. همچنین از تداخل SMT بر سر منابع داخلی اجتناب میکند.
شتابدهندهها و قابلیتهای امنیتی
خانوادهٔ Xeon 6 مجموعهای از شتابدهندههای درونتراشهای را ارائه میکند؛ از جمله QAT برای رمزنگاری/فشردهسازی، IAA برای شتابدهی آنالیتیک ستونی، DSA برای offload مسیرهای داده و DLB برای بالانس بار در صفها. در مسیر E-core، این شتابدهندهها برای بارهای پردازش محتوا، CDN، سرویسهای دیجیتال و دیتابیسهای مقیاسپذیر ارزش عملی دارند. گزارشهای روز معرفی همچنین به AVX-VNNI و AVX-IFMA در فهرست دستورالعملها اشاره میکنند. هرچند کلاس E-core در Sierra Forest از AVX-512 و AMX پشتیبانی نمیکند.
حافظه، CXL و اثرات روی ظرفیت
Sierra Forest-SP از DDR5 (۸ کانال) و گونهٔ AP از DDR5 (۱۲ کانال) بهره میگیرد. در کنار آن، CXL 2.0 مسیر استفاده از Type-3 Memory Expanderها را باز میکند تا در برخی سناریوها، ظرفیت حافظهٔ در دسترس افزایش یابد یا طبقهبندی حافظه (tiering) با هزینهٔ مالکیت پایینتر انجام شود. باید توجه داشت که بعضی قابلیتهای «درهمنِویسی ناهمگون DDR+CXL» که در گونههای P-core دیده میشود، در مسیر E-core در همهٔ مدلها در دسترس نیست؛ بنابراین تیم معماری باید قبل از اتکا به این ویژگیها، سازگاری دقیق SKU و بُستر را بررسی کند.
بارهای کاری هدف و الگوهای استقرار
۱) سرویسهای وب و میکروسرویسها: سرورهای front-end، لایهٔ API و gatewayها معمولاً به تعداد زیاد نمونههای سبک و موازی نیاز دارند. با ۹۶ تا ۱۴۴ هسته در هر سوکت، اپراتور میتواند چگالی بالاترِ پادها (Pods) یا VMها را بدون افزایش مصرفِ سرور بهازای هر نمونه بهدست آورد.
۲) کش و پایگاهدادههای سبک: سرویسهایی مانند Redis/Memcached یا NoSQLهای سبک که به تأخیر قابل پیشبینی اهمیت میدهند، از نبود SMT و یکنواختی هستهها سود میبرند. ظرفیت هستهٔ بالا امکان پارتیشنبندی افقی را سادهتر میکند.
۳) مدیا ترانسکدینگ و سرویسهای محتوا: گزارشهای معرفی به بهبود محسوس کارایی/وات در ترانسکدینگ اشاره میکنند. هنگامی که دهها استریم همزمان روی یک نود پردازش میشود، بهرهوری انرژیِ E-core به صرفهجویی محسوس در هزینهٔ برق/خنکسازی منجر میشود.
۴) لبهٔ شبکه و CDN: نقاط لبه به نودهایی با مصرف پایین، چگالی بالا و سرویسدهی موازی نیاز دارند. Sierra Forest با مسیرهای PCIe 5.0 و پشتیبانی از NICهای پرسرعت در این سناریو جای میگیرد.
انتخاب بین Sierra Forest و رقبا/گزینههای دیگر
-
درون خانوادهٔ Xeon 6: اگر بار کاری به تأخیر بسیار پایین و کارایی تکهستهای وابسته است (مثلاً برخی پایگاهدادههای تحلیلیِ سنگین یا بعضی مسیرهای استنتاج AI)، Granite Rapids (P-core) گزینهٔ مناسبتری بهشمار میآید. اگر هدف توان عملیاتی موازی، ابرِ مقیاسپذیر و هزینهٔ پایین بهازای هر vCPU است، Sierra Forest برتری دارد.
-
در برابر AMD EPYC و Ampere: AMD با Bergamo/Turin-c به حوزهٔ چگالی هسته وارد شده است. در بسیاری از نمونهکارها، انتخاب نهایی به سیاست مجوزدهی نرمافزار (بهازای هسته یا سوکت)، ویژگیهای پلتفرم (کانال حافظه، مسیرهای PCIe/CXL)، و ردپای حرارتی بستگی دارد. گزارشهای بازار نشان میدهند که اینتل با ارائهٔ مسیر E-core و P-core در یک برند مشترک، سبد محصولی منسجمتری به مشتریان سازمانی میدهد.
جنبههای عملی برای طراحی ظرفیت
-
چگالی در رک: نسبت «ماشین/هسته» را با توجه به پروفایل استفادهٔ واقعی اندازهگیری کنید. بسیاری از تیمها با نسبت ۱:۱ vCPU به هستهٔ فیزیکی در بارهای حساس به پایداری شروع میکنند و سپس بهصورت کنترلشده oversubscription را بررسی میکنند.
-
TDP و بودجهٔ خنکسازی: مدلهای ۱۴۴ هستهایِ سری ۶۷۰۰E در بازهٔ حدود ۲۵۰ تا ۳۳۰ وات قرار میگیرند. جدول توان رک و مسیر هوادهی را پیش از یکپارچهسازی ارزیابی کنید.
-
I/O و NIC: اگر به چندین NIC/DPU با پهنای باند بالا نیاز دارید، ظرفیت PCIe 5.0 و CXL 2.0 هر پلتفرم را با محدودیتهای مادربرد تطبیق دهید؛ در پلتفرمهای AP مسیرهای بیشتری در دسترس قرار میگیرد.
-
حافظه: در گونهٔ SP، ۸ کانال DDR5، و در AP، ۱۲ کانال دارید. نسبت «هسته به کانال» را برای بارهای پرمصرف حافظه (in-memory) جدی بگیرید.
نقشهٔ راه: Clearwater Forest و گرهٔ 18A
پس از Sierra Forest، اینتل Clearwater Forest را بهعنوان نسل بعدی E-core در نقشهٔ راه قرار داده است. این محصول با گرهٔ 18A و فناوریهایی مانند RibbonFET و PowerVia عرضه میشود. هدف از آن بهبود چگالی و کارایی/وات در مقیاس انبوه است. گزارشهای صنعتی بازهٔ ۲۰۲۶ را برای عرضهٔ گستردهٔ آن مطرح میکنند. برای تیمهای برنامهریزی ظرفیت، این موضوع بهمعنای مسیر ارتقای پایدار در همان فلسفهٔ «چگالی/بهرهوری» است.
جمعبندی
Intel Xeon 6 «Sierra Forest» با تمرکز بر E-coreها، ردهٔ «توان عملیاتی موازی» را هدف میگیرد و به اپراتورهای ابری امکان میدهد تعداد نمونههای سرویس را در هر نود افزایش دهند و همزمان مصرف انرژی را مدیریت کنند. دو پلتفرم SP (تا ۱۴۴ هسته) و AP (تا ۲۸۸ هسته)، انعطاف لازم را برای مقیاسپذیری فراهم میکنند؛ DDR5، PCIe 5.0 و CXL 2.0 نیز بستر اتصال به شتابدهندهها، NICها و توسعهٔ حافظه را مهیا میسازند. در سناریوهایی که کارایی تکهستهای و تأخیر پایین نقش حیاتی دارد، شاخهٔ Granite Rapids در خانوادهٔ Xeon 6 انتخاب دقیقتری خواهد بود؛ اما برای وب در مقیاس عظیم، میکروسرویسها، CDN و پردازش موازی سبک، Sierra Forest توازن مناسبی بین چگالی هسته، پیشبینیپذیری کارایی و هزینهٔ مالکیت ارائه میکند.