آلفاشبکه بلاگ

جدیدترین پردازنده اینتل برای مراکز داده معرفی شد: 144 هسته با مصرف بهینه انرژی

پردازنده اینتل Sierra Forest با ۱۴۴ هسته مخصوص مراکز داده

معرفی Intel Xeon 6 «Sierra Forest»: معماری E-Core برای مقیاس‌پذیری و بهره‌وری در مراکز داده

اینتل در ژوئن ۲۰۲۴ خانوادهٔ Xeon 6 را معرفی کرد و با شاخهٔ Sierra Forest تمرکز خود را بر هسته‌های کم‌مصرف و متراکم (E-core) گذاشت. هدف اصلی ارائهٔ توان پردازشی بالا به‌ازای هر وات و هر رک برای بارهای کاریِ مقیاس‌پذیرِ ابری، سرویس‌های وب، میکروسرویس‌ها و زیرساخت‌های کانتینری است. Sierra Forest نخستین نسل از زئون‌های صرفاً E-core به‌شمار می‌آید. بسته به پلتفرم، تا ۱۴۴ هسته در یک سوکت (سری ۶۷۰۰E) موجود است. در گونهٔ بالاتر، تا ۲۸۸ هسته (سری‌های AP) را در اختیار می‌گذارد.

جایگاه معماری: E-core برای توان عملیاتی و چگالی

اینتل با Xeon 6 دو «مسیر»‌ را تفکیک کرد: مسیر E-core با Sierra Forest برای چگالی و بهره‌وری انرژی، و مسیر P-core با Granite Rapids برای بارهای حساس به تأخیر و کارایی تک‌هسته‌ای. همین تفکیک، امکان تطبیق دقیق‌تر سخت‌افزار با ماهیت بار کاری را فراهم می‌کند. به‌عنوان نمونه، سرویس‌های وبِ stateless، CDN، سرویس‌های API با ترافیک بالا و سرورهای کش به هسته‌های متعدد سبک نیاز دارند. در حالی‌که شبیه‌سازی‌ها، پایگاه‌داده‌های تحلیلیِ سنگین و استنتاج‌های پیچیدهٔ AI به هسته‌های قدرتمندتر P-core نیازمندند. اینتل در معرفی رسمی، Crestmont را به‌عنوان ریزمعماری هسته‌های E-core در Sierra Forest ذکر کرد. منابع فنی مانند Tom’s Hardware همین موضوع را تأیید می‌کنند.

ریزمعماری و سازمان‌دهی هسته‌ها

Sierra Forest برای رسیدن به چگالی بالای هسته‌ها، از E-coreهای تک‌ریسمانی بهره می‌گیرد. هسته‌ها در خوشه‌هایی با کشِ اشتراکی سازمان می‌یابند تا هزینهٔ سربارِ اشتراک داده کاهش یابد. این امر کارایی در بارهای موازی را افزایش می‌دهد. منابع فنی همچنین به پیکربندی کش سطح یک و دو و سه در سطح خوشه اشاره می‌کنند (L1 دستور و داده، و L2/L3 اشتراکی در سطح خوشه). هدف از این پیکربندی کاهش تأخیر میان هسته‌هایی است که داده‌های مشابه را دست‌به‌دست می‌کنند.

فناوری ساخت و پیامدهای انرژی

Sierra Forest روی فرآیند Intel 3 تولید می‌شود. این گرهٔ فرایندی بهبودهای محسوسی در کارایی بر واحد توان ارائه می‌کند. ارائه‌دهندگان خدمات ابری از این مزیت استفاده می‌کنند. آنها از تراکم بیشتر ماشین‌های مجازی یا پادهای Kubernetes در هر سوکت بهره می‌برند و هم‌زمان هزینهٔ انرژی و خنک‌سازی رک را کنترل می‌کنند. گزارش‌های روز معرفی تمرکز پررنگ اینتل بر بازده انرژی را نشان می‌دهد. همچنین، بهبودهای کارایی/وات را در رده‌های کاری وب، پایگاه‌داده و مدیا ترانسکدینگ مستند می‌کند.

پلتفرم‌ها، سوکت‌ها و مسیر مقیاس‌پذیری

اینتل دو پلتفرم سخت‌افزاری را هدف گرفته است:

  • Sierra Forest-SP (Beechnut City) با سوکت LGA-4710 برای بازار «اصلیِ سرور»؛ این بستر تا ۱۴۴ هسته، ۸ کانال DDR5، و در بسیاری از پیکربندی‌ها ۸۸ مسیر PCIe 5.0 را در اختیار می‌گذارد. سری Xeon 6 6700E روی همین بستر عرضه می‌شود.

  • Sierra Forest-AP (Avenue City) با سوکت LGA-7529 برای چگالی بسیار بالا؛ این بستر تا ۲۸۸ هسته و ۱۲ کانال DDR5 را پشتیبانی می‌کند و مسیرهای PCIe/CXL بیشتری ارائه می‌دهد.

دربارهٔ I/O، منابع رسمی اینتل برای Xeon 6 E-core به PCIe 5.0 و CXL 2.0 اشاره می‌کنند. بسته به کلاس سیستم (تعداد سوکت‌ها و نوع پلتفرم)، گزارش‌ها به ۹۶ مسیر PCIe 5.0 (و تا ۶۴ مسیر CXL 2.0) در مستندات اینتل و همچنین به ۸۸ یا ۱۳۶ مسیر PCIe 5.0 در گزارش‌های تحلیلی اشاره دارند. اعداد دقیق به بُرد، سوکت و پیکربندی بستگی دارد.

خطوط محصول و نمونه‌های مشخصات

سری Xeon 6 6700E چندین مدل را دربر می‌گیرد؛ از ۶۴ هسته تا ۱۴۴ هسته. فرکانس بوست این مدل‌ها عموماً در بازهٔ ~۲.۶ تا ~۳.۲ گیگاهرتز قرار می‌گیرد که برای کلاس «توان عملیاتیِ موازی» بهینه است. این وضعیت نسبت کارایی/وات را بالا نگه می‌دارد. رسانه‌های تخصصی از نمونه‌هایی مانند 6766E و 6780E به‌عنوان مدل‌های ۱۴۴ هسته‌ای یاد کرده‌اند. این مدل‌ها در سیستم‌های دو سوکته نیز به‌کار می‌روند.

نکتهٔ مهم برای برنامه‌ریزی ظرفیت: در بسیاری از بارهای کاری ابری، تعداد هستهٔ مؤثر و پایداری کارایی تحت بارهای همزمان از فرکانس تک‌هسته‌ای اهمیت بیشتری دارد. Sierra Forest با تک‌ریسمانی بودن هر هسته، پیش‌بینی‌پذیری زمان‌بندی را در محیط‌های چندمستاجری (multi-tenant) بهبود می‌دهد. همچنین از تداخل SMT بر سر منابع داخلی اجتناب می‌کند.

شتاب‌دهنده‌ها و قابلیت‌های امنیتی

خانوادهٔ Xeon 6 مجموعه‌ای از شتاب‌دهنده‌های درون‌تراشه‌ای را ارائه می‌کند؛ از جمله QAT برای رمزنگاری/فشرده‌سازی، IAA برای شتاب‌دهی آنالیتیک ستونی، DSA برای offload مسیرهای داده و DLB برای بالانس بار در صف‌ها. در مسیر E-core، این شتاب‌دهنده‌ها برای بارهای پردازش محتوا، CDN، سرویس‌های دیجیتال و دیتابیس‌های مقیاس‌پذیر ارزش عملی دارند. گزارش‌های روز معرفی همچنین به AVX-VNNI و AVX-IFMA در فهرست دستورالعمل‌ها اشاره می‌کنند. هرچند کلاس E-core در Sierra Forest از AVX-512 و AMX پشتیبانی نمی‌کند.

حافظه، CXL و اثرات روی ظرفیت

Sierra Forest-SP از DDR5 (۸ کانال) و گونهٔ AP از DDR5 (۱۲ کانال) بهره می‌گیرد. در کنار آن، CXL 2.0 مسیر استفاده از Type-3 Memory Expanderها را باز می‌کند تا در برخی سناریوها، ظرفیت حافظهٔ در دسترس افزایش یابد یا طبقه‌بندی حافظه (tiering) با هزینهٔ مالکیت پایین‌تر انجام شود. باید توجه داشت که بعضی قابلیت‌های «درهم‌نِویسی ناهمگون DDR+CXL» که در گونه‌های P-core دیده می‌شود، در مسیر E-core در همهٔ مدل‌ها در دسترس نیست؛ بنابراین تیم معماری باید قبل از اتکا به این ویژگی‌ها، سازگاری دقیق SKU و بُستر را بررسی کند.

بارهای کاری هدف و الگوهای استقرار

۱) سرویس‌های وب و میکروسرویس‌ها: سرورهای front-end، لایهٔ API و gatewayها معمولاً به تعداد زیاد نمونه‌های سبک و موازی نیاز دارند. با ۹۶ تا ۱۴۴ هسته در هر سوکت، اپراتور می‌تواند چگالی بالاترِ پادها (Pods) یا VMها را بدون افزایش مصرفِ سرور به‌ازای هر نمونه به‌دست آورد.

۲) کش و پایگاه‌داده‌های سبک: سرویس‌هایی مانند Redis/Memcached یا NoSQLهای سبک که به تأخیر قابل پیش‌بینی اهمیت می‌دهند، از نبود SMT و یکنواختی هسته‌ها سود می‌برند. ظرفیت هستهٔ بالا امکان پارتیشن‌بندی افقی را ساده‌تر می‌کند.

۳) مدیا ترانسکدینگ و سرویس‌های محتوا: گزارش‌های معرفی به بهبود محسوس کارایی/وات در ترانسکدینگ اشاره می‌کنند. هنگامی که ده‌ها استریم همزمان روی یک نود پردازش می‌شود، بهره‌وری انرژیِ E-core به صرفه‌جویی محسوس در هزینهٔ برق/خنک‌سازی منجر می‌شود.

۴) لبهٔ شبکه و CDN: نقاط لبه به نودهایی با مصرف پایین، چگالی بالا و سرویس‌دهی موازی نیاز دارند. Sierra Forest با مسیرهای PCIe 5.0 و پشتیبانی از NICهای پرسرعت در این سناریو جای می‌گیرد.

انتخاب بین Sierra Forest و رقبا/گزینه‌های دیگر

  • درون خانوادهٔ Xeon 6: اگر بار کاری به تأخیر بسیار پایین و کارایی تک‌هسته‌ای وابسته است (مثلاً برخی پایگاه‌داده‌های تحلیلیِ سنگین یا بعضی مسیرهای استنتاج AI)، Granite Rapids (P-core) گزینهٔ مناسب‌تری به‌شمار می‌آید. اگر هدف توان عملیاتی موازی، ابرِ مقیاس‌پذیر و هزینهٔ پایین به‌ازای هر vCPU است، Sierra Forest برتری دارد.

  • در برابر AMD EPYC و Ampere: AMD با Bergamo/‌Turin-c به حوزهٔ چگالی هسته وارد شده است. در بسیاری از نمونه‌کارها، انتخاب نهایی به سیاست مجوزدهی نرم‌افزار (به‌ازای هسته یا سوکت)، ویژگی‌های پلتفرم (کانال حافظه، مسیرهای PCIe/CXL)، و ردپای حرارتی بستگی دارد. گزارش‌های بازار نشان می‌دهند که اینتل با ارائهٔ مسیر E-core و P-core در یک برند مشترک، سبد محصولی منسجم‌تری به مشتریان سازمانی می‌دهد.

جنبه‌های عملی برای طراحی ظرفیت

  • چگالی در رک: نسبت «ماشین/هسته» را با توجه به پروفایل استفادهٔ واقعی اندازه‌گیری کنید. بسیاری از تیم‌ها با نسبت ۱:۱ vCPU به هستهٔ فیزیکی در بارهای حساس به پایداری شروع می‌کنند و سپس به‌صورت کنترل‌شده oversubscription را بررسی می‌کنند.

  • TDP و بودجهٔ خنک‌سازی: مدل‌های ۱۴۴ هسته‌ایِ سری ۶۷۰۰E در بازهٔ حدود ۲۵۰ تا ۳۳۰ وات قرار می‌گیرند. جدول توان رک و مسیر هوادهی را پیش از یکپارچه‌سازی ارزیابی کنید.

  • I/O و NIC: اگر به چندین NIC/‌DPU با پهنای باند بالا نیاز دارید، ظرفیت PCIe 5.0 و CXL 2.0 هر پلتفرم را با محدودیت‌های مادربرد تطبیق دهید؛ در پلتفرم‌های AP مسیرهای بیشتری در دسترس قرار می‌گیرد.

  • حافظه: در گونهٔ SP، ۸ کانال DDR5، و در AP، ۱۲ کانال دارید. نسبت «هسته به کانال» را برای بارهای پرمصرف حافظه (in-memory) جدی بگیرید.

نقشهٔ راه: Clearwater Forest و گرهٔ 18A

پس از Sierra Forest، اینتل Clearwater Forest را به‌عنوان نسل بعدی E-core در نقشهٔ راه قرار داده است. این محصول با گرهٔ 18A و فناوری‌هایی مانند RibbonFET و PowerVia عرضه می‌شود. هدف از آن بهبود چگالی و کارایی/وات در مقیاس انبوه است. گزارش‌های صنعتی بازهٔ ۲۰۲۶ را برای عرضهٔ گستردهٔ آن مطرح می‌کنند. برای تیم‌های برنامه‌ریزی ظرفیت، این موضوع به‌معنای مسیر ارتقای پایدار در همان فلسفهٔ «چگالی/بهره‌وری» است.

جمع‌بندی

Intel Xeon 6 «Sierra Forest» با تمرکز بر E-core‌ها، ردهٔ «توان عملیاتی موازی» را هدف می‌گیرد و به اپراتورهای ابری امکان می‌دهد تعداد نمونه‌های سرویس را در هر نود افزایش دهند و هم‌زمان مصرف انرژی را مدیریت کنند. دو پلتفرم SP (تا ۱۴۴ هسته) و AP (تا ۲۸۸ هسته)، انعطاف لازم را برای مقیاس‌پذیری فراهم می‌کنند؛ DDR5، PCIe 5.0 و CXL 2.0 نیز بستر اتصال به شتاب‌دهنده‌ها، NICها و توسعهٔ حافظه را مهیا می‌سازند. در سناریوهایی که کارایی تک‌هسته‌ای و تأخیر پایین نقش حیاتی دارد، شاخهٔ Granite Rapids در خانوادهٔ Xeon 6 انتخاب دقیق‌تری خواهد بود؛ اما برای وب در مقیاس عظیم، میکروسرویس‌ها، CDN و پردازش موازی سبک، Sierra Forest توازن مناسبی بین چگالی هسته، پیش‌بینی‌پذیری کارایی و هزینهٔ مالکیت ارائه می‌کند.