مقایسه پردازنده‌ها:

در بحث مربوط به مقایسه پردازنده‌ ، بسیاری بر این عقیده هستند که تراشه‌های به‌کار رفته در گوشی‌های جدیدِ هوشمند توانسته‌اند تا حدودی شکاف بین قدرت پردازشی دستگاه‌های ذکر شده و کامپیوترها و لپ‌تاپ‌ها را کم کنند.
مقایسه پردازنده های مورد استفاده در این دستگاه ها به طور کلی مقایسه صحیحی نیست.
اما در اینجا سعی شده با تمرکز بر معماری به‌کار رفته در پردازنده‌های مختلف، به درک درستی از طرز کار این پردازنده ها برسیم.
البته با توجه به وسعت این بحث فقط به بررسی برخی از مهم ترین ویژگی های آنها میپردازیم.

وقتی صحبت از موارد کاربریِ پردازنده به میان می‌آید، دستگاه های پر استفاده ای مثل سرورها، دستگاه‌های موبایل و کامپیوترهای خانگی به نظر می آید.
گستره‌ی کاربرد عبارت «موبایل» در حوزه‌ی IT نه‌تنها گوشی‌های هوشمند را شامل می‌شود.
بلکه لپ‌تاپ‌ها و نوت‌بوک‌ها را نیر در بر می‌گیرد.
از این‌رو در این مقاله موارد مذکور به‌طور کامل مورد ارزیابی قرار خواهند گرفت.
البته در ابتدا لازم است تا برای درک تفاوت موجود در پردازنده‌های مختلف، ماهیت پردازنده به‌صورت مختصر شرح دهیم.

پردازنده چیست و نحوه‌ی عملکرد آن چگونه است؟

پردازنده یا واحد پردازش مرکزیِ (CPU) مداری الکتریکی در بیشتر محصولات الکترونیکیِ هوشمند مثل کامپیوتر، گوشی‌های هوشمند، لپ‌تاپ‌ها و سرورها است.
این تراشه به واسطه‌ی انجام الگوریتم‌های پایه‌ای، کنترل و انجام عملیات ورودی/خروجیِ (I/O) مشخص‌شده، دستورالعمل‌های موجود در برنامه‌ها را انجام می‌دهد.
به بیان ساده عملکرد اساسی همه‌ی پردازنده‌ها، اجرای یک رشته از دستورالعمل‌های ذخیره شده است که به آن برنامه گفته می‌شود.
تقریبا تمامی پردازنده‌ها هنگام اجرای عملیات روی دستورالعمل‌ها از مراحل واکشی (fetch)، رمزگشایی (decode) و اجرا (execute) پیروی می‌کنند که در مجموع به‌عنوان سیکل کلاک شناخته می‌شود.

پس از اتمام مرحله‌ی اجرا برای یک دستورالعمل، کل فرایند‌ مذکور تکرار می‌شود.
در پردازنده‌ها حافظه‌هایی با نام ثبات (register) وجود دارد که سریع‌ترین تجهیزات ذخیره‌سازی در یک سیستم کامپیوتری محسوب می‌شوند.
ثباتی با نام شمارنده‌ی برنامه (program counter) در پردازنده‌ها، آدرس دستورالعمل بعدی در رشته‌ی دستورالعمل‌ها را به‌جهت استفاده‌ی پردازنده در خود ذخیره می‌کند.
درواقع شمارنده‌ی پردازنده دستورالعمل‌ها را از حافظه‌ی اصلی واکشی می‌کند.
در برنامه‌های کامپیوتری یا موبایلی، دستورالعملهایی از نوع انشعاب وجود دارد.
دستورالعمل‌های انشعاب شبیه به گزاره‌ی «اگر» برای یک پردازنده است.
اگر شرایطی برقرار باشد (If True)، یک مجموعه از دستورالعمل‌ها اجرا می‌شود و اگر آن شرایط برقرار نباشد (If False)، مجموعه دستورالعمل دیگری به اجرا گذارده می‌شود.
اگر دستورالعمل‌های یادشده اجرا شوند، شمارنده‌ی برنامه به‌گونه‌ای اصلاح می‌شود که دستورالعمل‌های صحیح را واکشی کند.

"نحوه

دستورالعمل واکشی‌شده از حافظه، مشخص می‌کند که پردازنده چه کاری را باید انجام دهد.
در مرحله‌ی رمزگشایی که به وسیله‌ی مدار معروف به رمزگشای دستورالعمل (instruction decoder) انجام می‌شود.
دستورالعمل‌ها به سیگنال‌هایی تبدیل می‌شوند که سایر قسمت‌های پردازنده را کنترل می‌کننند.
نحوه‌ی تفسیر دستورالعمل‌ها توسط معماری مجموعه دستورالعمل‌های پردازنده یا به‌اختصار ISA صورت می‌پذیرد.
پس از مراحل واکشی و رمزگشایی، مرحله‌ی اجرا انجام می‌گیرد.
بسته به معماری پردازنده، این روند ممکن است یک  یا چندین سیکل طول بکشد.

بیشتر پردازنده‌های مدرن مراحل معدود یادشده را برای افزایش بازدهی به دست‌کم ۲۰ مرحله‌ی ریزتر تقسیم می‌کنند.
به عبارت دیگر، هر چند یک پردازنده در هر چرخه‌ی کاری یا سیکل کلاک اجرای چندین دستورالعمل را شروع می‌کند.
ادامه می‌دهد و به سرانجام می‌رساند.
اما برای اجرای هر دستورالعمل از آغاز تا اتمام، ممکن است ۲۰ سیکل کلاک یا حتی بیشتر لازم باشد.
به چنین مدلی در اصطلاح یک پایپ‌لاین میگویند.
پر شدن یک خط لوله با مایع در جریان مدتی به طول می انجامد.
اما پس از آن یک خروجی پایدار و ثابت از آن سیال به دست می‌آید.
در پایپ‌لاین پردازنده، به‌جای مایع دستورالعمل‌ها به جریان می‌افتند.

حقیقت این است که فرکانس پردازشی و تعداد هسته‌ها، دیگر معیاری مناسب و شاخصی قابل‌اعتماد جهت ارزیابی قدرت پردازنده‌ها نیست.
حتی اعداد و ارقام به‌عمل آمده از شاخص‌های یادشده در گذشته نیز درک درستی از کارایی پردازنده‌ها ارائه نمیدادند.
حالا که پای این تراشه‌ها به دنیای گوشی‌های هوشمند بازشده، مقایسه‌ی پردازنده‌ها فقط با توجه بر تعداد هسته‌ها و فرکانس پردازشی اشتباهی محض است.

توان طراحی حرارتی و لیتوگرافی ساخت پردازنده:

آن‌چه که در حال حاضر به‌‌عنوان معیاری صحیح برای مقایسه‌ی پردازنده‌ها محسوب می‌شود، ترکیبی از توان طراحی حرارتی (TDP)، لیتوگرافی ساخت پردازنده، معماری به‌کار رفته در آن و مواردی از این دسته است.
توان طراحی حرارتی در پردازنده، میزان گرمای تولیدشده توسط پردازنده، کارت گرافیک و SoC (که به معنای سیستم روی تراشه است یا SoC، مداری یکپارچه از اجزای مختلف کامپیوتر از جمله پردازنده، کارت گرافیک و رم است) و مقدار توان لازم در سیستم خنک‌کننده جهت دفعِ آن است. در نگاه اول شاید این سؤال پیش آید که چرا لزوم استفاده از خنک‌کننده‌ای قدرت‌مندتر که در ظاهر نکته‌ای منفی در عملکرد پردازنده است.
عاملی مهم در میزان کارایی پردازنده محسوب می‌شود؟
درواقع بالا رفتن TDP نشان‌دهنده‌ی افزایش ابعاد پردازنده در تمامی فاکتورها است.

از سال ۲۰۰۹ لیتوگرافی به نامی تجاری برای اهداف بازاریابی تبدیل شده و نشان‌دهنده‌ی فناوری‌های به‌کار رفته در فرایند تولید تراشه است و درواقع ارتباطی با طول گیت در ترانزیستورهای پردازنده ندارد.

برای درک درست این موضوع کافی است اندازه ی وسایل نقلیه‌ای چون دوچرخه، قطار و هواپیما را در نظر بگیرید.
هر کدام از دستگاه‌های یادشده، در نهایت مسافر را به مقصد می رساند.
اما حجم کاری و سرعت و استفاده هر کدام از آن‌ها برای مصارف و اهداف خاصی مهم است.
درواقع این مصرف سوختشان است که نشان‌دهنده‌ی کثرت قطعات به‌کار رفته در وسیله و پیچیدگی آن است.

فاکتورهایی که در پردازنده رابطه‌ی مستقیمی با بزرگی TDP دارند.
شامل پیچیدگی ریزمعماری، تعداد هسته‌ها، عملکرد پیش‌بینی‌کننده‌ی پرش، میزان حافظه‌ی کش، تعداد پایپ‌لاین‌های اجرایی و مواردی مانند این می باشد.
لزوما توان طراحی حرارتی بین محصولات برند های مختلف یکی نیست.
اما محدوده‌ای که این معیار در آن قرار می‌گیرد تقریبا در تمامی محصولات مشابه از یک استفاده، یکسان است.

اهمیت مشخصات مختلف cpu

اهمیت مشخصات مختلف پردازنده

در مورد لیتوگرافی ساخت پردازنده می‌توان  گفت که در استاندارد تعریف‌شده توسط صنایع تولید تراشه، هر نسل از فرایند تولید تراشه‌های نیمه‌هادی یا به‌عبارتی لیتوگرافی ساخت پردازنده، با طول گیتِ ترانزیستورهای به‌کار رفته در تراشه بر حسب نانومتر (سابقا میکرومتر) مشخص می‌شود.
اگرچه از سال ۲۰۰۹ لیتوگرافی پردازنده به نامی تجاری برای اهداف بازاریابی تبدیل شده و نشان‌دهنده‌ی نسل جدیدی از فناوری‌های به‌کار رفته در فرایند تولید تراشه است.
درواقع هیچ ارتباطی با طول گیت در ترانزیستورهای به‌کار رفته در پردازنده ندارد.
برای مثال فرایند ۷ نانومتری شرکت تراشه‌سازی GlobalFoundries همانند لیتوگرافی ۱۰ نانومتری شرکت اینتل است.
بنابراین مفهوم حقیقی لیتوگرافی ساخت دچار ابهام شده است.

علاوه بر این تراشه‌های سامسونگ و شرکت صنایع نیمه‌هادی تایوان (TSMC) با لیتوگرافی ۱۰ نانومتری تنها اندکی بیشتر از تراشه‌های ۱۴ نانومتری اینتل ترانزیستور دارند.
حتی تراکم ترانزیستور در تراشه‌های ۱۰ نانومتری اینتل بیشتر از تراشه‌های ۷ نانومتری سامسونگ و برخی از انواع پردازنده‌های تولیدی TSMC است.
شایان ذکر است تراکم ترانزیستورها در تراشه‌های ۱۰ نانومتری اینتل ۱۰۰٫۷۶ میلیون ترانزیستور در میلی‌متر مربع است.
تعداد ترانزیستورهای به کار رفته در تراشه‌های نوع N7P و N7FF صنایع نیمه‌هادی تایوان و تمامی تراشه‌های سامسونگ کمتر از مقدار یادشده برای تراشه‌ی ۱۰ نانومتری اینتل است.
تعداد کل ترانزیستورها در پردازنده‌ی A13 بایونیک اپل ۸٫۵ میلیارد عدد است که با تقسیم بر مساحت تراشه (۹۸٫۴۸ میلی‌متر مربع) تراکمی تقریبا برابر با ۸۶ میلیون ترانزیستور در میلی‌متر مربع را نشان می‌دهد.

با تمامی این‌ها، لیتوگرافی ساخت در معنای واقعی فاکتوری مهم در مقایسه‌ی پردازنده‌ها محسوب می‌شود.
با کاهش لیتوگرافی، بازده پردازنده افزایش می‌یابد.
بنابراین اگر دو پردازنده را با طراحی مشابه و لیتوگرافی متفاوت در نظر گرفت.

پردازنده‌ی با لیتوگرافی پایین‌تر خصوصیات زیر را دارا خواهد بود:

  • فرکانس پردازشی بیشتری نسبت به پردازنده‌ی با لیتوگرافی بالاتر خواهد داشت
  • توان مصرفی پایین‌تری خواهد داشت.
  • گرمای کمتری تولید خواهد کرد.
  • به دلیل تراکم بیشتر در تعداد ترانزیستورها، مساحت کمتری خواهد داشت.

به‌طور کلی هنگامی که اینتل، AMD و سازنده‌های تراشه‌های مبتنی‌بر معماری ARM مانند سامسونگ و کوالکام لیتوگرافی تراشه‌هایشان را کاهش دادند، بازدهی پردازنده نیز افزایش یافت.
باتوجه به اینکه در اکثر اوقات کاربران افزایش سرعت پردازشی را به کاهش توان مصرفی ترجیح می‌دهند، شرکت‌ها نیز همین کار را می کنند.
این عمل مانعی در برابر افزایش صرفه جویی در مصرف انرژی است.
برخی نیز پردازنده‌های خود را به‌‌گونه‌ای طراحی می‌کنند که بالانس میان افزایش کارایی و میزان کاهشِ مصرف انرژی را حفظ کنند.
گروه سومی نیز هستند که افزایش بهره‌وری در میزان مصرف انرژی نسبت به افزایش سرعت پردازشی را در ارجحیت قرار می‌دهند.

نکته‌ی اصلی که باید در نظر گرفته شود این است که توان طراحی حرارتی در گوشی‌های هوشمند در بیشترین حالت تنها ۵ وات است.
این در حالی است که پردازنده‌های پایین‌رده‌ی دسکتاپ در حدود ۴۵ وات توان طراحی حرارتی دارند.
توان طراحی حرارتی در پردازنده‌های سرور نیز کمی بیشتر از پردازنده‌های دسکتاپ است.
دلیل تفاوت موجود در TDP دستگاه‌های ذکر شده، قبل تر نیز گفته شد.
برای درک بهتر این نکته را میگوییم که پردازنده‌های به‌کار رفته در دستگاه‌های مختلف روی صفحاتی با نام دای ساخته می‌شوند.
هر دای (die) یک بلوک کوچک از مواد نیمه‌رسانا است که مداری با کارکرد خاص، طی فرآیندی مانند فوتولیتوگرافی روی آن ساخته شده‌ است.
پردازنده‌ها در دستگاه‌های قابل حمل، SoC هستند.

به این معنی که بخش‌های مختلفی اعم از پردازنده، پردازنده‌ی گرافیکی، حافظه، کنترلر USB، مدارهای مدیریت مصرف انرژی و مودم‌های بی‌سیم وای‌فای و شبکه‌های تلفن همراه در SoC در کنار هم جمع میشوند.
با این حال اندازه‌ی کل دای در SoCها کوچکتر از پردازنده‌های کامپیوتر و سرور است.
با توجه به این موضوع، حتی اگر لیتوگرافی به کار رفته در پردازنده‌ها برابر باشد و تراکم ترانزیستورها یکی باشد، در اکثر موارد پردازنده‌های کامپیوتر تعداد بیشتری ترانزیستور دارند.
در صورت برابر بودن اندازه‌ی دای‌ها نیز، باتوجه به کثرت قطعات در SoCها، تعداد ترانزیستورهایی که تنها برای پردازنده استفاده شده‌اند، بسیار کمتر از پردازنده‌های کامپیوتر و سرور است.

از دیدگاه توان مصرفی نیز در طراحی پردازنده‌های دسکتاپ، ملاحظه کمتری صورت میگیرد.
این در حالی است که در دستگاه‌های موبایل، عملکرد ترکیبی سخت‌افزار، نرم‌افزار و فریم‌ور به‌گونه‌ای است که با ایجاد محدودیت‌هایی در سرعت پردازشی، عمر باتری را طولانی‌تر کنند.
در پردازنده‌های دسکتاپ تنها زمانی توان مصرفی کنترل می‌شود که تأثیری منفی در ایجاد بهترین عملکرد داشته باشد.
علاوه بر این در دستگاه‌های قابل حمل، ترفندهایی نرم‌افزاری اعم از کاهش نرخ فریم در قسمت‌هایی از بازی‌ها صورت می‌پذیرد که با پایین‌آوردن سطح عملکرد پردازنده توان مصرفی را نیز کاهش می‌دهند.
فرکانس پردازشی نیز در SoCهای دنیای موبایل برای مصرف بهینه‌ی انرژی محدود شده است.
در پردازنده‌ی بالارده‌ای چون A13 بایونیک اپل میزان فرکانس پردازشی ۲٫۶۵ گیگاهرتز است.
این میزان حتی کمتر از پردازنده‌های میان‌رده‌ی نسل ششم اینتل است.

این نکته نیز باید در نظر گرفته شود که میزان فرکانس پردازشی گفته شده برای پردازنده‌های موبایل نشان‌دهنده‌ی کارایی پردازنده در بالاترین سطوح کار است.
اما فرکانس پردازنده‌های کامپیوتری در حالت بوست و اورکلاک پردازنده به‌میزان قابل ملاحظه ای افزایش پیدا می‌کند.

معماری پردازنده:

معماری پردازنده X86:

در بحث مربوط به معماری پردارنده، تمامی پردازنده‌های دسکتاپ، لپ‌تاپ و سرور با بهره‌گیری از معماری X86 در مقابل پردازنده‌های موبایل با معماری ARM قرار گرفته‌اند.
هر کدام کارکرد و وظیفه‌ی خاصی دارند.
همینطور کاربری متناسبی را انجام می‌دهند.
در مورد معماری و طراحی پردازنده‌های ARM، این عبارت مخفف Acorn RICS Machines است.
حال آنکه اگر منظور کمپانی توسعه‌دهنده‌ی این معماری باشد، اختصار ARM کوتاه شده‌ی عبارت Advances RISC Machines است.
سالیان زیادی است که معماری ARM در مرکز ریزپردازنده‌های مدرن و طراحی‌های فشرده قرار دارد.

معماری پردازنده ARM:

ARM خانواده‌ای از معماری RISC یا reduced instruction set computing به مفهوم محاسبات بر پایه‌ی مجموعه‌ دستورالعمل‌های ساده‌شده برای پردازنده‌های مختلف است.

مقایسه معماری پردازنده ARM و X86

مقایسه معماری پردازنده‌ها

در پردازنده‌های مبتنی‌بر معماری RISC تمرکز اصلی این است که تعداد دستورالعمل‌ها تا جای ممکن کم بوده و دستورالعمل‌های مذکور تا جای ممکن ساده باشند.
از آن‌جایی که دستورالعمل‌ها ساده هستند، مدار به تعداد کمتری ترانزیستور احتیاج دارد.
درنتیجه تراشه کوچک‌تر بوده و فضای بیشتری برا جاسازی قطعات دیگر در داخل دستگاه وجود دارد.
به همین دلیل نیز پردازنده‌های مبتنی بر معماری ARM بیشتر SoC بوده و بسیاری از قطعات را به‌صورت مجتمع در خود جای داده‌اند.

اما دستورالعمل‌های ساده نیز هزینه‌ای دارند.
انجام وظایف سنگین در این نوع معماری، نیازمند تعداد بیشتری از دستورالعمل‌ها است.
همین نیز باعث افزایش مصرف حافظه و زمان اجرای طولانی‌ترِ دستورالعمل‌ها می‌شود.
با این حال معماری ARM با پایپ‌لاین‌های سریع‌تر و افزایش فرکانس پردازشی، تأخیر یادشده در اجرای دستورالعمل‌ها را تا حدودی جبران می‌کند.
در سمت دیگر، پردازنده‌های اینتل و AMD تحت معماری x86 در خانواده‌ای با نام CISC قرار دارند که مخففی از عبارت Complex Instruction Set Computing و به‌معنی محاسبات براساس مجموعه دستورالعمل‌های پیچیده است.

فقدان قابلیت SMT در معماری ARM دلیل موجهی برای افزایش روز‌افزون تعداد هسته‌های پردازنده در این معماری است

برخلاف پردازنده‌های RISC، تمرکز دستورالعمل‌ها در معماری CISC، بر انجام وظایف سنگین‌تر با میزان بیشتری از انعلاف‌پذیری است.
برای درک بهتر موضوع لازم است تا چند نکته را یادآور شویم.
در تمامی پردازنده‌های حال حاضر، بخشی به‌نام ALU قرار دارد که مختصر شده‌ی عبارت arithmetic logic unit به مفهوم واحد منطق و حساب است.
داده‌هایی که کاربر یا نرم‌افزارها واردِ سیستم می‌کنند عملوند نام دارد.
کدهایی که تایین می‌کنند چه نوع عملیاتی باید صورت گیرد و نیز عملوندها، ورودی‌های ALU هستند.
خروجی ALU نتیجه‌ی عملیات انجام‌شده است.
درواقع کاری که ALU انجام می‌دهد انجام عملیات حسابی و بیتی روی اعداد باینری است.

در پردازنده‌های RISC، معماری به‌کار رفته از نوع load-store به مفهوم بارگذاری و ذخیره‌سازی است.
در مهندسی کامپیوتر load-store، معماری از مجموعه دستورالعمل‌ها است که دستورالعمل‌ها را به دو بخش تقسیم می‌کند: دسترسی به حافظه و عملیات ALU.
در بخش دسترسی به حافظه عملوندها از حافظه به ثبات‌ها بارگذاری می‌شوند.
سپس عملیات روی‌شان صورت می‌پذیرد.
در بخش عملیات ALU نیز عملوندها از قبل روی ثبات‌ها هستند.

در کل روند کار در معماری load-store به این صورت است که داده‌ها در ابتدا روی ثبات‌ها کپی می‌شوند.
هنگام بارگذاری یا load، فرایند کپی از حافظه‌ی اصلی در ثبات انجام می‌شود.
سپس داده‌هایی که عملیات روی‌شان صورت گرفته در حافظه‌ی اصلی ذخیره یا store می‌شوند.
در نهایت می‌توان این‌گونه گفته پردازنده‌های نوع RISC عملیات را تنها بین ثبات‌ها انجام می‌دهند.

در معماری نوع load-store دستورها به شکل زیر است:

LOAD r1, Y

LOAD r2, Z

PROD r1, r2, r3

STORE r3, X

دستور اول و دوم متغیرهای r1 و r2 را از آدرس y و z واقع در حافظه‌ی اصلی به ثبات درون پردازنده بارگذاری یا load می‌کند.
دستور سوم این دو عدد را با هم ضرب کرده و مقدار r3 را تولید می‌کند.
دستور چهارم مقدار r3 را در آدرس x از حافظه‌ی اصلی ذخیره می‌کند.
ساده بودن دستورهای load-store در معماری RISC باعث شده تا معماری یادشده و به تبع آن پردازنده‌های ARM که در دستگاه‌های قابل حمل مورد استفاده هستند.
تنها در یک سیکل کلاک هر دستورالعملی را اجرا کنند.
اما به دلیل تعدّد دستورالعمل‌ها در این معماری، ثبات‌های بیشتری نیز مورد استفاده قرار می‌گیرد.

اما در پردازنده‌های CISC، معماری به‌کار رفته از نوع register–memory به مفهوم ثبات-حافظه است.
در مهندسی کامپیوتر معماری یادشده مجموعه دستورالعمل‌هایی است که اجازه می‌دهد عملیات نه‌تنها بین ثبات‌ها، بلکه بین بخشی از ثبات و بخشی از حافظه یا فقط در حافظه صورت گیرد.
در رویکرد register–memory ممکن است یکی از عملوندها در ثبات و دیگری در حافظه باشد.

در معماری نوع register–memory دستورهای ضرب برای دو عدد به شکل زیر است:

mul r1,r1

چنین دستوالعملی با اینکه عملیات پیچیده‌ای را انجام میدهد .
به هیچ وجه ساده‌سازی نشده، اما در عوض حافظه‌ی کمتری را اشغال می‌کند.

Hyper threading SMT

Hyper threading SMT

شاید به همین دلیل است که پردازنده‌های مبتنی بر معماری ARM برخلاف نوع x86 روز به‌روز حافظه‌ی رم بیشتری را می‌طلبند.

پردازنده‌های پیچیده می‌توانند چندین دستورالعمل را به‌صورت هم‌زمان واکشی، رمزگشایی و اجرا کنند.
چنین قابلیتی پردازش چندرشته‌ای هم‌زمان (Simultaneous Multithreading ) یا SMT نامیده می‌شوند.
پردازنده‌هایی که قابلیت SMT دارند، دستورالعمل‌ها را در هر هسته با دو یا چند رشته‌ی مجزا اجرا می‌کنند.
در پردازنده‌های دنیای موبایلی، یعنی ARM، ایجاد چنین قابلیتی باعث پیچیدگی ریزمعماری شده و میزان توان مصرفی را بسیار بالا می‌برد.
از این رو SMT تنها در پردازنده‌های مبتنی بر معماری X86 مورد  استفاده قرار می‌گیرد.

فقدان قابلیت SMT در معماری ARM دلیل موجهی برای افزایش روز‌افزون تعداد هسته‌ها در این معماری است.

مقایسه کارایی پردازنده ها:

با اینکه مقایسه‌ی بین پردازنده‌های مختلف با کاربری‌های متفاوت امکان‌پذیر نبوده و نخواهد بود.
نتایج حاصل از در کنار هم قرار دادن مشخصات اعلام‌شده برای این پردازنده‌ها درک درستی از ریزمعماری استفاده‌شده در پردازنده‌های یادشده را برای کاربران فراهم خواهد کرد.
در ادامه برخی اطلاعات مربوط به تعدادی از پردازنده‌های مختلف از کاربری سرور، دسکتاپ، لپ‌تاپ، تبلت و گوشی‌های هوشمند آورده شده‌ است.
البته باتوجه به اینکه شرکت اپل مشخصات مربوط به پردازنده‌های خود را به‌صورت عمومی منتشر نمی‌کند.
اطلاعات به‌دست آمده تنها با واکاوی و تجزیه و تحلیل و آزمایش پردازنده‌ها مشخص می‌شود.
اطلاعات زیادی از پردازنده‌ی جدید این شرکت، یعنی A13 بایونیک در دسترس نیست.
پردازنده‌ی نسل پیشین اپل با نام A12 بایونیک بررسی میشود.

پردازندهAMD EPYC 7552اینتل Core i9-9900Kاینتل Core i9-8950HKاپل A12 بایونیککوالکام اسنپ‌دراگون ۸۵۵ 
لیتوگرافی۷ نانومتری۱۴ نانومتری۱۴ نانومتری۷ نانومتری۷ نانومتری
معماریx86x86x86ARMv8.3ARMv8
تعداد هسته‌ها۴۸۸۶۶۸
تعداد رشته‌ها۹۶۱۶۱۲۶۸
ریزمعماریZen 2Coffee LakeCoffee LakeVortex, TempestCortex-A76 Cortex-A55
فرکانس پردازشی۲٫۲ گیگاهرتز۳٫۶ گیگاهرتز۲٫۹ گیگاهرتز۲٫۴۹ گیگاهرتز۲.۸۴ گیگاهرتز

۲.۴۲ گیگاهرتز

۱.۸ گیگاهرتز

فرکانس بوست۳٫۳۵ گیگاهرتز۵ گیگاهرتز۴٫۶ گیگاهرتزنداردندارد
اندازه‌ی دای۱۹۲ میلی‌متر مربع۳۵۵٫۵۲ میلی‌متر مربع۱۴۹ میلی‌متر مربع۸۳٫۲۳ میلی‌متر مربع۷۳٫۲۷ میلی‌متر مربع
تعداد ترانزیستورها۱۹٫۲ میلیاردنامشخص۷٫۲ میلیارد۶٫۹ میلیاردنامشخص
حافظه‌ی کش L1۳ مگابایت۶۴ کیلوبایت در هر هسته۶۴ کیلوبایت در هر هسته۱۲۸ کیلوبایت داده
۱۲۸ کیلوبایت دستورالعمل‌ها
نامشخص
حافظه‌ی کش L2۲۴ مگابایت۲۵۶ کیلوبایت در هر هسته۲۵۶ کیلوبایت در هر هسته۸ مگابایتهسته‌ی Gold Prime کش ۵۱۲ کیلوبایتی
هسته‌های Gold هرکدام ۲۵۶ کیلوبایت
هسته‌های Silver هرکدام ۱۲۸ کیلوبایت
حافظه‌ی کش L3۱۹۲ مگابایت۱۶ مگابایت اشتراکی۱۲ مگابایت اشتراکیندارد۲ مگابایت L3 مشترک در قالب DSU
۳ مگابایت کش سطح سیستم
توان طراحی حرارتی۲۰۰ وات۹۵ وات۴۵ واتزیر ۵ واتزیر ۵ وات
حافظه‌ی رم۸ کانال ۶۴ بیتی DDR4 با فرکانس ۳۲۰۰ مگاهرتز
پهنای باند ۱۹۰٫۷ گیگابایت‌برثانیه
۲ کانال ۶۴ بیتی DDR4 با فرکانس ۲۶۶۶ مگاهرتز
پهنای باند ۳۹٫۷۴ گیگابایت‌برثانیه
۲ کانال ۶۴ بیتی DDR4 و LPDDR3 با فرکانس ۲۶۶۶ و ۲۱۳۳ مگاهرتز
پهنای باند ۳۹٫۷۴ گیگابایت‌برثانیه
مشخص نیست۴ کانال ۱۶ بیتی LPDDR4X با فرکانس ۲۱۳۳ مگاهرتز
پهنای باند ۳۴٫۱ گیگابایت‌برثانیه

در ابتدا ذکر این نکته لازم است که هسته‌های پردازنده‌ی کوالکام اسنپ‌دراگون ۸۵۵ به تعداد ۸ هسته از نوع Cortex-A76 و Cortex-A55 معماری ARM است.
کوالکام با شخصی‌سازی هسته‌های مذکور نام‌های Kryo 485 Gold و Kryo 485 Silver و Kryo 485 Gold را برایشان درنظر گرفته است.

از نظر لیتوگرافی ساخت، پرواضح است که پردازنده‌های جدید موبایل تراکم ترانزیستوری بیشتری دارند.
اما کوچک بودن اندازه‌ی دای و SoC بودنشان باعث شده تا تعداد کمتری از ترانزیستورها تنها در هسته‌های پردازشی به‌کار برده شوند.
برای مثال در پردازنده‌ی A12 بایونیک اپل با سطح مقطعی برابر با ۸۳٫۲۳ میلی‌متر مربع، تنها ۱۱٫۹ میلی‌متر معادل با ۱۴٫۲۹ درصد از سطح دای به هسته‌های پردازشی و قطعات مرکب در آن اختصاص داده شده‌ است.
با یک حساب سرانگشتی تعداد ترانزیستورها برای بخش مذکور برابر خواهد بود با اندکی کمتر از یک میلیارد ترانزیستور.
با اینکه آمار و ارقام دقیقی از تعداد ترانزیستورها در پردازنده‌های جدید اینتل منتشر نمی‌شود .
همینطور ساختار دای در پردازنده‌های مذکور مبهم است.
اما سطحی از تراشه که تنها برای پردازنده وقف شده به‌مراتب بیشتر است.

قطعات مجتمع در پردازنده

قطعات مجتمع در پردازنده

ایجاد قدرت پردازش کامپیوتری در دنیای موبایل شاید سخت باشد، اما دست نیافتنی نیست.

همان‌گونه که در جدول مشاهده می‌شود پردازنده‌های مبتنی‌بر معماری X86 با دارا بودن پردازش چندرشته‌ای هم‌زمان، تعداد بیشتری از رشته دستورالعمل‌ها را به‌صورت هم‌زمان اجرا می‌کنند.
اما بنا بر معماری به‌کار رفته، سیکل کلاک بیشتری صرف پردازش دستورالعمل‌ها می‌شود.
نوع پایپ‌لاین عموما در هسته‌های ARM در نسل‌های مختلف دچار تغییر می‌شود.
اما باتوجه به ماهیت این‌پردازنده‌ها مراحل ریزترِ اجرای دستورالعمل‌ها کمتر از پردازنده‌های x86 است.

برای مثال تعداد مراحل پایپ‌لاین‌ها در هسته‌ی Cortex-A55 معماری مذکور ۸ مرحله بوده و برای Cortex-A76 سیزده مرحله است.
مراحل پایپ‌لاین برای پردازنده‌ی ۹۹۰۰k بین ۱۴ و ۱۹ مرحله  است.
پایپ‌لاین بیشتر به‌معنی انجام دستورهای پیچیده‌تر، اما با تعداد سیکل کلاک بیشتر است.
فرکانس پردازشی نیز در پردازنده‌های موبایل در جدول فوق، عموما کمتر از تراشه‌های کامپیوتری است.
دلیل فرکانس پایین‌تر همان‌گونه که در ابتدا گفته شد، پایین‌آوردن توان مصرفی است.

نتیجه‌گیری

همان‌گونه که در ابتدا گفته شد، به دلیل کاربری‌های متفاوت در پردازنده‌های به‌کار رفته در دستگاه‌های مختلف، مقایسه‌ی انواع مختلف از پردازنده‌ها غیرممکن است.
اما آیا اینکه هر پردازنده‌ای در طیف عملکردی خود، وظیفه‌اش را به خوبی انجام دهد بحث دیگری است.
بزرگ‌ترین نقطه‌ی منفی در پردازنده‌های مبتنی‌بر معماری ARM محدود‌سازی فرکانس پردازشی و عدم استفاده از پردازش چندرشته‌ای در ساختار پردازنده‌ است.
با گذر زمان و نیاز به اجرای دستورهای پیچیده‌تر در دستگاه‌های تلفن همراه، تعداد پایپ‌لاین‌ها افزایش پیدا کرده و فرکانس پردازشی اندکی افزایش پیدا کرده است.
اما توان مصرفی نیز به تبعِ آن بالا رفته است. چالش پیش‌رو برای ARM، تغییر ساختار به‌نحوی است که با ثابت نگه‌داشتن مصرف انرژی، پردازش چندرشته‌ای به ساختار این پردازنده‌ها اضافه شود.

در مورد پردازنده‌های x86 نیز پایین آوردن تعداد سیکل کلاک باعث تقویت قدرت پردازشی خواهد شد.
واقعیت این است که به مرور زمان این دو معماری به هم نزدیک شده و سختار مشابه‌تری را نسبت به آن‌چه که در گذشته شاهد بودیم، پیدا می‌کنند.
ایجاد قدرت پردازش کامپیوتری در دنیای موبایل شاید سخت باشد، اما دست نیافتنی نیست.