بررسی مشکلات و عیب یابی پردازنده های G10 و G11

یکی از مهم ترین قطعات در هر سیستم، پردازنده است که به طور موثر بر عملکرد آن ها تاثیر می گذارد. با توجه به اهمیت شبکه قوی و کارآمد در کسب و کار و تجارت، داشتن تجهیزات شبکه با کیفیت همچون سوئیچ شبکه، فایروال، روتر و .. اهمیت بسیار زیادی دارد. سرورها یکی از مهم ترین تجهیزات شبکه به شمار می آیند که پردازنده آن ها اصلی ترین قطعه در ساختارشان محسوب می شود.
که امروزه جدیدترین نسل سرورها، سرورهای hp g10 و سرورهای hp g11 می باشند. از این رو ما قصد داریم تا شما را با عنوان “بررسی مشکلات و عیب یابی پردازنده های G10 و G11” آشنا سازیم و درباره آن صحبت کنیم. پیشاپیش از اینکه ما را دنبال می کنید سپاسگزاریم.
بررسی مشکلات و عیب یابی پردازنده های G10 و G11:
قبل از توضیح درباره بررسی مشکلات و عیب یابی پردازنده های G10 و G11، کمی درباره اهمیت پردازنده صحبت کنیم سپس، خطاهای احتمالی را مورد بررسی قرار دهیم. همان طور که گفتیم پردازنده ها تاثیر مستقیمی بر عملکرد سرور دارند و موجب افزایش و یا حتی کاهش طول عمر سرور می شوند، پس بسیار مهم است که در تعمیر و نگهداری پردازنده ها اقدامات لازم را انجام دهیم.
از طرفی دیگر پردازنده های سرور از جمله سرور اچ پی ممکن است که با مشکلات متنوعی روبرو شوند که معمولا بخش اعظم آن ها، مشکلات سخت افزاری است و گاهی اوقات نیز ممکن است دچار مشکلات نرم افزاری می گردند. ما در ادامه می خواهیم شما را با انواع این اختلالات آشنا سازیم.
رایج ترین اختلالات پردازنده های سرور اچ پی:
در قسمت قبل به این موضوع اشاره کردیم که مشکلات نرم افزاری و سخت افزاری از عوامل بروز اختلال در سرورهای اچ پی هستند که ممکن است با گذشت زمان و در پس از مدتی که از سرور خود استفاده کردید با آن مواجه گردید.
- خطاهای سخت افزاری: از رایج ترین مشکلاتی که در سرورها ممکن است بروز دهد، خطاهای سخت افزاری است. این خطاها می تواند شامل مواردی همچون؛ خراب شدن برخی قطعات الکترونیکی، خراب شدن خمیر سیلیکون و .. باشد که عواقب این اختلالات می تواند تاثیر در عملکرد سرور، کاهش سرعت و حتی خاموش شدن دستگاه شما باشد.
- خطاهای نرم افزاری: این خطاها موجب می گردد که سرور شما به اندازه ای که باید کارایی نداشته باشد. از جمله خطاهای نرم افزاری می توان به خطاهای برنامه نویسی، ناسازگاری نرم افزار اجرا شده با سیستم عامل نصب شده بر روی سیستم و .. باشد.
- بارهای کاری در حجم زیاد: گاها ممکن است حجم فعالیت ها و کارهایی که با سرور خود انجام می دهید بسیار بالا باشد و انجام این چنین عملیات سنگین موجب گردد که پردازنده سرور گرم شود، در چنین شرایطی اگر فن و خنک کننده مناسب نداشته باشید، با بالا رفتن دمای پردازنده نتایجی از قبیل کاهش سرعت سرور و یا خاموش شدن به یکباره آن مواجه می شوید.
- گلوگاه: گلوگاه یک مکانیزم است که برخی از پردازنده ها ممکن است دارای گلوگاه باشند، این مکانیزم موجب می گردد که در صورت بالا بودن دمای پردازنده، سرعت آن را کم می کند تا دما نیز کاهش یابد. کاهش دما موجب می گردد از خرابی پردازنده جلوگیری کند ولی عملکرد سرور کاهش یابد.
- خطاهای فریمور: Firmware یک نرم افزار است که عملکرد پردازنده ها را کنترل می کند اما یکسری مشکلات نیز به دنبال دارد که باعث ایجاد خطاهای عملکردی می گردد. معمولا این خطاها با بروز رسانی و آپدیت برطرف می شوند و عملکرد پردازنده را بهبود می بخشند. امروزه سرورهای ProLiant از اهمیت بسیاری برخوردارند. با پیشرفت تکنولوژی، نگهداری و بهروزرسانی سرورها کاری ضروری است Firmware و درایورهای قدیمی ممکن است باعث مشکلاتی از جمله ناسازگاری و کاهش عملکرد شوند، اما با استفاده از HPE’s Service Pack for ProLiant که بهعنوان SPP شناخته میشود و به آسانی قابل حل است. بهروزرسانی منظم میانافزار و درایورهای سرور با استفاده از SPP نه تنها به عملکرد روان و ایمنی سرور شما کمک میکند، بلکه از مشکلات امنیتی و نقاط ضعف نیز پیشگیری میکند. بروز رسانی نرم افزار فریمور و درایوهای مربوط به آن، موجب بهبود عملکرد پردازنده می شود.
- مشکلات اتصال به شبکه: در سرورهایی با پردازنده g10 و g11 و یا سایر سرورها، مشکلات اتصال شبکه میتواند مانع از برقراری ارتباط با سایر دستگاه های موجود در شبکه شود. که در چنین مواری باید به بررسی اتصالات کابل شبکه، تنظیمات سوئیچ/روتر شبکه، تنظیمات و درایورهای کارت رابط شبکه (NIC) بپردازید.همه کابلهای موجود باید به صورت مطمئن وصل شده باشند و سوئیچ یا روتر شبکه نیز به درستی پیکربندی شده باشند.
- مشکلات فضای ذخیره سازی: ذخیره سازی در سرورهای ProLiant از مواردی است که سبب بهینه سازی عملکرد میشود. در سرورهایی مانند DL180 G9 و DL380 G10 مشکلاتی از قبیل خرابی دیسک، خطاهای پیکربندی RAID و مشکلات کنترلر ذخیره سازی به وجود می آورد. با استفاده از ابزار SSA یا همان Smart Storage Administrator میتوانید بر سلامت درایوهای ذخیره سازی سرور نظارت داشته باشید. خرابی دیسک یا مشکلات پیکربندی Raid نیازمند اقدامات مناسب مانند جایگزین کردن دیسک یا پیکربندی مجدد تنظیمات RAID است. برای جلوگیری از بروز مشکل در Storage Controller حتما اطمینان حاصل کنید که فریمور کنترلر آپدیت است و اشکالات سخت افزاری نیز وجود ندارد. همچنین سازگاری قطعه رید کنترلر را با مدل سرور ProLiant مطابقت دهید.
- خطاهای مربوط به حافظه RAM: یکی دیگر از مشکلات رایج سرورهای اچ پی، وجود خطاهای مربوط به حافظه است. خطاهای حافظه باید بسیار جدی گرفته شوند زیرا باعث از کار افتادن سرور و هنگ کردن میشوند. در سرورهایی مانند DL580 G9 یا DL560 G10 میتوانید از HPE iLO برای بررسی پیامهای خطا و اجرای memory diagnostics کمک بگیرید. البته iLO در تمامی سرورهای ProLiant قابل استفاده است و ما سرورهای DL560 و DL580 را فقط برای نمونه عنوان کردیم. در صورت شناسایی خطا سعی کنید ماژولهای حافظه را تنظیم مجدد و یا در صورت لزوم تعویض کنید. برای مدلهایGen10، لطفاً اطمینان حاصل کنید که ماژولهای حافظه دارای قابلیت HPE SmartMemory برای عملکرد و سازگاری بهینه هستند.
- خاموش شدن در اثر گرمای بیش از حد: یکی از مزایایی که سرورهای ProLiant دارند؛ وجود یک مکانیزم داخلی برای محافظت در برابر گرمای بیش از حد است که این مکانیزم بهنحوی عمل میکند که اگر دمای سرور از حد معینی بالاتر رود؛ سرور بهطور خودکار خاموش میشود. در سرورهای ML350 G9 و ML110 G10 گرمای بیش از حد میتواند بر اثر تجمع گرد و غبار، مسدود شدن دریچههای هوا، معیوب بودن قطعات خنک کننده مانند فن و هیت سینک باشد. برای رفع این مشکل توصیه میکنیم به صورت منظم سرور را تمیز کنید و اطمینان حاصل کنید که هوا به خوبی جریان دارد. همچنین ابزار مدیریت HPE iLO به شما برای نظارت بر دما و سرعت فن سرور کمک میکند. اگر شواهدی مبنیبر خرابی و نقص قطعه خنک کننده مانند فن و هیت سینک وجود دارد؛ سریعا آنها را تعویض کنید.
- مشکلات بوت و راه اندازی سرور: مواجه با مشکل هنگام راه اندازی سرور DL380 G9 یا سرورDL360 G10؛ اتفاقی نیست که برای کاربران خوشایند باشد. بروز هرگونه مشکل در این مرحله میتواند مانع عملکرد صحیح سرور شود. برخی از علل متداول برای مشکلات بوت و راهاندازی می تواند بر اثر تنظیمات اشتباه BIOS/UEFI، قطعات سخت افزاری معیوب و فایلهای خراب شده سیستم عامل باشد. برای یافتن مشکل در طول فرآیند بوت، با فشار دادن کلید F9 به تنظیمات BIOS/UEFI دسترسی پیدا کنید. سپس تنظیمات را به حالت پیشفرض برگردانید و اطمینان حاصل کنید که ترتیب بوت به درستی پیکربندی شده است. علاوه بر این، این احتمال وجود دارد که قطعات سختافزاری مانند CPU و پاور معیوب باشند؛ بنابراین از سالم بودن این قطعات نیز باید مطمئن باشید. در صورت لزوم، سیستم عامل را مجدداً نصب کنید تا مشکلات احتمالی رفع شوند.
بررسی مشکلات پردازنده های G10 و G11:
- Load Testing: لود تستینگ یا آزمایش های بارگذاری شده به سرور شما کمک می کند تا عملکرد پردازنده را در شرایطی که بار با حجم بالا تحمیل می شود، مورد بررسی قرار دهد. ممکن است در هنگام لودینگ با مشکلاتی همچون خطاهای سیستم، کاهش سرعت و خاموشی ناگهانی مواجه شود.
- تست سخت افزار جایگزین: گاهی ممکن است پردازنده شما دچار مشکل شود و با خطاهای سخت افزاری رو به رو شوید در چنین مواقعی می توانید از پردازنده دیگری استفاده کنید و آن را جایگزین کنید.
- بررسی کردن هشدارها: سرورهای HP توسط iLO مشکلات احتمالی سرور را گزارش میدهند. بررسی هشدارهای مربوط به پردازنده میتواند در بررسی و شناسایی مشکلات کمک کند. معمولا در بیشتر موارد یک پیام خطای POST یا یک پیام IML توسط سرور نشان داده میشود. این پیام یک هشدار است که دلایل مختلفی دارد و از مهمترین هشدارهای آن میتوان به موارد زیر اشاره کرد:
-پردازنده و پرازنده هایی که بر روی سرور قرار دادید پشتیبانی نمی شود.
-پیکربندی که صورت گرفته توسط سرور پشتیبانی نمی شود و قابل شناسایی نیست.
-ROM سرور ممکن است به روز نباشد.
-پردازنده به درستی در اسلات قرار نگرفته است.
-ممکن است یکی از پردازنده هایی که بر روی سرور نصب شده است، ممکن است خراب باشد.
بیشتر بخوانید: معرفی جدیدترین محصول مشترک NVIDIA و HP
برطرف کردن مشکلات پردازنده های G10 و G11:
همان طور که گفتیم؛ هر کدام از شرایطی که در قسمت قبل عنوان شد، رخ داد، نشان دهنده هشدارهایی برای سرور شماست که باید نسبت به رفع آن سریعا اقدامات لازم را انجام دهید. در ابتدا دقت داشته باشید که پردازنده ای که بر روی سرور خود نصب کرده اید با سرور سازگار است یا خیر. شما می توانید با مراجعه به مجله مستر شبکه و بررسی مقالات مرتبط با سرور، در این رابطه مطالعه بیشتری داشته باشید.
قدم بعدی رام سرور شماست. باید ROM SERVER را به روز رسانی و آپدیت کنی تا با سرور سازگار گردد و هچنین تغییرات ایجاد شده در بایوس سرور اعمال نشده باشد. در نهایت اگر بر روی سرور شما تنها یک پردازنده قرار داشت یعنی سرور شما تک پردازنده بود، باید آن را خارج کنید و مجددا در جای خود قرار دهید بعد از آن مجددا سرور را راه اندازی کنید تا ببینید که مشکل سرور شما برطرف شده است یا خیر. اگر سرور چند پردازنده ای دارید باید باید مرحله قبل را برای همه پردازنده ها تکرار کنید، تا به نتیجه مطلوب برسید.
سیستم عامل نکته دیگری است که باید به آن توجه کنید. ممکن است در سیستم عامل نصب شده بر روی سرور شما بگ هایی وجود داشته باشد که در عملکرد سرور اختلالاتی ایجاد می کند و باید با شناسایی آن ها و بررسی وضعیت و ارزیابی خطاهای ثبت شده به وسیله نرم افزارهایی همچون Event Viewer به حل شدن این مشکل کمک کنید.
دمای پردازنده یکی از دیگر عواملی است که در بررسی مشکلات و عیب یابی سرور کمک زیادی می کند. برای مثال اگر دمای پردازنده داغ شود موجب می گردد که عملکرد سیستم کاهش یابد و در نهایت باعث خاموشی سیستم می شود بنابراین دمای پردازنده را بررسی کنید و در نهایت از خنک کننده و یا فن مناسب استفاده کنید.
استفاده از ابزارهای تشخیص خطا در سرورهای اچ پی موجب می گردد که خطاها تشخیص داده شده و در نهایت مشکلات سرور را برطرف کنید. با استفاده از نرم افزارهای تشخیص خطا همچون HP Insight Diagnostics در جهت بهبود استفاده کنید.
بروزرساتی فریمور خیلی تاثیر مثبتی دارد زیرا برخی از مشکلات ممکن ات در اثر باگ هایی باشد که فریمور وجود دارد و اگر فریمور را به آخرین نسخه به روز کنید این مشکلات برطرف می شوند. در نهایت اگر هیچ کدام از موارد گفته شده به شما نتیجه نداد می توانید با پشتیانی فنی نمایندگی های اچ پی تماس گرفته و راهنمایی بیشتری در زمینه بررسی مشکلات و عیب یابی پردازنده های G10 و G11 بکند.
لازم به ذکر است فروشگاه مسترشبکه که یکی از نمایندگان فروش سرور اچ پی همراه با یک سال گارانتی معتبر در ایران است، با ارائه خدمات پس از فروش در زمینه گارانتی و تعمیر سرور اچ پی، شما را در جهت داشتن سرور با کیفیت همراه با طول عمر بالا یاری می دهد. لذا جهت بررسی محصولات جدید سرور اچ پی همچون DL380a G12، DL384 G12 و DL145 Gen11 که به زودی به بازار تجهیزات شبکه عرضه می شوند مطالعه کنید و از قیمت سایر محصولات اچ پی مطلع شوید.
برطرف کردن خطاهای رایج در سرور اچ پی DL380 G10 Plus:
همان طور که در ابتدای مقاله گفتیم، سرورهای اچ پی نسل دهم از جدیدترین نسل سرورها به شمار می آیند. از رایج ترین خطاهایی که در سرور اچ پی dl380 g10 plus رخ می دهد، مشکل حافظه است که علت رخ دادن این مشکل می تواند موارد زیر باشد:
- خطای DIMM رخ داد یا DIMM ناموفق بود.
- جداسازی و به حداقل رساندن پیکربندی حافظه:
- یک پیام خطای POST یا یک پیام IML نمایش داده میشود.
- سرور حافظه موجود را شناسایی نمیکند.
- سرور حافظه جدید نصب شده روی سرور را تشخیص نمیدهد.
- یک پیام خطای POST یا یک پیام IML نمایش داده میشود.
برای برطرف کردن خطاها می توانید از روش های زیر اقدام کنید:
ابتدا پیکربندی حافظه را جدا کنید و آن را به حداقل برسانید و اطمینان حاصل کنید که DIMM را به درستی در سرور قرار داده اید تا الزامات مورد نیاز سرور را برآورده سازد. برخی از سرورها ممکن است نیاز داشته باشند که کانالهای حافظه شان به طور کامل پر شده باشند یا تمام حافظه موجود در یک کانال حافظه از یک اندازه، نوع و سرعت باشد.
LED های سرور باید با اسلات های حافظه مطابقت داشته باشد.
- حافظه قسمت سوم را در سرور حذف کنید.
- رام سیستم را به آخرین نسخه آپدیت کنید.
- DIMM را مجدداً قرار دهید و جایگزین کنید.
P Insight Diagnostics چیست و چگونه عمل می کند:
این ابزار که مشکلات و خطاهای پردازنده سرور را بررسی و شناسایی می کند، نتایج بررسی ها را به صورت گزارشی از خطاها، وضعیت سخت افزارها و پیام ها ارائه می دهد. سپس گزارش های تهیه شده توسط تیم فنی بررسی می شود و مشکلات سخت افزاری را با ارائه راه حل های مناسب برطرف می کند. از ویژگی های این نرم ابزار می توان موارد زیر را نام برد:
- بررسی سخت افزار سرور اچ پی
- نقص ها و مشکلات سخت افزار را گزارش می دهد
- ارائه جزئیات خطاها و وضعیت آن ها
- بوت کردن سرور در محیط بوت لودر
- ارزیابی سخت افزار از نطر سازگاری با سیستم عامل
شناسایی مشکلات iLO در پردازنده:
یکی دیگر از روش های عیب یابی در سرور های اچ پی استفاده از iLO است که برای مدیریت سرور و تشخیص مشکلات سخت افزاری استفاده می شود برای برطرف کردن این مشکل از رابط کاربری iLO در سرور خود استفاده کنید. برای این اتفاق، از طریق یک مرورگر به IP Address و DNS مراجعه کنید و سپس به احراز هویت بپردازید ویژگی های iLO در ادامه توضیح میدهیم:
- به وضعیت سرور و تجهیزات سخت افزار نظارت دارد
- خطاها و مشکلات و خطاهای سخت افزاری را تشخیص می دهد
- تنظیمات لازم را اعمال می کند، تست های سخت افزاری را پیاده سازی می کند و مدیریت از راه دور دارد
- با کنترل توان، از خاموشی سرور جلوگیری می کند
- گزارش های دقیقی درباره خطاهای سخت افزاری ارائه می دهد
نتیجه گیری:
بررسی مشکلات و عیب یابی پردازنده های G10 و G11 یکی از مهم ترین مباحثی است که هر مهندس آی تی و افرادی که با تجهیزات شبکه سر و کار دارند باید بدانند. این مشکلات را برای شما بررسی کردیم و علت به وجوود آمدن آن ها را نیز شناسایی کردیم.
گرچه بررسی مشکلات و عیب یابی پردازنده های G10 و G11 یک فرآیند پیچیده به شمار می آید که قطعا به دانش فنی بسیار بالایی نیاز دارد و موارد بسیاری یافت شده است که متخصصان با اشتباهاتی که در تعمیرات پردازنده ها داشتند موجب از بین رفتن سرورهای زیادی شده و خسارات چند صد میلیونی به بار آورده اند. اگر مقاله ” بررسی مشکلات و عیب یابی پردازنده های G10 و G11 ” برایتان مفید واقع شده است، می توانید سایر مقالات ما را در زمینه پردازنده را در مجله مسترشبکه دنبال کنید.
شما میتوانید از مسترشبکه بزرگترین فروشگاه اینترنتی انواع سرور اچ پی را به همراه گارانتی خریداری نمایید. |
یک دیدگاه در “بررسی مشکلات و عیب یابی پردازنده های G10 و G11”
ممنون عالی بود