SMART هارد ، چند وقت پیش مقالهای درباره اینکه پیشبینی زمان خرابی دیسک سخت امکانپذیر شد و قابلیت اطمینان دیسکها در زمان خرید مشخص شد، منتشر شد. با بررسیهای بسیاری که در این حوزه داشتیم دریافتیم که توابع SMART هارد صد در صد درست عمل نمیکنند. در برخی موارد پیشبینی درست از آب در نمیآید. خوب در این وضعیت پیشبینی کار آسانی نیست. برای شفافسازی این موضوع لازم است متن زیر را مطالعه فرمائید.
توجه از طرف مترجم: داشته باشید این متن ترجمه شده است و به نقطه نظرات نویسنده بسنده می کند. در مورد صفات گاهی صفات با مقدار کم و گاهی صفات با مقدار زیاد در لیست S.M.A.R.T خوب هستند پس توجه داشته باشید باید مقادیر صفات بسته به ویژگیشان کم و یا زیاد باشد. همچنین اکثر هارد دیسک های امروزی از لحظه خروج از کارخانه دارای صفات با مقادریر بد هستند پس اگر بخواهیم میزان سلامت یا طول عمر را بر اساس این فاکتور ها تعیین نماییم هارد های نو نیز دارای سلامت ۱۰۰% نخواهند بود. بررسی توابع S.M.A.R.T به جهت تشخیص ایرادات هارد و یا حتی بازیابی اطلاعات از دست رفته بسیار مهم می باشد.
SMART هارد
این کلمه مخفف مانیتورینگ خودکار، تکنولوژی بررسی و گزارشدهی میباشد SMART هارد. (Self-Monitoring Analysis and Reporting Technology) و اولین بار توسط IBM مطرح شد. این تابع برای بررسی وضعیت هارد دیسک با استفاده از روشها، دستگاهها و سنسورهای مختلف ایجاد شده است. یک هارد دیسک سخت ATA دارای بیش از ۳۰ مقدار قابل اندازهگیری میباشد که ویژگی یا صفات attributes نام دارند. برخی صفات بهصورت مستقیم و برخی بهصورت غیرمستقیم روی وضعیت سلامت هارد دیسک سخت تاثیر میگذارند، برخی دیگر تنها برای اطلاعات آماری استفاده میشود. امروزه دیسکهای سخت جدید منتنی بر تکنولوژی IDE/Serial و یا ATA/SCSI دارای مشخصه SMART هارد هستند.
این مشخصه را نمیتوان بهعنوان یک استاندارد در نظر گرفت زیرا مفهوم یک صفت توسط سازندگان متفاوت معناهای متفاوتی خواهد داشت. در این مقاله میخواهیم تنها راجع به دیسکهای سخت ATA (IDE و ATAی سریال) صحبت کنیم. دیسکهای سخت SCSI خیلی فرق میکنند، به این معنا که پیشبینی خرابی و خرابی در این نوع هارد دیسک سخت یک استاندارد است زیرا قوانین سفت و سختی درباره حسگر ها و الگوریتم وجود دارد. برای مثال تفاوت بین درجه حرارت واقعی دیسک با نتیجهای که حسگرهای داخلی دیسک نشان میدهند، تنها کمتر از +/- ۳ درجه سانتیگراد خطا میتواند داشته باشد.
صفات بسیاری در سازندگان متفاوت یکسان معنا شده و توسط تمامی سازندگان نیز استفاده میشود. به همین دلیل است که برخی صفات را میتوان بهصورت عمومی از تمامی دیسکها اعلام کرد برای مثال درجه حرارت دیسک و پاور کلی. اپلیکیشنهای جدید این اطلاعات را ابتدا تشخیص، سپس بررسی و در نهایت نمایش میدهند.
با توجه به ویژگی SMART هارد، زمانیکه مشکلی تشخیص داده میشود یا پیشبینی میشود، دیسک سخت مجبور است کم و بیش ۲۴ ساعت مداوم کار کند تا از دادههای موجود روی هارد دیسک سخت نسخه پشتیبان تهیه کند. اما در بعضی از مواقع در طول این ۲۴ ساعت هارد دیسک میسوزد یا عملیات پشتیبانگیری از ۲۴ ساعت تجاوز میکند پس لازم است یکجور پیشبینی داشته باشیم تا دادهها را قبل از آنکه دیر شود نجات دهیم.
S.M.A.R.T هارد در عمل
وضعیت فعلی دیسک سخت توسط سنسورهای بسیاری اندازهگیری میشود. مقادیر اندازهگیری شده توسط الگوریتمهایی پردازش میشوند و با توجه به نتیجه پردازش، صفات مرتبط ویراش میشوند. هر صفت S.M.A.R.T هارد به تنهایی دارای مقادیر زیر میباشد:
-
معرف یا شناسه Identifier (بایت) در SMART هارد: برای تشریح معنای این صفت باید گفت، اکثر صفتها دارای معنای استاندارد هستند برای مثال ۵= تعداد سکتورهای تخصیص داده شده به مکانی دیگر ، ۱۹۴= درجه حرارت و سایر موارد مرتبط. اکثر اپلیکیشنها نام صفت و توضیح مختصر در مورد آن صفت را فراهم میآورند تا اگر اسم ها کمی تفاوت داشت از روی توضیحات بتوان صفت را تشخیص داد.
-
داده Data (بایت ۶) در SMART هارد: مقادیر خام اندازهگیری شده توسط حسگرها یا شمارندها، در این فیلد قرار داده میشوند. سپس این داده توسط الگوریتم طراحی شده توسط سازنده هارد دیسک سخت پردازش میشود. گاهی اوقات بخشهای مختلف این مقدار، نشاندهنده اطلاعات مختلفی میباشد برای مثال کم، متوسط، زیاد ۱۶ بیت
-
آستانه Threshold (بایت) در SMART هارد: محدوده خرابی تعریف شده برای صفت.
-
مقدار Value (بایت) در SMART هارد: وضعیت سلامت کنونی. این مقدار خام توسط الگوریتم بررسی میشود. برای دیسک سخت نو، این مقدار زیاد در نظر گرفته شده است. (برای مثال ماکسیسمم مقدار تئوری میتواند ۱۰۰، ۲۰۰ یا ۲۵۳ باشد.) در طول استفاده از دیسک و کم شدن تدریجی عمر دیسک، این مقدار کاهش مییابد.
-
بدترین Worst (بایت) در SMART هارد: کوچکترین مقداری که در چرخه قبلی زندگی دیسک سخت پیدا میشود، این فیلد است.
-
پرچمهای وضعیت Status flags در SMART هارد: هدف اصلی صفت را نشان میدهد. یک صفت میتواند مقدار حیاتی (قادر به پیشبینی خرابی میباشد)، آماری (بهطور مستقیم به وضعیت تاثیری نمیدهد) را داشته باشد.
نکته: نرمافزار میتواند اطلاعات بیشتری در مورد این فیلدها در اختیار بگذارد. برای مثال وضعیت صفت میتواند ok باشد یا always ok یا … باشد. همچنین در مواقع ارزیابی و مدیریت صفات میتواند کمک دهد.
صفتی صحیح است که مقدار آن بزرگتر مساوی مقدار آستانه Threshold باشد.
اگر قانون بالا برای صفت حیاتی صدق نکرد، خرابی پیشبینی شده است. به این معنا که دیسک سخت وضعیت بدی را دارد و بلافاصله باید جایگزین شود (در این حالت صفت مشکل را تشخیص داده است). سازندگان و فروشندگان بهعنوان گارانتی دیسک سخت را تعویض میکنند. توابع SMART هارد در سری جدید بردهای اصلی BIOS قبل از اینکه سیستم عامل لود شود، این وضعیت را به کاربر اخطار میدهند. اگر مقدار آستانه Threshold برای هر صفت صفر باشد، صفت قادر به پیشبینی خرابی نمیباشد زیرا مقدار آستانه Threshold نباید از صفر کمتر باشد.
اگر بخواهیم با قانون ریاضی حساب کنیم، صفتی بینقص تلقی میشود که معادله زیر true باشد.
(A – f(r) >= C (۱
شرح معادله:
-
A – ماکسیسمم مقدار تئوری صفت میباشد. بهترین مقدار ممکن برای صفت در اینجا قرار میگیرد.
-
f – تابعی که میزان کاهش را بر اساس مقادیر خام (r) محاسبه میکند.
-
C – سطح آستانه Threshold مشخص فروشنده میباشد، مقادیری که از این سطح آستانه Threshold پائینتر باشند مشکدار هستند.
عیب این روش این است که مقادیر A, B, C یا تابع f دقیقا تعریف نمیشوند زیرا این مقدار از سازندهای به سازنده دیگر یا از دیسکی به دیسک دیگر که حتی سازنده آنها یکسان است، معنای متفاوتی دارد. از عیبهای دیگر این روش میتوان به ارزیابی مستقل صفات و نادیده گرفتن رابطه بین صفات اشاره کرد.
مشکلاتی که در رابطه با S.M.A.R.T هارد وجود دارد
مدلی که بالا تشریح شد نقاط ضعف بسیاری دارد. بخاطر این مشکلات در اکثر موارد پیش بینی خرابی هیچ وقت بدرستی کار نمی کند. مشکلات عمده را در ادامه شرح خواهیم داد.
۱) مقادیر آستانه Threshold نادرست
اکثر مشکلاتی که در رابطه با S.M.A.R.T هارد وجود دارد (عدم پیشبینی خرابی) بخاطر انتخاب اشتباه مقادیر آستانه Threshold میباشد. بخاطر همین صفات دیسک سخت شانس رسیدن به مقدار آستانه Threshold را ندارند، یعنی قبل از رسیدن به مقدار آستانه Threshold به خرابی میرسند و بلااستفاده میشوند. در این مواقع SMART هارد واقعا به درد پیشبینی خرابی نمیخورند.
در واقع ما می توانیم مقدار غیر واقعی آستانه Threshold را پیدا کنیم. برای مثال در اکثر دیسکهای سخت، قبل ازآنکه S.M.A.R.T هارد مشکلات را پیشبینی و نشان دهد چندین هزار بد سکتور (قابل خواندن و نوشتن نمیباشد) نیاز است (با توجه به اندازه فضای یدکی آزاد). این حجم خرابی به نظر مشکل بزرگی نیست ، زیرا ۱۰۰۰ بدسکتور این چنینی بد تنها ۵۱۲۰۰۰ بایت از داده را در بر دارند و این به معنای از دست دادن ظرفیت دیسک نیست زیرا سریعا از فضای آزاد یدکی استفاده میشود. اما مهم است که این بدسکتورها از کجا متولد شدهاند، در کدام قسمت از روی سطح دیسک قرار گرفتهاند ؟ و نرخ رشد بدسکتور چیست؟
در بیشتر موارد مشکلات زیادی را خیلی پیش تر از آنکه به مقدار آستانه Threshold آن برسد میتوان پیشبینی کرد. برای مثال ممکن است مشکلات هد دیسک باعث بوجود آمدن هزاران سکتور بد شود، همچنین میتواند باعث خوانده نشدن قسمتهای بزرگتر دیسک شود (در این حالت بازیابی دادهها از دیسک نیز امکانپذیر نیست). بررسی این نواحی مشکلساز و ذخیره دادههای موجود در این نواحی در قسمتهای آزاد دیسک سخت ممکن است زمان زیادی ببرد و ممکن است بدون رخداد خطا عملیات انتقال دادهتان به پایان نرسد. در طول این پروسه معمولا سیستم عامل از پاسخگویی اجتناب میکند. بنابراین یک دیسک سخت مشکلدار میتواند کل سیستم را ناپایدار کند.
مقدار: ۲۵۳ آستانه Threshold :۶۳، بر روی این هارد دیسک نیاز است در سطح ۱۹۰۰ بدسکتور بوجود آید تا مقدار آستانه Threshold تامین شود. خوشبختانه در این دیسک در این حد بدسکتور وجود ندارد.
همچنین ما میتوانیم راجع به انتخاب نادرست مقدار آستانه Threshold نیز بحث کنیم. وقتی صفت مربوط به طول عمر دیسک سخت را بررسی میکنیم، میبینیم که بسیاری از سازندگان دیسک سخت طول عمر کلی دیسک را بر آن اساس ۶۰-۷۰ سال یا بیشتر تعیین کردهاند. این موضوع خیلی جالب است، زیرا سازندگان طول عمر طراحی شده دیسک سخت را در کتاب راهنمایش ۵ سال اعلام میکنند. بهعلاوه هنگامیکه به آخر طول عمر تعیین شده کارخانه نزدیک میشویم SMART هارد هشداری برای کاربر ارسال نمیشود زیرا این صفت معمولا” یک مورد مهمی در نظر گرفته نشده است.
در طول ۷۵۹ روز استفاده مقدار از ۹۷ به ۱۰۰ کاهش یافته است. چقدر زمان نیاز داریم تا به پایان طول عمر تعریف شده توسط سازنده برسیم؟
به علاوه مقدار آستانه Threshold برای اکثر صفات حیاتی صفر در نظر گرفته شده است. چون مقدار صفت از صفر کمتر نمیتواند بشود. بنابراین، حتی اگر بخواهند هم، هیچوقت خرابی از این صفات گزارش نخواهد شد. پس نتیجه میگیریم صفات S.M.A.R.T هارد هیچوقت هشداری به ما نمیدهند.
بعضی وقتها صفات خیلی مهم هم به عنوان صفات حیاتی علامت گذاری نمیشوند. این بدان معناست که اپلیکیشن و برنامه های مانیتورینگ ( نظارت ) بر دیسک سخت و مشخصه BIOS S.M.A.R.T هارد نیز هیچوقت این صفات را بررسی نخواهند کرد.
۲) روش ارزیابی اشتباه SMART هارد
اکثر اپلیکیشنها از روش مخصوص سازندگان که در بالا تشریح شد استفاده میکنند تا سلامت دیسک را محاسبه و سپس نمایش دهند. نتیجه بررسی این است که اکثر دیسکهای سخت نسبت به وضعیت واقعیشان خیلی بهتر به نظر میرسند. سازندگان دیسک سخت الگوریتم ها و مقدار آستانه هایی Threshold را برای اینکه نشان دهند دیسک سخت آنها از دیسک سخت سازندگان و دیگر برندها بهتر است انتخاب میکنند. خوب این موضوع می تواند باعث گمراه کردن کاربران و اپلیکیشن ها شود.
نرمافزار نویسان از روشی که سازندگان دیسک سخت برای ارزیابی پیشنهاد میدهند، استفاده میکنند و از خودشان نظری نمیدهند تا وضعیت سلامت واقعی دیسک را بررسی کنند. بخاطر همین ممکن است با این که کاربر از اپلیکیشن مانیتورینگ و نظارت بر دیسک سخت استفاده میکند، بدون دریافت هیچ هشداری یا کاهش عملکرد دستگاه، دیسک سختش قبل از رسیدن به مقدار آستانه Threshold شکست، خراب شود. اینگونه اپلیکیشنها در چنین مواقعی ممکن است طول عمر باقی مانده دیسک سخت را ۱۰-۲۰ سال نشان دهند و این موضوع واقعا سوال برانگیز و مشکوک است.
۳) وزن صفات
صفات مختلف ممکن است روی سلامت دیسک سخت بهطور متفاوت تاثیر بگذارند. برخی صفات همانند (۱۰ – تعداد تلاش مجدد چرخش) خیلی حیاتی هستند. کوچکترین تغییر در این صفت ممکن است فاجعهای را به بار آورد، مثلا نشان دهنده موتور چرخشی و یا یاتاقان خراب است، اما شاید ضعیف بودن منبع تغذیه علت اصلی باشد. برای اینگونه صفات اغلب سازندگان مقدار آستانه Threshold زیادی را درنظر میگیرند به طوری که تولید کننده ها می توانند نسبتا” راحت باشند. اما بخاطر انتخاب مقدار آستانه Threshold و تابع f که در بالا راجع به آن توضیحاتی ارائه شد با بی عدالتی، بعضی از مشکلات کاملا نادیده گرفته میشوند. بنابر این اگر صفات حیاتی تغییراتی در مقدار داشته باشند به کاربران اعلام نخواهد شد.
مشکل دیگری که در این رابطه وجود دارد، اغلب نادیده گرفتن ارتباطات میان صفات میباشد. ممکن است که دو یا چند صفت به مقدار آستانه Threshold خود نزدیک شوند، اما بازهم خرابی پیشبینی نمیشود زیرا هیچ مقداری به سطح آستانه Threshold نرسیده و یا از آن رد نکرده است.
۴) عدم بازخورد
بدون استفاده از نرمافزار مناسب که قادر به خواندن اطلاعات S.M.A.R.T هارد باشد، مشکلات دیسک سخت به اطلاع کاربر نخواهد رسید، مگر زمانی که خیلی دیر شده باشد. اگر تعداد بدسکتورها بکندی افزایش یابد ( دیسک سخت سکتورهای مشکلداری را پیدا میکند، آنها را بررسی و تخصیص reallocate میدهد.) به خصوص زمانیکه اسکرین سیور در حال اجرا باشد ، ممکن است به کاربر هیچگونه اطلاعی داده نشود.اما در طول پروسه تخصیص ( جابجایی سکتور های بد ) سیستم عامل فریز میشود (هنگ می کند و پاسخی نمیدهد). در این حالت کاربران ممکن است سیستم را ریست و یا خاموش کنند. این چنین خاموش کردن سیستم اصلا به ترمیم کمکی نمیکند (زمانی دیگر کار بررسی و تخصیص را دوباره شروع میکند.)
۵) درجه حرارت و مشکلات حسگر
بدون استفاده از نرمافزار کاربر متوجه درجه حرارت بالای دیسک سخت نخواهد شد. CPU و کارتهای گرافیک جدید در مقابل درجه حرارت بالا حفاظت شده اند (بطور اضطراری خاموش می شوند) اما هارد دیسکها محافظ درجه حرارت ندارند. حتی بدتر از همه این است که دیسکهای سخت در مقایسه با دیگر اجزاء داخلی کیس، به درجه حرارت بالا بیشتر از همه حساس هستند. بهمین خاطر است که اکثر سازندگان ماکسیمم درجه حرارت را ۵۰-۵۵ درجه سلسیوس اعلام میکنند.
اکثر BIOSها از اندازهگیری درجه حرارت CPU، سرعت فن و ولتاژ و…. پشتیبانی میکنند اما اندازهگیری درجه حرارت دیسک سخت از BIOS امکانپذیر نیست. اگر درجه حرارت دیسک سخت بالا رود، تابع BIOS S.M.A.R.T هارد قرار نیست هشداری بدهد. پس ممکن است دیسک سخت در شرایط بد دمای بیش از حد بالا در حال کار باشد.
اما بسیار مهم است که بدانید سنسورهای درجه حرارت دیسک آنچنان دقیق نیستند. (گاهی اوقات اختلاف دمای واقعی با دمای اندازهگیری شده ۸-۱۰ درجه یا بیشتر میباشد.) برای اندازهگیری دمای واقعی بهتر است از دستگاه خارجی استفاده کنید (برای مثال دماسنج مادون قرمز) تا بتوانید اختلاف مقادیر اندازهگیری شده و نمایش داده شده را تنظیم کنید، تا با این کار کالیبراسیون اگر مشخصه دماسنج برای نرمافزار تعریف شده باشد، دمای صحیح (تنظیم شده) را نمایش میدهد. حتی زمانیکه کامپیوتر بیکار است و برای مدت طولانی روشن بوده، لازم است تا دمای آن اندازهگیری شود.
اگر درجه حرارت دیسک در مقایسه با دمای محیط خیلی پایین یا خیلی بالا باشد، لازم است دقت سنسور دماسنج تایید شود.
۶) درایورهای نادرست
ممکن است درایورهای نادرست بسیاری برای کنترلرهای دیسک سخت تعریف شده باشد. با این درایورها ممکن است یک یا دو تا از دیسکهای سخت صفات SMART هارد ای که به کنترلرها یا مادربرد اصلی متصل است را پشتیبانی نکنند. نرمافزار عامل اصلی پیدایش این مشکل نیست زیرا اپلیکیشن ها بطور کلی از روشی مشابه آنچه سازنده دیسک سخت برای دسترسی و تشخیص اطلاعات S.M.A.R.T هارد استفاده میکند، پیروی میکنند. ممکن است دو دیسک سخت اطلاعات گزارش شدهشان ۱۰۰ درصد مثل هم باشد. (معمولا این اطلاعات شامل جزئیات هارد PRIMARY و MASTER در هارد های IDE میباشد.) نرمافزارها ممکن است این اتفاق را فیلتر کنند و اطلاعات واقعی را نشان دهند، اما پیشنهاد میشود از صحت جزئیات نشان داده شده اطمینان حاصل کنید. (برای مثال شماره سریال یک دیسک سخت دوبار یا بیشتر تکرار نشده باشد.)
معمولا درایورها رنج محدودی از دستورات دیسک سخت را پیشتیبانی میکنند، بهمین دلیل بعضی از ویژگیها حتی اگر دیسک سخت آنرا پشتیبانی کند، در تمامی حالات کاربردی ندارند. (برای مثال مدیریت صدا acoustic management)
توصیه میشود همیشه این را چک کنید که آیا کارخانه سازنده آپدیت جدید، پکیج های رفع ایراد یا بروزرسان فیر ویری جدیدی بیرون داده است. این ها می توانند موقعیت را بهبود ببخشند. اگر یک کنترلر دارای درایور Raid و غیر Raid میباشد، بسیار مهم است که درایور صحیح را استفاده کنید ( اگر از آرایه Raid استفاده نمی کنید از درایور non-RAID بهره ببرید). انتخاب اشتباه باعث میشود که بعضی از مشخصهها همانند درجه حرارت، وضعیت سلامت نشان داده نشوند.
اکثر مادربردها یا کنترلر دیسک سخت درایورهای ۱۰۰درصد صحیحی را برای ویندوز ویستا و یا دیگر ورژن ها فراهم نمیآورند. این وضعیت مانع تشخیص اطلاعات ریز در دیسک سخت و پیشبینی خرابی در سیستم عامل جدید میشود.
۷) سختافزار نادرست یا داده نادرست
این مشکل و مشکل قبلی بهم مرتبط هستند و میتوان گفت با مطالعه این بخش، بخش قبلی را بهتر متوجه خواهید شد. بعضی از کنترلرهای دیسک سخت و یا مادربردها مقدار آستانه Threshold SMART هارد هارد را یا اصلا اعلام نمیکنند، یا تمامی مقادیر را صفر میگذارند. دیسکهای سختی که به این کنترلرها متصل باشند هیچ هشداری را به هنگام وقوع خرابی اعلام نمیکنند زیرا مقادیر صفات قادر نیستند کمتر از صفر باشند. در این حالت ممکن است اپلیکیشنها وضعیت دیسک سخت را «عالی» گزارش کنند زیرا مقدار صفات با مقدار آستانه Threshold خرابی ظاهرا” خیلی فاصله دارد.
تمامی مقادیر آستانه Threshold صفر درنظر گرفته شده است، یعنی تا ابد جوان و سالم. آیا این حالت ممکن است؟؟
حتی ممکن است اطلاعات گزارش شده از سمت کنترلر دیسک سخت کامل نباشد. این وضعیت در پیشبینی خرابی دیسک سخت تاثیر منفی نمیگذارد اما اطلاعات تشخیص و نمایش داده شده ممکن است اشتباه باشد. خوشبختانه این وضعیت تاثیری در درجه حرارت و همچنین سلامت دیسک سخت ندارد. اپلیکیشنهای جدیدتر امضای ATA و مقادیر checksum را بازبینی میکنند (این دو مشخصه تا بحال در سایت تشریح نشدهاند و باید مطالعاتی در این زمینه داشته باشید page 116 of “AT Attachment – 8 ATA/ATAPI Command Set.) و اگر این مقادیر درست نباشند، پیام هشداری را نمایش میدهند.
حالت ایدهآل: کنترلر و درایور اطلاعات صحیح و قابل اطمینانی را عرضه می نمایند.
بد سکتور ها؟ Relocate در S.M.A.R.T هارد به چه معنایی است؟
یکی از رایجترین سوالاتی که کاربران از ما میپرسند این است که بدسکتور چیست؟ چگونه بوجود میآیند و برای تعمیر و ترمیم آنها چکار باید بکنند؟ نرمافزارهایی که سطح دیسک سخت را پیمایش و بررسی میکنند( برای مثالScandisk ویندوز) هیچگونه خطایی در جهت داشتن بد سکتور در دیسک، اعلام نمیکنند بهمین دلیل کاربران گیج میشوند وقتی میشنوند دیسک سختشان ناگهان بد سکتور پیدا کرده است.
S.M.A.R.T هارد در طی عملیات نرمالش سطح دیسک را بطور مداوم بررسی میکند. اگر ناحیهای مشکلدار را پیدا کند (یک یا چند سکتور که عمل خواندن و نوشتن به سختی انجام شود) سعی میکند داده را از آنجا کپی کند و در فضای آزاد یدکی کپی کند. محل اصلی دادهها بهعنوان بد سکتور برچسب زده میشود و عملیات دسترسی همانند خواندن و نوشتن که به محل اصلی اولیه اشاره داشته باشد به محل جدید آدرسدهی redirected خواهد شد.
پس از اتمام عملیات محل اصلی (که برچسب بد سکتور خورده است) توسط نرمافزار دیگر قابل دسترسی نیست. حتی با نصب نرمافزار جدید یا چندین بارانجام عملیات فرمت، این ناحیه غیر قابل دسترس خواهد بود، زیرا مخل اصلی دیگر استفاده نخواهد شد. بهمین دلیل است که نرمافزار (Scandisk ویندوز) سکتورهای مشکلدار را پیدا نمیکند. تنها تابع امنیتی پاک کردن سخت افزاری به ناحیه برچسب دار دسترسی خواهد داشت و میتواند این سکتورها را حتی پاک کند.
به دلیل SMART هارد است که برای مثال دستور فرمت در DOS بدسکتور ها را در اکثر درایو های مدرن نشان نخواهد داد. ( به استثنای اینکه اگر ناحیه یدکی پر شده است، البته پیدا کردن یک چنین دیسک سختی کار آسانی نیست).
تخصیص این سکتورها ممکن است با خطا یا بدون خطا انجام شود (دیسکهای سخت جدید در مقایسه خیلی بهتر از دیسکهای سخت قدیمی کار میکنند.) اما اگر مدت زمان تخصیص طولانی شود سیستم را دچار بیثباتی میکند.
مراحلی که در بالا تشریح شد را کاربر شاید متوجه نشود مگر تنها زمانی کاربر از وضعیت باخبر میشود که تعداد سکتورهای خراب زیاد باشد ( به آستانه رسیده باشد) و SMART هارد پیشبینی کند که دیسک در حال خراب شدن است.
راهحل
خیلی کم پیش میآید که دیسک سخت بدون هشدار قبل از فاجعه ای خراب شود. البته موارد استثنایی همانند پرت شدن یا افتادن دیسک سخت از ارتفاع، بلایای طبیعی و اتصال برق پرقدرت نیز وجود دارد که این قانون را نقض میکند. البته که SMART هارد قادر به پیشبینی این وضعیت نخواهد بود. معمولا در هر دیسک سخت بد سکتور ایجاد میشود و تعداد آن به تدریج و به آرامی افزایش مییابد بهطوری که در هفتههای اول وخیم شدن وضع سکتورها، هیچ مشکلی گزارش نخواهد شد. در موارد دیگر دمای بالای دیسک و مشکلات صفات حیاتی باعث مرگ دیسک سخت خواهد شد.
همچنین بسیار رایج است که ترکیب یک یا دو صفت نیز باعث ایجاد مشکلات مختلفی شود. برای مثال اگر موتور دیسک سخت نتواند به راحتی بچرخد (و چندین بار تلاش مجدد کند) یا خیلی آهسته شروع به چرخیدن کند، میتواند باعث بروز مشکلات موتوری و یا یاتاقانی شود. این قبیل مشکلات را میتوان از طریق صفات S.M.A.R.T هارد مرتبط ردیابی کرد. بنابراین حتی کوچکترین مشکلات دیسک سخت قابل تشخیص میباشد.
خیلی مهم است که این علائم خیلی قبل از از آنکه بتوانند منجر به خرابی دیسک سخت شوند شناسایی شوند. توصیه می شود مدل های توضیح داده شده بالا رها شده و مقادیر آستانهای Threshold به اشتباه تعریف شده کنار گذاشته شود و فقط مقادیر خام داده های شمارش شده بررسی گردد تا اندازه واقعی مشکلات دیسک سخت شناسایی شوند. پیشنهاد میشود ارتباط بین صفات نیز ارزیابی شود. اگر طبق این روش پیش بروید تصویر واقعی از وضعیت دیسک سختتان پدید میآید و برای هر عملی آماده میشوید و میتوانید از ازدست دادن اطلاعاتتان نیز جلوگیری کنید.
همچنین توصیه می شود با توجه به میزان واقعی استفاده و استرس دیسک سخت، انتخاب کنید چگونه می خواهید ارزیابی موقیت دیسک سخت را مشخص کنید. برای مثال اگر سروری، یا دستگاهی همانند لپ تاپ یا دیسک سختی که اطلاعات حساسی را در خود جای داده است را در نظر بگیریم، کوچکترین مشکل میتواند خطرناک باشد پس لازم است هر مشکل (حتی کوچکترین) آن در نظر گرفته شود.
برخی اپلیکیشنها روشهای ارزیابی متفاوتی را برای استفادههای متفاوت از دیسک سخت پیشنهاد میدهند. از وضعیت فعلی دیسک سخت شرح متنی و نکات قابل توجه متفاوتی ارائه میکنند و برای بهبود وضعیت راهکارهایی ارائه کنند. اگر نرمافزار بتواند هشدارهای منفعل (ایمیل بفرستد، صدا تولید کند و سیستم را خاموش کند) تولید کند خیلی بهتر است اما شاید بهتر باشد نرمافزار بتواند از ازدست دادن اطلاعات جلوگیری کند (مثلا اگر مشکلی پیش آمد سریعا بهصورت خودکار نسخه پشتیبان تهیه کند)