תיקון מהיר לדיסק איטי - ilDBA Portal

תיקון מהיר לדיסק איטי

22/04/2014 | פורסם על ידי

 

רציתי לשתף אתכם בתקלה שהיתה לי ובפיתרון שלה.

לפעמים אני רוצה לבדוק גירסה חדשה או יכולת שלא מתועדת מספיק בספרות, ואז אני מסתפק בהקמה של סביבה ווירטואלית בדרך כלל על חומרה זולה (לפעמים זולה מידי) ובדרך כלל אני בוחר ב ESXi או ב ORACLE VM על מחשב עם דיסיקים פנימיים ללא storage חיצוני.

את הסביבה הקמתי בכדי ליבדוק יכולת חזרה מנפילה של דיסקים ב ASM ולכן הזדקקתי לסביבת RAC של שלושה nodes. יצרתי שני דיסקים משותפים ועוד אחד על NFS לצורך ה OCR והתחלתי להתקין את הסביבה. במהלך ההתקנה הבחנתי שהסביבה עובדת לאט מאוד ולאחר ההתקנה בדקתי את מהירות הדיסקים דרך האורקל, וגיליתי זמן תגובה איטי מאוד של כ 60 מילי שניות.

לאחר ההתקנה ותוך כדי impdp של סכמה חדשה נפלו כל ה nodes אחד אחרי השני ובמבט על ה alert log של ה CRS הבחנתי בכך שבכל פעם שהnodes עפים הם מאבדים את יכולת הכתיבה וקריאה ל OCR  שנימצא על שלושה דיסקים ב ASM.  במבט על ה alert log של ה ASM הבחנתי בשגיאות הבאות:


WARNING: Waited 20 secs for write IO to PST disk 1 in group 1.

WARNING: Waited 20 secs for write IO to PST disk 2 in group 1.

NOTE: process _b000_+asm2 (10911886) initiating offline of disk 2.39523275

השגיאה היא על זה שזמן כתיבה יחיד לאיזור ה PST  Partnership and Status Table שזהו בעצם ה מטאדאטה של ה ASM לקח יותר מ 20 שניות והדבר גרם ל ASM להחליט שהדיסק אינו תקין ובעצם לסמן אותו כ offline ולהוציא אותו מן הקבוצה ובגלל שכל ה OCR של ה cluster קיים על הASM כל ה nodes מתפנים מן ה cluster אחד אחרי השני.

לאחר חקירה במסמכים של ה ASM מצאתי פיתרון אלגנטי, יש פרמטר חבוי בשם _asm_hbeatiowait אשר שולט בזמן  (בשניות) של ההחלטה על סימון הדיסקים כ לא פעילים ואם נגדיל את הזמן הזה נוכל לעבוד גם עם דיסקים מאוד מאוד איטיים כל מה שיש לעשות הוא לייצר pfile וממנו spfile ל ASM שמכיל בתוכו את הפרמטר הנ"ל  לדוגמה:


_asm_hbeatiowait = 200

וכך מצאתי יכולת להשתמש בדיסקים האיטיים מאוד לצורך ה CRS ולצורך הבדיקה שלי.

יש לציין שאין להשתמש בפרמטר הזה בסביבות יצור כי כל שימוש בפרמטר חבוי מסיר את התמיכה של אורקל בסביבה לכן מומלץ לפתוח SR בקשר לשימוש בפרמטר חבוי כלשהוא לפני שימוש בסביבת יצור ובכל מקרה אם סביבת היצור שלכם לא מצליחה לעשות פעולת IO לדיסיקים של ה ASM בתוך פחות משנייה אתם בבעיה אחרת.

 

נתראה ברשומה הבאה!

ברוך אוסובסקי,

Baruch@brillix.co.il

 

השאר תגובה:

שם (חובה):
אימייל (לא יפורסם) (חובה):
תגובה (חובה):

*



מאמרים קשורים

OS

OS Background operations

אורי לרנר בטיפ קצר ושימושי על העברת פעולות לרקע במערכת [...]
רשימת

רשימת הפיצ'רים החדשים של אורקל 12.1

אורקל פרסמו את הספרות הרשמית לגרסה 12.1 שיצאה לאחרונה וזמינה להורדה. בין שאר הספרים (החשובים כל אחד שלעצמו), פורסם הספר המסקרן ביותר בעיני – Oracle Database 12c Release 1 (12.1) New Features. זהו ספר שראוי שכל DBA [...]
גרסת

גרסת אורקל 12c זמינה להורדה

בשעה טובה ולאחר המתנה סופר ארוכה, גרסת אורקל 12c (גרסה 12.1) זמינה סוף סוף להורדה רשמית מהאתר של אורקל. הגרסה החדשה מנסה לתת פתרונות לעולם ה"ענן" – ומוסיפה פיצ'רים חדשים שבאים לתת מענה בדיוק [...]
Copyright 2017 ilDBA Portal. Brought to you by Brillix - Israel Leading DBA company. Sponsored by: DBSnaps - Database Video Tutorialss
Website Security Test
%d בלוגרים אהבו את זה: