עובדות וסיפורים מהמחסן

בפוסטים קודמים שלי ,"לחזור אחורה בזמן" ו"תנו לבוס לעשות את העבודה עבורכם" הזכרתי מושגים כגון

דיסק וירטואלי, Storage ו SnapShot.  הפעם בכוונתי להרחיב מעט על מושגים אלו ובאותה הזדמנות לספר לאלו מכם שטרם נתקלו בנט-אפ (Network Appliance, NetApp) על נפלאותיו.   

 

הייתי בין הראשונים בארץ שהפעיל שרת נט-אפ בארץ.  הקונספציה של הנט-אפ הייתה חדשנית ופורצת דרך ונדרשו חזון ואומץ לבחור בה על פני הפתרונות הקונבנציונאליים.  ובכן במה בדיוק היו הדברים אמורים?

 

  • הפרדת ה DATA משרת היישום.  יישום האורקל הותקן על שרת יישומים בעוד הנתונים עצמם ישבו בשרת ה NetApp.
  • הקשר בין שרת היישומים לנתונים שבשרת ה NetApp נעשה דרך רשת התקשורת המקומית (LAN) ולא בכבילה ייעודית כגון כבל SCSI או תקשורת Fiber Channel.  בכדי לקבל ביצועים מיטביים ובכדי להגביר את השרידות נעשה שימוש ב VLAN ו Trunking.  
  • מהירות הכתיבה לשרת הקבצים והקריאה ממנו, היו מהירים מכתיבה וקריאה מול דיסק מקומי.
  • באופן מפתיע צויד השרת במעבד בודד ו"חלש" - פנטיום 60, וזאת בהשוואה לסטנדרט של 2-4 מעבדי פנטיום פרו בשרתי יישומים באותה התקופה.
  • השרת נוהל בידי מערכת הפעלה ייחודית היושבת על דיסקט 1.44 ושלוקח פחות מדקה להעלותה.
  • השרת איפשר הקצאת הרשאות גישה לספריות הקבצים שעליו הן על פי "יוניקס" והן על פי "חלונות" בעת ובעונה אחת.  כלומר ניתן היה לגשת לספריות שבשרת הן מתחנות יוניקס והן מתחנות שמריצות "חלונות" וזאת מבלי להתפשר על רמות ההרשאות הנדרשות.   
  • ניתן היה לשחזר קבצים שנמחקו או שניזוקו בקלות ובמהירות רבה – גם על ידי משתמשים "רגילים".  

 

כאמור מדובר היה בגישה השונה ממערכי RAID הקלאסיים או מערכי אחסון מרכזיים SAN, ועל כך, כ"עד מומחה", ברצוני לספר לכם.  שימו לב, מדובר כאן בניסיוני האישי ולא בסיפורים שספקים למיניהם נוטים לזרוק באוויר.  

 

אך תחילה יש לעשות סדר בטרמינולוגיה.

 

מערך דיסקים ליצירת דיסק וירטואלי – סוגי RAID שונים ומושגים נוספים

 

  • RAID Redundant Array of Independent Disks.  – מערך דיסקים בודדים המשמש ליצירת דיסק לוגי (דיסק וירטואלי).  
  • בקר RAID – רכיב חומרה המיועד לתפעל מערך דיסקים כנ"ל. לעיתים כולל תוכנה ייעודית ולעיתים מאפשר למערכת הפעלה אחרת לנהל את המערך.
  • Hot Spare – דיסק "רזרבי" במערך RAID המיועד להיכנס לעבודה ברגע שמתגלה כשל באחד הדיסקים הפעילים.
  • WAFL File Layout  Write Anywhere – שיטת כתיבה למערך RAID שפיתחה נט-אפ.
  • RAID 0 – שילוב של שני דיסקים (בעלי נפח דומה) או יותר ליצירת דיסק לוגי (דיסק וירטואלי) אחד שנפחו כסכום נפחי הדיסקים ממנו הוא מורכב. יתרון – "דיסק" בעל נפח גדול וביצועים טובים. חסרון במידה ויינזק אחד הדיסקים במערך, יינזק עימו כלל המערך ללא יכולת שחזור.
  • RAID 1 – מערך של שני דיסקים הזהים בגודלם כאשר אחד מהם משמש כהעתק מראה של השני. כלומר כל מה שנרשם על דיסק אחד נרשם במקביל גם על הדיסק השני.  יתרון – שרידות גבוהה.  אם יינזק אחד הדיסקים המידע יישאר וניתן אף להחליף את הדיסק התקול בחדש ולחזור לעבודה.  חסרון – "בזבוז" חצי מנפח הדיסקים. אין שיפור בביצועים.   
  • RAID 10/RAID 0+1 – שילוב בין שתי השיטות שתוארו למעלה.  מחייב לפחות ארבעה דיסקים זהים.  יתרון – שרידות גבוהה, ביצועים משופרים, נפח דיסק לוגי גדול.  חסרון – "בזבוז" חצי מנפח הדיסקים.
  • RAID 5 – מערך של שלושה דיסקים או יותר (הזהים בגודלם), כאשר המידע הנכתב לדיסק הלוגי מתחלק בין הדיסקים הפיסיים באופן הבא:  במידה ובמערך שלושה דיסקים יתחלק המידע בין שני דיסקים בעוד נוסחא (הנקראת Parity) המסכמת את פרטי המידע ואופן רישומו נרשמת לדיסק השלישי. במידה ויש במערך יותר דיסקים יתחלק המידע באופן שווה בין כל הדיסקים להוציא אחד עליו יירשם ה Parity.  שימו לב, הנוסחא נרשמת בכל פעם על דיסק אחר.  ככל שיהיו יותר דיסקים במערך כך ישתפרו הביצועים ויפחת ה"בזבוז" בשטח הדיסקים.  במידה וקיים בלוק פגום באחד הדיסקים הנוסחא מאפשרת "להשלים" את המידע החסר.  אם יכשל אחד הדיסקים ניתן להחליפו בחדש והמערכת תדע לבנות את המערך מחדש ללא פגיעה במידע.  יתרון – שרידות גבוהה, ביצועים טובים (בקריאת נתונים), פחות בזבזני.  חסרון – "בזבוז" כשליש או פחות מנפח הדיסקים, כתיבה איטית יחסית, הרחבת המערך על ידי הוספת דיסקים מסובכת או בלתי אפשרית.
  • RAID 4 – דומה ל RAID 5 אך במקרה זה ה Parity יירשם תמיד בדיסק נפרד שיועד לצורך זה. יתרונות (בהשוואה ל RAID 5) – מהירות הכתיבה גבוהה יותר (כאשר נעשה שימוש ב WAFL), וכן ניתן להרחיב את מערך הדיסקים בקלות רבה.  חסרון – ללא שימוש ב WAFL ייווצרו צווארי בקבוק בכתיבה.
  • RAID 6\RAID 6EE\RAID DP – הרחבה של RAID 4/5 על ידי תוספת דיסקים למערכים גדולים ועל ידי כך לאפשר למערך להתגבר גם על כשל של שני דיסקים בעת ובעונה אחת. ניתן גם להוסיף דיסקים "רזרביים" (Hot Spare) שיכנסו לפעולה ברגע שאחד הדיסקים כושל ועל ידי כך המערכת תתקן את עצמה ללא השבתת העבודה. (ה “E” מציין את מספר הדיסקים הרזרביים. ה “DP” מציין שני דיסקים עבור הנוסחא במערכי RAID 4).  יתרון – שרידות גבוהה מאד.  חסרון – ביצועים מעט פחות טובים, "בזבוז" נפחי דיסק.
 

שלושת הגישות האפשריות לדיסק הוירטואלי – DAS, NAS, SAN

  • DAS Direct Attached Storage – מערך הדיסקים מקושר ישירות לשרת היישומים.  כלומר מדובר בבקר ובמערך דיסקים היושבים בתוך שרת היישומים עצמו, או במארז חיצוני המקושר בכבל SCSI לשרת.  כפי שניתן להבין, למערך הנ"ל "אין חיים" ללא נוכחות שרת היישומים.
  • SAN Storage Area Network – מערך אחסון מרכזי ברשת הזמין לשרתים שונים המריצים מערכות הפעלה שונות.  שרתי היישומים רואים את הדיסק הוירטואלי המוקצה להם כדיסק מקומי. כלומר, הקישור הוא ברמת הבלוק. לא ניתן לשתף מידע בין שרתים שונים.
  • NAS Network Attached Storage – שרת קבצים ברשת (היינו, חומרה, מערכת הפעלה, וכתובת רשת) המאפשר גישה לשרתי יישומים (וכן לתחנות קצה) לכתיבה, לקריאה ולשיתוף מידע.  הקישור הוא ברמת הקובץ.
  • ניתן לראות כיום מערכים המשלבים את הטוב שבעולמות ה NAS וה SAN.
 
באו נט-אפ, לקחו מפה, לקחו משם, המציאו כמה דברים, ערבבו היטב, ויצרו את ה NetApp Filer.

 

אז מה עושה את הנט-אפ למה שהוא – מערכת פורצת דרך?  מערכי RAID היו קיימים הרי עוד לפני פריצת NetApp לחיינו, שרתי קבצים גם כן, ואפילו פתרונות SAN היו כבר אז בשימוש והיוו (כפי שזה היום) פתרון ל"עשירים בלבד"...  ובכן, בנט-אפ הגיעו למסקנה שיש צורך הולך וגובר בנפחי אחסון, והחליטו לפתח appliance יעודי שזה יהיה תפקידו היחיד.  רכיב זה נדרש להיות מהיר, אמין וזול יותר באופן דרמטי מפתרונות אחרים, כלומר היה עליו לספק יחס עלות/תועלת שימצב אותו בבדידות מזהירה כפתרון המועדף.

 

ואלו הם עיקרי תכונותיו:

 

  • מהירות:  
    • דיסקים גדולים ומהירים (ואמינים).
    • מארז ובקר RAID ייחודי המיועד לשיטת RAID 4 (ובהמשך RAID DP) מרובה דיסקים.
    • כמות נכבדה של דיסקים במערך – ככל שיש יותר דיסקים, כך משתפרים הביצועים (בזמנו נטען ש 14 דיסקים במערך היא הכמות האופטימאלית).  כל עוד רמת התפוסה לא תעלה על 80%, ביצועי המערכת לא ייפגעו.    
    • שיטת כתיבה שפותחה במיוחד, WAFL, להאצת תהליך הכתיבה.   בשיטה זו הקובץ שנכתב נפרס על פני כל הדיסקים, וזאת כאשר כל ראשי הכתיבה נמצאים במקום הפנוי הקרוב ביותר.  כלומר, המערכת אינה שולחת את הראשים לרשום את הקובץ במקום השמור עבורו, אלא משנה את מיפוי מיקום הקובץ בהתאם למיקומו החדש.
    • שימוש קצר טווח בזיכרון NVRAM בין כתיבה לכתיבה (כתיבה לדיסקים מתבצעת כל 10 שניות או פחות).  ל NVRAM נרשמות כל פעולות הכתיבה הנדרשות ולאחר הכתיבה בפועל נמחקות ממנו.  ב NVRAM נשמרת גם טבלת מיפוי הקבצים המתעדכנת בכל פעם שמתבצעת כתיבה לדיסקים.  הקריאה נעזרת ב cache בדומה למערכות הפעלה אחרות.
    • מערכת הפעלה, DATA ONTAP, שפיתוחה נועד לאפשר קריאה וכתיבה באופן אופטימלי.
  • אמינות:
    • חומרה ייתרה (redundancy):  דיסקים, ספקי כוח, כרטיסי רשת + החלפת חומרה "חמה".
    • שילוב דיסקים רזרביים, Hot Spare, הנכנסים לעבודה מיידית במקרה של כשל דיסק.
    • סקירת מערכות עצמית ואספקת התראות על תקלות הן לבעל המערכת והן לספק.
    • מערך RAID DP המונע נפילת מערכת אפילו במצב קיצון בו יכשלו בו זמנית שני דיסקים.
    • מניעת פגיעה בשלמות המידע שנכתב למערכת במקרה של הפסקת חשמל או התרסקות. בכל פעם שמתבצעת כתיבה למערכת (כל 10 שניות או פחות) נשמרת ב NVRAM טבלת מיפוי הקבצים העדכנית.  לאחר שהמערכת חוזרת מהנפילה "תתיישר" המערכת לפי טבלה זו, ולאחר מכן תרשום את כל המידע שעדיין שמור ב NVRAM ושטרם נרשם לדיסקים.  
    • אפשרות לחזור לגרסאות קודמות של המידע באמצעות snapshots.  המערכת מאפשרת לשמור את טבלת מיקומי הקבצים נכון לנקודות זמן על פי בחירת האדמיניסטראטור.  הטבלה מצביעה על הקבצים בדיוק כפי שהיו בעת יצירתה (השינויים שהתחוללו מאז נכללים בטבלאות מאוחרות יותר).  מהרגע שבו נשמרה טבלת מיפוי קבצים כ snapshot המערכת לא תשחרר לכתיבה מחדש שטחי דיסק בהם נמצאים קבצים שנמחקו או שונו במידה והם מופיעים באותה הטבלה.
  • מחיר/יתרונות תפעוליים:
    • ניהול מערכת קל, גמיש ויעיל.
    • הרחבת נפחי האחסון on the fly – אחד מיתרונות השימוש ב RAID 4.
    • שימוש ברשת מקומית במקום בכבילה ייחודית יקרה, Fiber Channel (אם כי אופציה זו מוצעת כיום גם כן).
    • גישה לקבצים בפרוטוקולים שונים ולמערכות הפעלה שונות – HTTP, NFS, CIFS, FTP.
    • אפשרית גם גישה ברמת הבלוק (כפתרון SAN) ב iSASI ב LAN או ב FCP ב Fiber.
    • מתאפשרת הרצת מסדי נתונים שונים (ובמקביל) – Oracle, SQL, Exchange ועוד.
    • חסכון בדיסקים מקומיים בשרתי יישומים (במידה וקיימים הרבה שרתים כאלו).
    • חסכון ברישיונות לתוכנת הגיבוי בשל ריכוז כל המידע בשרת בודד.
    • גיבוי "חם" תוך שימוש ב snapshot – אין צורך "להוריד" יישומים.
    • שימוש ב snapshots לשחזור כלל המערכת או קבצים בודדים.
    • כלי SnapMirror המאפשר לשני שרתי נט-אפ או יותר להסתנכרן זה מול זה (DRP).
    • FlexVol – אי תלות בין הדיסק הלוגי והמערך הפיסי מאפשרת גמישות רבה בניהול.
    • יכולת נוספת של המערכת היא זיהוי דופליקציה ברמת הבלוק (והקובץ כמובן) ועדכון טבלת מיקומי הקבצים בהתאם, דבר המביא לחסכון רב בנפח.

 

מידע נוסף:

 

  • למרות שהמערכת מאפשרת לשמור עד 255 snapshots ולמרות שה snapshot עצמו הוא בסך הכל קובץ קטן (טבלת מיקומי הקבצים), אין זה אומר שאין לכך השפעה על נפח האחסון.  מאחר וה snapshot נועל את הקבצים המופיעים בו מפני מחיקה, ככל שנתרחק ממועד לקיחת ה snapshot יצטברו יותר ויותר בלוקים שלא ניתן לכתוב עליהם.  הנפח "המבוזבז" הזה תלוי כמובן בגודל הקבצים ותכיפות השינויים בהם.  לכן חשוב מאד לא להשאיר snapshot מבלי לדאוג למחיקתו לאחר זמן קצוב.
  • תלותיות באמינות הרשת – במידה ויש נפילות ברשת התקשורת עלולים יישומים מסוימים לסבול מכך, בעיקר מסדי נתונים.  
  • הנט-אפ אידיאלי גם בפתרונות וירטואליזציה וגם לפתרונות התאוששות מאסון.
  • נט-אפ מציעים גם פתרונות יקרים פחות תוך שימוש בדיסקים זולים יותר (על חשבון הביצועים).
  • לפתרון NAS שימושי ומאד לא יקר ניתן להשתמש ב PC עם בקר RAID, ארבעה דיסקים גדולים ולא יקרים (למשל 2TB) להתקינם כ RAID 5 לנפח של 6TB, ולהריצם עם מערכת קוד פתוח מבוססת לינוקס כגון FreeNAS.  אמנם אין כאן את כל היתרונות של הנט-אפ, אך אם צריך נפח אחסון בפחות מ 2,000 דולר זהו פתרון מעולה.

 

הרחבה: מצ"ב קישורים נוספים למי שמעוניין להעמיק בחומר.

http://media.netapp.com/documents/tr-3001.pdf

http://media.netapp.com/documents/wp_3298.pdf

http://en.wikipedia.org/wiki/Network-attached_storage

http://www.macam.ac.il/ArticlePage.aspx?id=81

http://www.iopanel.net/forum/thread818.html

 

 

 

*************************ולסיום משהו קצת שונה  -  פינה קבועה*******************************

 

מחידושי מחייה השפה העברית בעת החדשה (ותזכרו היכן נתקלתם בהם לראשונה)

והפעם – עסקים ומוצרים שהצליחו יותר ושהצליחו פחות – הכל בזכות השם (ושהשם ישמור)

 

אלו שהצליחו:

 

תיקון חצות                                מוסך שעובד גם בלילה                      

קיסם למדורה                             ספק פחמים                      

וויליאם הכובס                             מכבסה                

קרם ד'לה קרפ                            קרפיאדה (קרפ צרפתי)                     

הכריכייה                                    סנדוויצ'יה (לכרוך כריך – כזכור לכם)                

מדיח בן דוד                                מדיח כלים תוצרת הארץ (לו חיכינו 2000 שנה)               

מפגש הרקיק (תופיני אווזי לשעבר) מעדנייה בתחנת דלק           

 

ואלו שלא:

 

אחיתופל יועצים                        חברת ייעוץ (שעדיין מחפשת את הלקוח הראשון שלה)

דב שירותים                             חברת שירותים (שטרם שירתה איש)                

צבי קרנות – השקעה בטוחה        חברת השקעות (שקיעה בטוחה?)                   

ספרטה – עינוגי גוף ונפש           ספא (ע"פ מיטב המסורת?- התכוונתם לעינויי גוף ונפש?)          

ברוטוס נאמנויות – נותנים לך גב  משה כהן, עו"ד (שחושב ברצינות לחזור ל "משה כהן, עו"ד")

מוסך כליות                              מכון דיאליזה (כעת מנסים למזער את הנזק)

קנבס – לא תחוש בהם כלל          קונדומים ("לא, זה לא ממש מברזנט, זה רק השם של הדגם")  

 

 

פתגם היום

 

לראות את נאפולי ולמות בעד ארצנו – טיול קטן באירופה לפני המילואים הבאים

 

ממשנתו של "עד מומחה"  Better SAVE than WORRY!

 

 Key Contacts

רפי שקולניק

 Important Links