השפה השומרית היא שפה צירופית, אגלוטינטיבית, כלומר, מילים בשפה זו יכולות להכיל שרשרת של מילים מסופחות בתחילתה, בזו אחר זו, בראשית המילה (תחילית) או בסופה (סיומת), כשכל יחידה כזו מוגדרת ונפרדת - אך במבנה המילה החדשה יכולה להיות למושג הבנוי כך משמעות שונה ממשמעו המילה השורשית אליה סופחו התחיליות והסיומות. סדר הוספת היחידות האלה למילה השורשית הנו קבוע: שורש המילה (שם עצם)-תואר-שייכות-כינוי הגוף-ריבוי-יחסה. כך למשל המילה diĝir-gal-gal-ĝu-ne-ra משמעותה המילולית היא: אל-גדול-גדול-שלי-רבים-יחסת מושא עקיף ומובנה "לכל האלים הגדולים שלי".
השפה השומרית היא שפה ארגאטיבית למחצה (Split ergativity)[1] וכשפת "נושא נשוא" בגופים מדבר ונוכח בתיאורי הווה ועתיד, אך כשפה ארגטיבית למחצה, בכל הצורות האחרות יובאו דברים במשפטי חיווי. ההבדל ישמע ויראה על ידי תוספת e למשפטים הנשענים על הרקע האגרטיבי של השפה. כך למשל: במשפט " lugal-e e2 mu-un-du3" הסיומת e מלמדת כי משמעותו "המלך בנה את המקדש (הבית)" לעומת " lugal ba-ĝen" שמשמעותו המלך הלך והוא איננו נאמר כבשפה אגרטיבי "ההליכה (בוצעה) על ידי המלך".
סדר המילים במשפט הפועלי יהיה מושא נושא נשוא, ושמות העצם תמיד יבואו לפני התואר. כדי הדגיש מילה היא הועברה לראשית המבנה או נוסף לה אוגד.
בשומרית אין הבחנה בין זכר לנקבה. יש בחנה בין בני אדם (ואלים, ולעתים גם פסלים) לבין בעלי חיים ועצמיםם דוממים.
בשפה השומרית שני זמנים: זמן עבר וזמן הווה – עתיד.
רבים מן השורשים השומריים הם חד- או דו-הברתיים (למשל igi= עין, e2 = מקדש). הכפלת השורשים משמשת לציון ריבוי של עצמים או פעולות. שמות עצם רבים מורכבים מצירופי מילים, כגון lu gal (איש-גדול) =מלך, dub sab (לוח-כותב) = סופר וכדומה.
שמות-עצם מופשטים נוצרים בעזרת התחילית nam. למשל, nam lugal= מלכות.
שמות התואר בשומרית מעטים, ובמקומם נעשה שימוש רב ביחסת הקניין. כמו כן מועט השימוש במשפטי זיקה. את מקומם תופס לעתים קרובות בינוני-פעול. למשל: e2-a lugal-bi שמשמעותו המילולית: "של הבית, הבעלים שלו", ומובנו: "הבעלים של הבית / המקדש" או eĝer a-ma-ru ba-ur3-ra-ta שמשמעותו המילולית "אחור, מבול, סיומת של קניין, שוטף, סיומת ההופכת מילה לשם עצם (או ליחסת מושא עקיף), סיומת אבלטיבית [המביעה תנועה ממקום מסוים או תנועה סוחפת עמה דבר שהוא]" שמובנו: "אחרי שהמבול שטף (עמו, או על פני האדמה).
ניתן למצוא שימוש רב בצירופים ud-da (כאשר, אם) tukum-bi (אם) אך ב u3 שמובנו ו, וגם, אשר הינו השפעה שמית, השימוש נדיר יותר.
התחביר השומרי מאפשר יצירת חיבור מורכב של פעלים ושתמיד יהוא בראשם שם עצם ליצירת משמעות ניוחדת או ביטויים: כך šu...ti שמשמעותו המילולית הוא "יד מתקרבת" מובנו "לקבל", igi...du8 שמשמעוו המילולית היא "עין פקוחה" מובנו "לראות" וכדומה.
מאפיין נוסף של השפה השומרית הוא המספר הגדול של מילים בעלות אותו מבנה הצליל שיש להן משמעות שונה (homophones)[2]. אלה מובחנות בתעתיק המדעי על ידי הוספת ספרה בתחתיתן.
העובדה שאין לחוקרי השפה וכתביה שום מידע על דרך הביטוי שלה מקשה מאד על הבנתה. פיענוח התעודות נשען על השערות רבות ומביא לכך שיש קריאות שונות לקטע מסוים.
משערים כי השפה כללה את העיצורים הבאים אשר בוטאו בשינויים מסויימים על פי בסיס החיתוך, אופן החיתוך והקוליות.
התנועות הקיימות בשפה השומרית הן: a, e, i, ו u. יתכן כי גם התנועה o הייתה קיימת, אך מכיוון שהיא איננה קיימת באכדית, נעלמה ולא ניתנת לשחזור. יש גם עדויות לכך שבחל מהמקרים תנועות נטמעו בהברות של תחיליות או סיומות מילים. במיוחד כאשר ההברה נשמעת כמו התנועה. בחלק מהמקרים גם השתלטה ההברה על התנועה וכך למשל ua ו ae הופכים ל a, ue ל u וכודמה.
הברה שומרית יכולה להיות בנויה מתנועה, מעיצור ותנועה, מתנועה ועיצור, או מעיצור נועה ועיצור. מבנה מורכב יותר לא נמצא בכתבים.
התעתיק לא"ב לועזי הוא לעתים מאד תלוי חוקר, ותמיד תלוי הקשר. ניתן לקרוא סימן יתדות ככמה לוגוגראמות[3] אפשריות, שכל אחת מהן מתאימה למילה בשפה השומרית, כהברת (תנועה, תנועה ועיצור, עיצור ותנועה או עיצור תנועה ועיצור) או כסמל מייצג של משמעות. חלק מהלוגוגראמות השומריות נכתבו בכמה סימני כתב יתדות, וכל אלה יש בהם להקשות על פיענוח הטקסט, ועל הצגתו בתעתיק לועזי.
הערות:
[1] שפה ארגטיבית (ארגטיבי: שהצטבר, נאסף בהדרגה) הינה שפה שבה הפועל מתאים לא לעושה הפעולה, הפּוׂעֵל אותה, אלא למושא הפעולה,וקיימת בה התייחסות שונה לנושא של פועל עומד ולנושא של פועל יוצא. כך למשל בשפה ארגטיבית לא יאמר "אכלתי פרי" אלא "הפרי נאכל על ידי"; דבר זה ניכר למשל מקריאה במגילת אסתר, שנכתבה בהשפעה פרסית (והפרסית היא שפה ארגטיבית מובהקת) הפסוק "וגם למחר אני קרוא לה" משמעו "היא קראה, זימנה אותי (לבוא) גם למחר" או "הכסף נתון לך והעם לעשות בו כרצונך" משמעו "אתה נתת את הכסף ואת העם" (בפרסית עתיקה ardatam tava dātam מילולית: הכסף נתון לך, וגם על ידך, והמשמעות "אתה נתת את הכסף"). שפה ארגטיבית למחצה עשה שימוש גם במבנים תחביריים ומורפולוגיים (הקשורים לצורת המילים) שאינם אגרגטיביים בחלק מהמקרים בהתאם להקשר.
[2] כדוגמת המילים העבריות לו / לא, או ימים שמשמעותה גם ריבוי של ים וגם של יום וכדומה.
[3][3] קיצור מוסכם למילה מוכרת