מערכת החיזוק

מערכת החיזוק או מערכת התגמול היא מכלול המבנים והמסלולים העצביים במוח שיוצרים תחושה של עונג בתגובה לגירויים מסוימים. מערכת זו משפיעה על ההתנהגות בכך שהיא "מחזקת" התנהגויות שמביאות לגמול חיובי, ומגדילה את הסיכוי שיחזרו על עצמן בעתיד. מערכת החיזוק היא חלק מן המערכת הלימבית, החלק הקדום יותר של המוח האנושי[1].

גמול חיובי וחיזוק עריכה

למושגים של "תגמול" ו"חיזוק" יש חשיבות רבה בפסיכולוגיה, במיוחד בכל הקשור לניסיון להסביר את ההתנהגות ואת תהליכי ההנעה (מוטיבציה) שמובילים אליה.

תחושה חיובית של עונג או הנאה מקושרת פעמים רבות עם התנהגויות שמקדמות את המטרות של האדם (או בעל החיים), בין אם מדובר במטרות בסיסיות של הישרדות המין (כגון אכילה ויחסי מין) או במטרות עקיפות (למשל יחסים חברתיים או רווח כספי). לכן, אחת ההשערות היא שתחושת העונג משמשת כגמול שנועד לדרבן את המוטיבציה של האדם לקדם את אותן מטרות.

לפי הגישה הביהביוריסטית, חיזוק הוא גורם מרכזי בלמידה. בתהליך של התניה אופרנטית, גמול חיובי (חיזוק) שמתקבל לאחר ביצוע התנהגות מסוימת יגדיל את התדירות של ביצוע התנהגות זו בעתיד, ואילו עונש יקטין את הסבירות לביצוע ההתנהגות בעתיד.

מנגנונים פיזיולוגיים ועצביים עריכה

 
תרשים של מסלולי הדופמין במוח. מוקד המסלול המזולימבי הוא על הציר שבין הטגמנטום הגחוני וגרעין האקומבנס.

להצגה של גירוי מחזק יש השפעה על מערכת העצבים. כאשר מתרחשים דברים בעלי יתרון לפרט, מנגנוני חיזוק במוח מופעלים ומשפעלים שינוי בחיבור הסינפטי[2]. שינוי זה מתאפשר הודות לפלסטיות של מערכת העצבים. באופן כללי, מנגנוני החיזוק יכולים לערב אזורים מוחיים רבים[3].

מנגנונים מולקולרים עריכה

למוליך העצבי דופמין יש תפקיד מרכזי במערכת החיזוק[2][4]. הוא משמש כמתווך בתהליך העברת אות החיזוק במוח[3]. ההפעלה הדופמינרגית של מערכת החיזוק בעקבות גירויים מסוימים, חשובה כדי שמערכת ההישרדות תדע לזהות את הגורמים שיתרמו להישרדות האורגניזם על ידי כך שיגרמו לו הנאה, אשר תניע אותו להשיג אותם שוב ושוב[1].

מבנים מוחיים המקושרים למערכת החיזוק באופן משמעותי מעוצבבים על ידי שלוחות דופמינרגיות מהמוח האמצעי[3]. לתאי העצב הדופמינרגים של המוח האמצעי יש תגובה חזקה לחיזוקים ותפקיד חיוני ביצירה של מוטיבציה חיובית[5].

המסלול העיקרי במוח שמזוהה עם חיזוק התנהגותי הוא המסלול המזולימבי של המוליך העצבי דופמין[1][6]. מסלול זה מתחיל בתאים דופמינרגיים (כלומר, תאי עצב שמשחררים דופמין) הממוקמים בטגמנטום הגחוני שבמוח האמצעי. כאשר מערכת החיזוק מופעלת, תאי העצב של הטגמנטום הגחוני מפרישים דופמין לתוך מבנה שנקרא גרעין האקומבנס. בשל התפקיד המרכזי שהוא ממלא במערכת החיזוק[6], גרעין האקומבנס מכונה לעיתים "מרכז העונג" של המוח. עלייה ברמות הדופמין שמגיע לגרעין האקומבנס מתרחשת בעקבות ציפייה לגמול עתידי ולא רק בעקבות גישה לתגמולים קיימים[7].

מלבד גרעין האקומבנס, גם האמיגדלה וההיפוקמפוס נחשבים לחלק מהמסלול המזולימבי. גורם חשוב בשליטה על פעילות התאים הדופמינרגיים בטגמנטום הגחוני הוא האזור הקדם-מצחי בקליפת המוח[8], אשר אצל בני אדם מעורב בהיבטים שונים של חשיבה גבוהה וקבלת החלטות. ייתכן כי האזור הקדם-מצחי הוא זה שמכריע האם גירוי או התנהגות מסוימים נחשבים לכאלה שאכן תורמים לקידום המטרות של בעל החיים, ובהתאם לכך קובע האם להפעיל את מנגנוני החיזוק במוח.

מרכיב נוסף של מערכת החיזוק הוא הסטריאטום[6], שהוא חלק מגרעיני הבסיס אשר מקבל מידע מקליפת המוח הקדם-מצחית. הוא מעורב בהנחיית ההתנהגות אל עבר השגת חיזוקים, על ידי הנעה לבחירה וסידור של הפעולות באופן המכוון להשגת המטרה[7].

פעילותה של מערכת החיזוק מסייעת ללמידה של התניה אופרנטית, ככל הנראה דרך התפקיד שדופמין ממלא בתהליכי הגברה ארוכת טווח (Long-term potentiation) שמתרחשים באזורים שונים במוח. בתהליך של הגברה ארוכת טווח, הלמידה מתבטאת בהתחזקות של סינפסות בין תאי עצב במוח.

ההפעלה הדופמינרגית בעקבות גירוי, שעליה דיברנו עד כה, מכונה הפעלה פאזית (phasic) של דופמין[9] והיא נוצרת כתגובה לאירועים מסוימים בסביבה[10]. בנוסף, הפעלה דופמינרגית קיימת במערכת התגמול גם ללא כל גירוי. זוהי ההפעלה הטונית (tonic) של דופמין, אשר נקראת גם טונוס דופמין. טונוס דופמין זה מעיד על תחושת הרווחה והיכולת של הפרט ליהנות[1]. הורמוני דחק גורמים לירידה בטונוס הדופמין ויוצרים תחושת איום על ההישרדות, יחד עם עלייה בסף ההנאה. זו הסיבה לכך שאדם בזמן דחק לא מצליח ליהנות מדברים שבזמן רוגע היו גורמים לו הנאה[1].

אלקטרופיזיולוגיה של התגמול עריכה

פעילות מוחית מתווכת על ידי מעבר יונים בין תאי עצב. מעברים אלו יוצרים שדה אלקטרומגנטי הניתן למדידה באמצעות כלים מגוונים ביניהם מכשיר EEG, מכשיר המודד את הפוטנציאל החשמלי על הקרקפת. כאשר אדם נחשף לגירוי ויזואלי המסמן כי זכה עבור בחירה מסוימת שעשה בתגמול, לרוב ניתן לזהות שני רכיבים של פוטנציאל קשור אירוע (ERP) ברישומי ה-EEG. רכיב אחד המאופיין בשיא חיובי ברישומי המתח על הקרקפת לאחר כ-300 מילישניות מהצגת הגירוי נקרא P300, והוא ידוע כקשור לגודל התגמול שמסמן הגירוי, וגם לעיבוד גודל התגמול שהיה יכול להתקבל מבחירה בחלופה אחרת אפשריות. רכיב נוסף שנקרא feedback negativity או בקיצור FN מופיע עד 300 מילישניות מהצגת הגירוי. רכיב זה מאופיין בשיא של פוטנציאל שלילי והוא נקשר לעיבוד הכיווניות של התגמול (ערכיות או valiance), האם התגמול הוא חיובי או שלילי[11]. שונות זו בין שני הרכיבים הביאו למסקנה כי ערכיות התגמול וגודלו מעובדים בצורה נפרדת במוח האדם. הפרדה זו ניתנת לזיהוי כבר בשלב מאוד מוקדם, סביב 300 מילישניות מהצגת הגירוי[11]. מחקר משולב אשר השתמש הן ברישומי EEG והן ברישומי fMRI מצא כי רכיב ה-FN נמצא בקורלציה עם אזורים מרכזיים ברשת התגמול, בפרט עם הסטריאטום הגחוני ועם קליפת המוח הקדם מצחית המרכזית[12]. עוד המחקר מציין כי ככל הנראה הרכיב נוצר מפעילות עצבית באזורים אלו[12].

התמכרות עריכה

  ערך מורחב – התמכרות
 
שינויים המתרחשים במערכת החיזוק במצבי התמכרות - התגובה לקוקאין בהשוואה לתגובה למזון.

מערכת החיזוק מופעלת לא רק בתהליכים תקינים של למידה וחיזוק התנהגותי, אלא ממלאת תפקיד פעיל גם ביצירת תופעות של התמכרות[6].

כמעט כל הסמים הממכרים (למשל קוקאין, ניקוטין ואלכוהול) גורמים בצורה ישירה או עקיפה לשחרור של דופמין בתוך גרעין האקומבנס. הסמים הממכרים פועלים בצורה דומה לגירוי חשמלי של מערכת החיזוק במוח, במיוחד כאשר מדובר בסם אשר מתחיל להשפיע תוך זמן קצר מרגע צריכתו. עם זאת, האפקט המיידי של צריכת סמים על ההתנהגות הוא פחות דרמטי מגירוי ישיר של המערכת[13].

בטווח הקצר, ההפעלה של מערכת החיזוק גורמת לתחושה רגעית של אופוריה ולרצון עז לחזור על ההתנהגות, שבמקרה זה משמעה צריכה חוזרת ונשנית של הסם. עם הזמן, מתרחשים שינויים של ממש במעגלים העצביים ובסינפסות במוח, שגורמים להתפתחות של סבילות וכן לאובדן שליטה על ההתנהגות, כך שהשגת הסם הממכר מקבלת קדימות גם על פני מחזקים טבעיים ובסיסיים כמו מזון.

גם סוגים אחרים של התמכרות, למשל התמכרות להימורים או לטלוויזיה, מערבים הפעלה של מערכת החיזוק. במקרים כאלה ההפעלה של מערכת החיזוק היא עקיפה, בדומה לתגובה הטבעית לגירויים מחזקים.

היסטוריה ומחקר עריכה

 
סקינר ערך ניסוי אשר בדק את שינוי תדירות התגובה בעקבות קבלת חיזוק בקרב חולדות. לצורך ניסוי זה הוא בנה את "תיבת סקינר" המכילה: נורה, מגש מזון ודוושה.

בעקבות הטבע הבסיסי של מנגנוני החיזוק, ניתן לחקור אותם גם בקרב מודלים פשוטים יותר של בעלי חיים הרלוונטיים לבני האדם[3].

מערכת התגמול במוח התגלתה לראשונה בשנות ה-50 על ידי החוקרים ג'יימס אולדס ופיטר מילנר, אשר גירו מוחות של חולדות באמצעות זרם חשמלי שהועבר דרך אלקטרודות. החוקרים הבחינו כי לאחר שקיבלו גירוי באזור מסוים במוח, החולדות העדיפו לבלות בחלק של הכלוב שבו הן שהו בעת הגירוי החשמלי. התנהגות זו העידה על כך שקבלת הזרם החשמלי הייתה חוויה חיובית מבחינתן. בניסויים שהחוקרים ערכו לאחר מכן, החולדות יכולות היו לגרום להפעלתו של הגירוי החשמלי בעצמן על ידי לחיצה על מתג. גם כאן, התנהגות החולדות הצביעה על רצון עז לגירוי באותם אזורים במוח - הן לחצו על המתג מאות פעמים בשעה[14]. החוקרים הסיקו כי מדובר באזורים במוח שמעורבים במערכת של תגמול, אשר מעודדת את היצור לחזור על התנהגויות שבוצעו בשעה שהמערכת הופעלה.

תיבת סקינר שימשה ניסוי חשוב בביהביוריזם שנערך על ידי החוקר פרדריק סקינר, אשר הניח את היסודות לחקר ההתניה האופרנטית והפסיכולוגיה הביהביוריסטית. בהתבסס על ניסוי זה, הגדיר סקינר את המונח התניה אופרנטית כשינוי בתדירות התגובה בעקבות קבלת חיזוק לאחר ביצוע התגובה.

מחקרים שונים ניסו לבדוק מתי גירויים חיוביים גורמים להפעלתה של מערכת החיזוק. אחד הממצאים היה שהמערכת מופעלת בעיקר בתגובה לגירויים חיוביים שהם בלתי צפויים. לאחר למידת ההתניה האופרנטית, כאשר ישנה ציפייה לקבלת התגמול החיובי, הגירוי החיובי כבר לא מפעיל את תאי העצב של מערכת החיזוק[15].

ראו גם עריכה

קישורים חיצוניים עריכה

  מדיה וקבצים בנושא מערכת החיזוק בוויקישיתוף

הערות שוליים עריכה

  1. ^ 1 2 3 4 5 מוניץ, ח' (עורך). (2016). פרקים נבחרים בפסיכיאטריה מהדורה שישית. תל אביב: דיונון.
  2. ^ 1 2 Neil R. Carlson, (2013). Physiology of Behavior. Boston: Pearson.
  3. ^ 1 2 3 4 Tripp, G., & Wickens, J. R. (2009). Neurobiology of ADHD. Neuropharmacology,57(7), 579-589.
  4. ^ Fiorillo, C. D., Tobler, P. N., & Schultz, W. (2003). Discrete coding of reward probability and uncertainty by dopamine neurons. Science, 299(5614), 1898-1902.
  5. ^ Bromberg-Martin, E. S., Matsumoto, M., & Hikosaka, O. (2010). Dopamine in motivational control: rewarding, aversive, and alerting. Neuron, 68(5), 815-834.
  6. ^ 1 2 3 4 Ranganath, A., & Jacob, S. N. (2016). Doping the mind: dopaminergic modulation of prefrontal cortical cognition. The Neuroscientist, 22(6), 593-603.
  7. ^ 1 2 Calkins, Susan D. (Ed); Bell, Martha Ann (Ed), (2010). Child development at the intersection of emotion and cognition. Human brain development. Washington, DC, US: American Psychological Association.
  8. ^ Gariano RF & Groves PM (1988). "Burst firing induced in midbrain dopamine neurons by stimulation of the medial prefrontal and anterior cingulate cortices". Brain Research. 462 (1): 194–198. doi:10.1016/0006-8993(88)90606-3. PMID 3179734.
  9. ^ Grace, A. A. (1991). Phasic versus tonic dopamine release and the modulation of dopamine system responsivity: a hypothesis for the etiology of schizophrenia.Neuroscience, 41(1), 1-24.
  10. ^ Söderlund, G.,B.W., Sikström, S., Loftesnes, J. M., & Sonuga-Barke, E. (2010). The effects of background white noise on memory performance in inattentive school children. Behavioral and Brain Functions, 6, 55.
  11. ^ 1 2 Yeung, N., & Sanfey, A. G. (2004). Independent coding of reward magnitude and valence in the human brain. Journal of Neuroscience, 24(28), 6258-6264.
  12. ^ 1 2 Carlson, J. M., Foti, D., Mujica-Parodi, L. R., Harmon-Jones, E., & Hajcak, G. (2011). Ventral striatal and medial prefrontal BOLD activation is correlated with reward-related electrocortical activity: a combined ERP and fMRI study. Neuroimage, 57(4), 1608-1616.
  13. ^ Wise RA (2002). "Brain reward circuitry: Insights from unsensed incentives". Neuron. 36 (2): 229–240. doi:10.1016/S0896-6273(02)00965-0. PMID 12383779.
  14. ^ Olds J & Milner P (1954). "Positive Reinforcement Produced by Electrical Stimulation of Septal Area and Other Regions of Rat Brain". Journal of Comparative and Physiological Psychology. 47 (6): 419–427. doi:10.1037/h0058775. PMID 13233369.
  15. ^ Mirenowicz J & Schultz W (1994). "Importance of unpredictability for reward responses in primate dopamine neurons" (PDF). Journal of Neurophysiology. 72 (2): 1024–1027. PMID 7983508.