Reinforcement Learning (RL) primește un sistem de recompense și pedepse. Învățarea prin consolidare este mai amplă decât învățarea monitorizată sau nesupravegheată pentru a atinge un obiectiv sau pentru a câștiga doar din stimulente și penalități din contactul cu mediul.
În ce tip de recompense și pedepse sunt oferite ca feedback?
Primul este feedback evaluativ ca întărire, unde recompensele și pedepsele sunt folosite pentru a modela comportamentul elevului prin mecanisme de învățare de întărire.
Care sunt tipurile de recompense și pedepse?
Acum, să combinăm acești patru termeni: întărire pozitivă, întărire negativă, pedeapsă pozitivă și pedeapsă negativă (Tabelul 1). Se adaugă ceva pentru a crește probabilitatea unui comportament. Se adaugă ceva pentru a reduce probabilitatea unui comportament.
Ce tip de învățare se bazează pe abordarea recompensei și pedepsei?
În mod implicit, fără procesare conștientă, indivizii învață despre valoarea recompensei și pedepsei fiecărui context și activitate. Aceste procese de învățare asociativă afectează, la rândul lor, probabilitatea ca indivizii să se angajeze din nou în astfel de activități sau să caute acel context.
Cum influențează recompensa și pedeapsa învățarea?
În general, am observat un efect redus al recompensei asupra învățării sau reținerii. Pedeapsa nu a avut niciun efect asupra reținerii abilităților, dar a avut un efect semnificativ,efectele dependente de sarcină asupra învăţării. În pedeapsa SRTT viteză îmbunătățită cu impact minim asupra preciziei. În schimb, pedeapsa a afectat performanța la FTT.