Tâm lý học căn bản - Chương 05 - Phần 5
11. Phân biệt giữa
tiến trình tạo điều kiện hạn chế và tiến trình tạo điều kiện tác động
Cho đến đây, chúng
ta đã bàn về tiến trình tạo ĐKHC và tiến trình tạo ĐKTĐ giống như chúng là hai
khảo hướng khác biệt nhau vậy. Thực ra, hai loại tiến trình tạo ĐK này có một
số đặc điểm chung.
Chẳng hạn, các hiện
tượng tổng quát hóa và phân biệt kích thích khám phá được trong tiến trình tạo
ĐKTĐ cũng giống như trong tiến trình tạo ĐKHC. Con bồ câu đã học được cách mổ
vào khoen màu đỏ để nhận thức ăn sẽ có thể hành động giống như vậy đối với
chiếc khoen màu xanh, chứng tỏ hiện tượng tổng quát hóa kích thích đã xảy ra.
Tương tự, các hiện tượng phân biệt cũng hiện diện trong tiến trình tạo ĐKTĐ.
Một đứa trẻ nhờ khích lệ của cha mẹ nó mà nó biết rằng nó phải tránh xa người
lạ, nhưng phải lễ độ với người quen biết, cũng minh chứng nguyên tắc phân biệt.
Sự kiện các hiện
tượng tổng quát hóa và phân biệt kích thích đồng thời góp mặt trong cả hai tiến
trình tạo ĐKHC và tạo ĐKTĐ cho thấy sự khác biệt giữa hai loại học hỏi này
không luôn luôn rõ rệt. Thí dụ, hãy xét xem điều gì sẽ xảy ra khi bạn được gọi
vào nhà ăn tối. Khi nghe được tiếng gọi ăn cơm, bạn bắt đầu ứa nước bọt, và mùi
thức ăn tỏa ra càng nồng hơn khi bạn đến gần nhà bếp. Bạn nhanh chân bước đến
bàn ăn thịnh soạn gồm thịt bò rán, khoai tây chiến và salad.
Hành vi của bạn là
tiến trình tạo ĐKHC hay tiến trình tạo ĐKTĐ? Thực tế, chính là cả hai. Nước bọt
ứa ra phản ánh tiến trình tạo ĐKHC. Bạn đã học hỏi được cách liên kết tiếng gọi
vào nhà ăn cơm với phần thức ăn nhận được sau đó. Nhưng, những bước chân đưa
bạn đến bàn ăn thực tế cho phép bạn nhận được phần thưởng là thức ăn, phản ảnh
một khuôn mẫu cư xử đã học hỏi được nhờ tiến trình tạo ĐKTĐ. Bạn đã phản ứng có
chủ ý theo cách thức giúp bạn nhận được phần thưởng.
Như đã biết, sự
phân biệt giữa tiến trình tạo ĐKHC và tạo ĐKTĐ không luôn luôn tức thời sáng tỏ
khi chúng ta xem xét các thí dụ cụ thể về hành vi, bởi vì cả hai tiến trình
thường vận hành dưới dạng một chuỗi hành vị đặc biệt. Ngoài ra, ngay một số
khác biệt căn bản nhất giữa hai tiến trình tạo ĐK này cũng bị cho là đáng ngờ
vực. Thí dụ, như đã thảo luận ở Chương 2, nhờ phản hồi sinh học (bio–feedback)
người ta có thể kiểm soát được các phản ứng “ngoại ý” (involuntaly responses),
như huyết áp và nhịp tim chẳng hạn. Như vậy, những gì thường bị cho là phản ứng
liên hệ đến tiến trình tạo ĐKHC nay có thể được xem xét theo tiến trình tạo
ĐKTĐ.
Ngay đến bản chất
cốt yếu của tiến trình tạo ĐKHC cũng đã bị phản bác. Thí dụ, nhà tâm lý chuyên
về vấn đề học hỏi Roberts Rescorla (1988) đã nêu nghi vấn đối với giả thuyết
căn bản của tiến trinh tạo ĐKHC cho rằng học hỏi là hậu quả của việc cặp đôi
các kích thích một cách máy móc và đơn giản. Thay vì thế, ông lập luận rằng
muốn cho tiến trình tạo ĐK xảy ra, sinh vật phải vận dụng sự xuất hiện của kích
thích CĐK để dự đoán (predict) sự hiện điện của kích thích KĐK. Chính giá trị
thông tin của kích thích CĐK dẫn đến tiến trình tạo ĐKHC, theo quan điểm của
Rescorla.
Thế nhưng, mặc dù
nhiều nghi vấn liên quan đến tiến trình tạo ĐKHC và tiến trình tạo ĐKTĐ đến nay
vẫn chưa giải đáp được, hai tiến trình này khác biệt nhau trong đa số trường
hợp phân tích hành vi của các nhà tâm lý: trong tiến trình tạo ĐKHC, kích thích
KĐC xuất hiện trước phản ứng; và phản ứng ấy do kích thích không điều kiện gây
ra. Ngược lại, trong tiến trình tạo ĐKTĐ, phản ứng được phát sinh trước khi
được khích lệ, và do đó được thực hiện một cách có chủ đích – tức là, phản ứng
được thực hiện nhằm mục đích nhận được phần thưởng. Như vậy, trong tiến trình
tạo ĐKHC thì phản ứng là không chủ ý, còn trong tiến trình tạo ĐKTĐ thì phản
ứng là có chủ ý.
TRÍCH DẪN THỜI SỰ
HỌC TẬP GIỐNG NHƯ
CON NGƯỜI: THIẾT LẬP CÁC MẠNG THẦN KINH QUA MÁY ĐIỆN TOÁN
Máy điện toán tự
rèn luyện cách đọc chữ. Khởi đầu, các cố gắng của nó có vẻ giống như những câu
nói lắp bắp bởi vì nó chưa được cung cấp bất kỳ quy tắc nào về cách phát âm các
mẫu tự (chữ cái). Nhưng sau khi óc điện tử nhận được các phản hồi hiệu chỉnh
ngay sau mỗi sai lầm, chẳng bao lâu nó bắt đầu phát ra được các âm thanh bập bạ
giống như trẻ con học nói khi nó học được cách phân biệt giữa các nguyên âm và
phụ âm. Sau một buổi tối ra sức tính toán, nó đã nói được khá lưu loát chỉ với
một ít sai sót không đáng kể.
Các hệ chương trình
điện toán mới, như hệ chương trình do Terrence Seinowski ở viện đại học Johns–Hopkins
thiết lập, chứng minh rằng máy điện toán có thể học d0ược cách học tập – và
đang tiến hành làm rõ cách thức tự học của con người. Những chương trình mới mẻ
này đều căn cứ vào các kiến thức về cấu trúc não bộ mà các nhà tâm sinh lý ngày
càng nhanh chóng tích lũy được.
Như bạn còn nhớ
thảo luận của chúng ta ở Chương 2, các nhóm nơron trong não bộ được tổ chức
thành các mạng lưới thần kinh nhằm bố trí các liên kết truyền thông giữa các tế
bào. Nhờ mô phỏng các mạng lưới này trong các chương trình điện toán, các nhà
nghiên cứu đang nỗ lực phát triển các máy điện toán có khả năng tự viết chương
trình, không buộc con người phải đưa ra một loạt quy tắc và mệnh lệnh cho máy
tuân theo.
Máy điện toán sử
dụng mạng thần kinh vận hành theo một cung cách tương tự cách vận dụng các
nơron của não bộ trong quá trình học tập. Thay vì giải một bài toán bằng một
loạt các bước liên tiếp nhau, mỗi bước một động tác, các đơn vị xử lý thông tin
của máy điện toán (gọi là node) được lập trình nhằm vận hành mọi bước cùng một
lúc để giải bài toán ấy, giống như các hoạt động của hàng tỷ tế bào trong não
bộ. Mỗi node điện toán nối liền với các node khác theo các mức độ nối kết bền
vững khác nhau cũng tương tự như cách nối kết các nơron thông qua các khớp thần
kinh trong não bộ.
Mỗi node điện toán
chấp nhận một mức khởi động đặc biệt; chính mức này quyết định tình trạng hoặc
động hoặc tĩnh, nhờ đó node sẽ “khởi động” chuyển thông tin sang cho một node
khác. Ngoài ra, không chỉ khác biệt nhau về mức độ khởi động, tầm quan trọng về
mặt nối kết giữa hai node cũng khác biệt nhau. Người lập trình có thể cài đặt
trước vào máy bất kỳ biến số nào về mức độ khởi động cũng như mức độ nối kết,
hoặc máy điện toán tự nó có thể thông qua trình thủ tục thử thách – và – sai
lầm để lập ra các mức độ riêng cho nó, tùy theo bản chất bài toán mà nó sẽ giải
đáp.
Khi phải giải một
bài toán, hệ thống điện toán xử lý thông tin đồng thời trên nhiều mức độ khác
nhau. Không giống như các chương trính điện toán trước đây, trong đó các quy tắc
nhất thiết phải được ấn định trước (thí dụ, mẫu tự “t” khi theo sau nó là mẫu
tự “h” được phát âm khác với trường hợp theo sau nó là một nguyên âm), máy điện
toán thiết kế theo mạng thần kinh có thể thiết lập được các quy tắc riêng của
máy căn cứ vào phản hồi mà máy nhận được.
Điều đặc biệt thú
vị chính là cách thức vận dụng các phản hồi điện tử mà máy nhận lại mô phỏng
theo các kỹ thuật uốn nắn do các nhà tâm lý đã khám phá ra được nhằm làm nền
tảng cho việc học hỏi các thông tin phức tạp. Ngoài ra, các máy điện toán thiết
kế theo mạng thần kinh đang giúp người ta làm rõ các nghi vấn như trong trường
hợp chỉ nhờ vào việc ứng dụng đơn thuần các quy tắc người ta sẽ phải học hỏi
đến mức độ nào, và trong tình huống nào thì tiến trình tạo điều kiện hạn chế và
tạo điều kiện tác động là thích hợp nhất.
Tuy nhiên, đến nay
máy điện toán vẫn chưa sánh kịp khả năng học tập của con người. Nếu như quả
thực não bộ con người có đến hơn 1015 nối kết thần kinh, thì
trong tương lai gần có lẽ người ta chưa thể chế tạo nổi loại máy điện toán nào
sánh kịp khả năng của con người. Nhưng chắc hẳn ngày ấy sẽ đến khi một máy điện
toán hoạt động hữu hiệu hơn được chế tạo ra – chính nó sẽ giúp chúng ta tìm
hiểu hoàn hảo hơn nữa về tiến trình học hỏi của con người.
12. Các hạn chế đối
vốn khả năng học hỏi của sinh vật: Không thể huấn luyện con chó già làm bất cứ
trò nào
Keller và Mariand
Breland hài lòng về ý định của họ. Với tư cách là cố vấn cho các nhà huấn luyện
thú chuyên nghiệp, hai người đã nảy ra sáng kiến dạy một chú heo đẩy một chiếc
đĩa gỗ vào khe nhét tiền ở con heo đất. Nhờ kinh nghiệm dạy loài vật bằng kỹ
thuật tạo ĐKTĐ, họ nghĩ rằng công tác huấn luyện sẽ dễ dàng bởi vì nó hoàn toàn
phù hợp với khả năng của loài heo. Vậy mà lần luyện tập nào cũng bị thất bại:
nhác trông thấy chiếc đĩa, mấy chú heo không chịu làm gì khác ngoài việc dùng
mõm ủi chiếc đĩa khắp mặt đất. Rõ ràng, các chú heo đã bị định hình về mặt sinh
vật chỉ có phản ứng dùng mõm ủi các vật có hình dạng chiếc đĩa.
Không thành công
với loài vật ngu ngốc khiến cho gia đình Breland nghĩ đến loại gấu trúc Bắc Mỹ
(racoon). Song việc huấn luyện chỉ thành công với một chiếc đĩa. Khi dùng đến
hai chiếc đĩa, chú gấu không chịu nhét chiếc đĩa nào vào khe cả; thay vì thế,
nó cọ xát hai chiếc đĩa với nhau giống như động tác rửa đĩa vậy. Một lần nữa,
dường như chiếc đĩa gợi ra các hành vi bẩm sinh của loài vật đến mức không thể
nào cải biến được dù đã cất công sử dụng các kỹ thuật huấn luyện khổ nhọc nhất.
Các khó khăn mà gia
đình Breland gặp phải minh chứng một điểm quan trọng: không phải loài vật nào
cũng học tập được mọi hành vi như nhau. Có các hạn chế sinh vật (biological
constraints), tức là giới hạn bẩm sinh, khống chế một khả năng học hỏi một hành
vi nào đó của loài vật. Trong một số trường hợp, một sinh vật có năng khiếu đặc
biệt giúp nó học hỏi được một loại hành vi (như hành vi mổ khoen của loài bồ
câu chẳng hạn); trong các trường hợp khác, các hạn chế sinh vật sẽ tác động
ngăn cản hoặc cấm đoán sinh vật học tập cách thực hiện một loại hành vi: dù
trong trường hợp nào, rõ ràng mọi loài sinh vật đều có cơ chế học hỏi chuyên
biệt ảnh hưởng đến khả năng học tập theo cả hai tiến trình tạo ĐKHC và tạo
ĐKTĐ, và một loài bẩm sinh chuyên phát huy được các dạng liên kết đặc biệt cũng
như bị trở ngại trong việc học tập các hành vi khác.
13. Tóm tắt và học
ôn II/6–12
A. TÓM TẮT
– Không cần phải
luôn luôn được khích lệ sinh vật mới học tập và duy trì được một hành vi mong
muốn. Trên thực tế, lịch khen thưởng từng phần (partial schedules of
reinforcement) đề kháng hiện tượng giải trừ (extinction) mạnh mẽ hơn lịch khen
thưởng liên tục (continuous schedules of reinforcement).
– Đối với lịch khen
thưởng theo tỷ lệ cố định (fixed ratio schedules), việc khích lệ chỉ được thực
hiện sau khi một số lần phản ứng nhất định đã diễn ra. Còn đối với lịch khen
thưởng theo tỷ lệ biến động (variable–ratio schedules), việc khích lệ được thực
hiện sau khi một số phản ứng không nhất định đã diễn ra.
– Theo lịch khen
thưởng cách quãng cố định (fixed–interval schedules), việc khích lệ một hành vi
mong muốn chỉ được thực hiện cách sau lần khích lệ trước một khoảng thời gian
nhất định. Ngược lại, theo lịch khen thưởng các quãng biến động (variable–interval
schedules), khoảng thời gian giữa hai lần khích lệ liên tiếp biến đổi quanh một
khoảng thời gian trung bình.
– Các hiện tượng
căn bản thuộc tiến trình do ĐKTĐ là tổng quát hóa (generali–zation), phân biệt
(discrimination), và uốn nắn (shaping).
– Các hạn chế sinh
vật (biological constraints) giúp cho, ngăn cấm, hoặc cản trở mọi loài sinh vật
học tập cách thực hiện một hành vi.
B. HỌC ÔN
1/ Theo lịch khen
thưởng... thỉnh thoảng hành vi mới được khích lệ; còn theo lịch khen thưởng...
sau mỗi lần diễn ra hành vi luôn luôn được khen thưởng.
2/ Sau khi việc
khích lệ đã chấm dứt, hành vi học hỏi được sẽ kéo dài lâu hơn nếu như nó được
học hỏi theo lịch khen thưởng từng phần. Đúng hay sai?...
3/ Cặp đôi loại
lịch khen thưởng với định nghĩa của nó.
a... theo tỷ lệ cố
định
b... cách quãng
biến động
c... cách quãng cố
định
d... theo tỷ lệ
biến động
1) khen thưởng sau
một thời gian nhất định.
2) khen thưởng sau
một số lần phản ứng nhất định.
3) khen thưởng sau
một thời gian không nhất định.
4) khen thưởng sau
một số lần phản ứng không nhất định.
4/ Lịch khen thưởng
cố định tạo ra sức đề kháng đối với hiện tượng giải trừ (extinction) mạnh mẽ
hơn so với lịch khen thưởng biến động. Đúng hay Sai?...
5/... là biện pháp
huấn luyện cách thực hiện một hành vi phức tạp nhờ khen thưởng cho việc thực
hiện thành công các hành vi dần dần giống hệt với hành vi mong muốn.
6/ Các nguyên tắc
thuộc tiến trình tạo ĐK đã chứng tỏ rằng, với khích lệ đúng mức người ta có thể
huấn luyện loài vật thực hiện được bất kỳ hành vi nào thuộc phạm vi khả năng cơ
thể của chúng. Đúng hay Sai?...
7/ Nêu ra hai khác
biệt giữa tiến trình tạo ĐKHC và tiến trình tạo ĐKTĐ.
C. CÂU HỎI TỰ VẤN
Nếu được yêu cầu “chữa
trị” hành vi mê tín của Wade Boggs, bạn sẽ dùng các kỹ thuật nào?
(Giải đáp câu hỏi
học ôn ở cuối chương)
III. NGHIÊN
CƯU TIẾN TRÌNH HỌC HỎI THEO KHẢO HƯỚNG HOẠT ĐỘNG TRÍ TUỆ
Trong bộ phim chiếu
trên truyền hình, tên tội phạm nện đầu viện sĩ quan cảnh sát vào tường. Khi
viên cảnh sát gục ngã, tên tội phạm tìm cách thoát thân. Hắn mỉm cười đắc thắng
rồi lạnh lùng giẫm lên xác người để chạy đi.
Xem phim ấy vào
buổi tối hôm trước, một cậu bé tìm cách đánh nhau với em trai mình. Trước đây,
những trận đánh nhau hiếm khi có hành vi bạo lực, nhưng lần này cậu bé nện đầu
em trai mình vào tường rồi cố giẫm chân lên người đứa em trai của nó.
Động cơ thôi thúc
hành vi mới mẻ này của cậu bé thật rõ rệt: ấy là bộ phim chiếu trên truyền
hình. Thế nhưng, tiến trình làm nền tảng cho hành vi của cậu bé không dễ dàng
giải thích được bằng quan điểm tạo ĐKHC hay quan điểm tạo ĐKTĐ. Hành vi nện đầu
ai đó vào tường dường như đều không phải là phản ứng KĐK hay phản ứng CĐK. Hơn
nữa, nếu như cậu bé chưa từng đánh nhau theo kiểu này trong quá khứ thì cậu bé
hẳn sẽ khó có cơ hội được khích lệ vì hành vi như thế, theo chủ trương của quan
điểm tạo ĐKTĐ.
Các trường hợp như
vậy hàm ý rằng phải có một số dạng học hỏi liên can đến tiến trình tư duy cao
cấp trong đó các ý tưởng và ký ức cũng như cách thức xử lý thông tin của con
người lý giải các phản ứng của họ. Các tình huống ấy hoàn toàn đi ngược lại
quan điểm cho rằng học hỏi là hậu quả của sự nối kết kích thích với phản ứng
theo cung cách máy móc, tự động, và không dính líu gì đến hoạt động tư duy theo
chủ trương tạo ĐKHC, hoặc quan điểm cho rằng học hỏi là hậu quả của khích lệ
theo chủ trương tạo ĐKTĐ.
Xuất phát từ các
tình huống như thế, một số nhà tâm lý quan niệm học hỏi như là các tiến trình
tư duy, hoặc nói khác cho rằng các hoạt động trí tuệ làm nền tảng cho việc học
hỏi – một khảo hướng mệnh danh là thuyết học hỏi do hoạt động trí tuệ
(cognitive learning theory). Mặc dù không phủ nhận tầm quan trọng của các tiến
trình tạo ĐKHC và tạo ĐKTĐ, các nhà tâm lý theo thuyết này đã xây dựng một khảo
hướng chú trọng đến các tiến trình tâm trí vô hình diễn ra trong suốt quá trình
học hỏi, chứ không chỉ tập trung vào các kích thích phản ứng, và khích lệ ở bên
ngoài.
Theo cách trình bày
đơn giản nhất, thuyết này chủ trương rằng không đủ cơ sở để kết luận rằng người
ta sở dĩ có phản ứng là do mối liên kết giữa một kích thích và một phản ứng được
suy đoán là hình thành bởi kinh nghiệm được khích lệ trong quá khứ đối với phản
ứng ấy. Theo quan điểm này, thực ra con người – và cả loài vật – xây đắp một kì
vọng (an expectation) rằng mình sẽ nhận được phần thưởng cho việc thực hiện
phản ứng.
Chứng cứ bênh vực
cho quan điểm xuất phát từ vài phía. Thí dụ, chúng ta đã từng bàn đến hiện
tượng phong tỏa (blocking) trong tiến trình tạo ĐKHC ở loài chuột. Song lẽ, một
số chứng cứ trực tiếp nhất liên quan đến các tiến trình trí tuệ lại thoát thai
từ một loạt thí nghiệm nhằm khám phá một dạng học hỏi do một loạt trí tuệ
(cognitive learning) gọi là học hỏi ngấm ngầm. Trong tiến trình học hỏi ngấm
ngầm (latent learning), thành quả học hỏi được một hành vi chỉ được công khai
khi tiếp nhận khích lệ cho việc biểu lộ hành vi ấy. Trong các cuộc nghiên cứu
về dạng học hỏi này, người ta xem xét hành vi của các chú chuột trong một mê
cung như trình bày ở hình 5–8 (a). Và trong một thí nghiệm tiêu biểu, người ta
cho một nhóm buột đi lang thang trong mê cung ấy mỗi ngày một lần trong vòng 17
ngày và không hề nhận được phần thưởng; không lạ gì bọn chuột này phạm rất
nhiều sai lầm và phải mất khoảng thời gian khá lâu mới thoát khỏi mê cung ấy.
Còn nhóm chuột thứ hai luôn luôn được thưởng thức ăn ở cuối mê lộ nên chúng
nhanh chóng chạy thẳng đến hộp thức ăn và phạm rất ít sai lầm.
Nhóm chuột thứ ba
khởi sự giống như tình huống nhóm chuột không được thưởng, nhưng chỉ trong 10
ngày mà thôi. Đến ngày thứ 11, người ta tiến hành một thủ thuật thí nghiệm
quyết định: từ thời điểm ấy trở đi, nhóm chuột này nhận được thức ăn khi đi hết
mê lộ. Kết quả của thủ thuật này thật đáng ngạc nhiên như bạn thấy ở biểu đồ
trong Hình 5–8 (b). Lũ chuột trước đây không được hưởng dường như đi lang thang
không mục đích, nay đã giảm bớt thời gian chạy và hạ thấp mức sai lầm đến mức
hầu như bắt kịp bọn chuột thuộc nhóm nhận được phần thưởng ngay từ đầu.
Đối với các lý
thuyết gia về hoạt động trí tuệ, hầu như rõ ràng rằng bọn chuột không được
thưởng đã tìm hiểu được bản đồ mê cung trong các lần thăm dò ban đầu; và chúng
chỉ biểu lộ việc học hỏi ngấm ngầm ấy khi nhận được khen thưởng. Như vậy, bọn
chuột đã lập được một bản đồ trong tâm trí (a cognitive map) về mê cung ấy –
một biểu trưng cho các vị tế và phương hướng không gian trong tâm trí.
Con người cũng lập
được các biểu đồ trong tâm trí về cảnh vật chung quanh họ, căn cứ chủ yếu vào
các mốc địa giới đặc biệt. Lần đầu gặp phải một khung cảnh mới mẻ, bản đồ của
họ thường dựa vào các con đường cụ thể – như khi chúng ta chỉ đường cho những
người xa lạ tới khu vực mình ở: “Rẽ phải ở bản hiệu dừng, rẽ trái ở chiếc cầu,
và sau đó đi lên dốc.” Nhưng khi đã quen thuộc với khu vực ấy rồi, người ta
hình thành một khái niệm toàn cảnh về khu vực, được gọi là bản đồ trừu tượng
trong tâm trí. Vận dụng một bản đồ như thế sau cùng họ có thể chọn được các con
đường từ khi đã biết cặn kẽ khu vực ấy.
Dù vậy, không may
là các bản đồ trong tâm trí chúng ta thường mắc nhiều sai lầm do việc đơn giản
hóa địa hình thực tế. Chúng ta có khuynh hướng lập bản đồ bỏ sót các đường cong
và thay vào đó bằng cách hình dung các khu vực giới hạn bởi các giao lộ thẳng
tắp. Như vậy, các bản đồ trong tâm trí chúng ta chỉ là các phiên bản bất toàn
của bản đồ thực tại.
Mặc dù các điểm
thiếu chính xác như thế, nhưng khả năng lập bản đồ trong tâm trí nhờ tiến trình
học hỏi ngấm ngầm phản ảnh một nghi vấn đối với quan điểm của các lý thuyết gia
cố chấp vào tác dụng của khích lệ. Chẳng hạn, nếu xem xét kết quả trong thí
nghiệm mê cung của Tolman, chúng ta không biết rõ loại khích lệ đặc biệt nào
khiến cho bọn chuột không nhận được phần thưởng lại chịu tìm hiểu để lập bản đồ
mê cung, bởi vì hiển nhiên không có một tác nhân khích lệ nào hiện diện cả. Dù
chúng ta có thể giả định tác nhân nội tâm – như sự thỏa mãn óc tò mò của sinh
vật chẳng hạn – thì lối nói như vậy sẽ gây khó khăn cho các nhà tâm lý theo
khảo hướng tác phong (behavioral psychologists).
Hình 5–8: (a) Để nỗ lực minh chứng tiến trình học hỏi ngấm ngầm,
người ta cho bọn chuột chạy lang thang khắp mê cung theo kiểu này một lần trong
vòng 17 ngày. (b) Bọn chuột không hề được thưởng (nhóm kiểm soát không được
hưởng) luôn luôn phạm nhiều sai lầm nhất, còn bọn chuột nhận được thức ăn cuối
mê lộ mỗi ngày (nhóm kiểm soát có thưởng) phạt sai lầm ít hơn nhiều. Nhưng kết
quả cũng minh chứng được hiện tượng học hỏi ngấm ngầm: bọn chuột khởi đầu không
được thưởng nhưng chỉ bắt đầu được thưởng từ cuối ngày thứ 11 trở đi (nhóm thí
nghiệm) cho thấy lập tức giảm bớt sai lầm và chẳng bao lâu bắt kịp nhóm chuột
luôn luôn được thưởng. Theo các lý thuyết gia về vấn đề học hỏi do hoạt động
trí tuệ, tình trạng hạ thấp sai lầm cho thấy bọn chuột đã lập được một bản đồ
trong tâm trí – một biểu trưng cho hoạt động tâm trí – về mê cung ấy (Tolman
& Honzik, 1930)