Phát Minh Cuối Cùng - Chương 13

13

Bản Chất

Không Thể Hiểu Được

Sẽ là hợp lý khi giả định rằng siêu trí tuệ nhân tạo đầu tiên sẽ có sức mạnh siêu việt, bởi cả hai lý do: nó có khả năng vượt trội trong việc lập kế hoạch, và nó có thể phát triển ra các công nghệ mới. Nhiều khả năng nó sẽ không có đối thủ: nó có thể đạt tới bất cứ kết quả nào nó muốn và bẻ gãy mọi ý đồ ngăn cản sự hiện thực hóa mục tiêu hàng đầu của nó. Nó sẽ tiêu diệt mọi tác nhân khác thuyết phục chúng thay đổi hành vi, hoặc chặn đứng các nỗ lực can thiệp. Ngay cả một “siêu trí tuệ nhân tạo bị xiềng xích,” đang chạy trên một máy tính không kết nối và chỉ có thể tương tác với phần còn lại của thế giới qua giao diện văn bản, cũng có thể vượt ngục bằng cách thuyết phục những kẻ canh giữ giải phóng cho nó. Thậm chí đã có vài bằng chứng thực nghiệm sơ bộ cho thấy chuyện sẽ diễn ra như vậy.1

Nick Bostrom

Viện Tương lai nhân loại, Đại học Oxford Khi mà AI đang tiến lên trong quá nhiều mặt trận, từ Siri đến Watson, từ OpenCog đến LIDA, thì khó có thể tin rằng việc đạt tới AGI sẽ không thành hiện thực bởi vấn đề là quá khó. Nếu cách tiếp cận bằng khoa học máy tính thất bại, thì kỹ nghệ đảo ngược bộ não sẽ thành công, dù mất nhiều thời gian hơn. Đó là mục tiếu của Rick Granger: hiểu thấu bộ não từ dưới lên, bằng cách tái tạo những cấu trúc cơ bản nhất của não trong các chương trình máy tính. Và ông không đừng được việc chế nhạo những người đang nghiên cứu các nguyên lý nhận thức theo kiểu từ trên xuống, bằng khoa học máy tính.

“Họ đang nghiên cứu hành vi con người và cố gắng tìm hiểu xem họ có thể mô phỏng hành vi đó với một máy tính. Công bằng mà nói, chuyện này hơi giống việc cố hiểu một cái xe ô tô nhưng lại không nhìn vào trong xe. Chúng ta nghĩ rằng chúng ta có thể viết được ra trí thông minh là gì. Chúng ta nghĩ rằng chúng ta có thể viết được ra sự học là gì. Chúng ta nghĩ rằng chúng ta có thể viết được ra các kỹ năng thích ứng là gì. Nhưng lý do duy nhất khiến chúng ta có được bất cứ khái niệm nào về chúng là bởi chúng ta quan sát thấy con người làm những việc ‘thông minh.’ Vấn đề là chỉ nhìn con người làm những việc đó sẽ không cho ta biết được bất kỳ chi tiết cụ thể nào về điều thực sự đang diễn ra. Câu hỏi phản biện ở đây là: đặc điểm kỹ thuật của sự suy lý và sự học là gì? Không có đặc điểm kỹ thuật nào cả, vậy thì họ đang xây dựng mọi thứ trên cơ sở nào, ngoại trừ việc quan sát đơn thuần?”

Và chúng ta biết mình là những kẻ tự quan sát tồi tệ. “Hết lần này đến lần khác, một lượng lớn các nghiên cứu trong tâm lý học, khoa học thần kinh và khoa học nhận thức cho thấy chúng ta kém cỏi kinh khủng khi phải xem xét nội tâm mình,” Granger nói. “Chúng ta không hiểu chút nào về hành vi của bản thân, cũng như những quá trình tạo nên chúng.” Granger lưu ý rằng chúng ta cũng yếu kém như thế khi phải đưa ra các quyết định duy lý, cung cấp chính xác lời khai nhân chứng và nhớ lại những gì vừa xảy ra. Nhưng sự giới hạn trong khả năng quan sát của chúng ta không có nghĩa rằng các khoa học nhận thức dựa trên sự quan sát đều là vớ vẩn. Granger chỉ nghĩ rằng chúng là những công cụ sai lầm khi muốn đột nhập khu vườn của trí thông minh.

“Trong khoa học thần kinh điện toán chúng tôi nói rằng ‘tốt, vậy thì não người thực sự làm cái gì?’ ” Granger nói. “Không phải cái ta nghĩ rằng nó đang làm, và không phải cái ta muốn nó làm. Nó thực sự làm cái gì? Có lẽ những thứ đó, lần đầu tiên sẽ cho ta định nghĩa về trí thông minh, định nghĩa về sự thích nghi, định nghĩa về ngôn ngữ.”

Việc suy luận các nguyên tắc điện toán của bộ não bắt đầu khi các nhà khoa học kiểm tra xem những cụm neuron trong não đang làm gì. Neuron là những tế bào có khả năng gửi và nhận các tín hiệu điện hóa học. Những phần quan trọng nhất của chúng là sợi trục (chất xơ kết nối neuron với nhau, thường là nơi gửi tín hiệu), khớp (mối nối nơi tín hiệu giao nhau) và sợi nhánh (thường là nơi nhận tín hiệu). Có khoảng 100 tỉ neuron trong não. Mỗi neuron được kết nối với hàng chục ngàn neuron khác. Sự kết nối chằng chịt này khiến các hoạt động của não diễn ra song song, thay vì theo chuỗi như hầu hết các máy tính. Theo thuật ngữ máy tính thì xử lý theo chuỗi nghĩa là xử lý liên tiếp – thực hiện từng phép tính một. Xử lý song song nghĩa là nhiều dữ liệu được thao tác đồng thời – nhiều lúc hàng chục ngàn, thậm chí hàng triệu tính toán xảy ra cùng lúc.

Thử tưởng tượng trong giây lát về một con phố tấp nập, và nghĩ đến tất cả những dữ liệu đầu vào về màu sắc, âm thanh, mùi vị, nhiệt độ và xúc giác đang cùng lúc nhập vào bộ não của bạn qua mắt, tai, mũi, chân tay và da thịt. Nếu bộ não của bạn không phải là một cơ quan có khả năng xử lý tất cả những thứ đó đồng thời, lập tức nó sẽ bị quá tải. Thay vào đó, các giác quan của bạn thu thập mọi dữ liệu đó, xử lý nó bằng các neuron trong não, và xuất các dữ liệu đầu ra, tức hành vi, ví dụ đứng trong phần đường đi bộ và tránh va chạm với những khách bộ hành khác.

Tập hợp các neuron hoạt động trong cùng một mạch rất giống với mạch điện. Một mạch điện thì có dòng điện, và dòng điện đó được chạy qua các dây dẫn và các bộ phận đặc biệt như điện trở và diode. Trong quá trình đó, dòng điện sẽ thực hiện các chức năng như thắp sáng bóng đèn hoặc chạy máy cắt cỏ. Nếu bạn tạo ra một danh sách những câu lệnh làm nên chức năng hoặc tính toán đó, bạn sẽ có một chương trình máy tính, hoặc một giải thuật.

Những cụm neuron trong não bạn tạo nên những mạch có chức năng hoạt động như những giải thuật. Và chúng không thắp sáng cái gì cả, nhưng chúng nhận diện các gương mặt, lên kế hoạch đi nghỉ hè và viết ra một câu văn. Tất cả được vận hành song song. Bằng cách nào mà các nhà nghiên cứu biết được điều gì đang diễn ra trong những cụm neuron đó? Nói một cách đơn giản, họ thu thập các dữ liệu giải pháp có độ phân giải cao với các công cụ chụp hình neuron đa dạng, từ những điện cực được cấy trực tiếp vào não của động vật, cho đến những máy móc phức tạp như máy chụp cắt lớp (PET) và máy chụp cộng hưởng từ chức năng (fMRI) cho người. Các máy thăm dò thần kinh trong và ngoài não có thể cho biết từng neuron đơn lẻ đang làm gì, trong khi đánh dấu neuron bằng thuốc nhuộm nhạy cảm điện áp sẽ cho thấy những neuron nào đang được kích hoạt. Từ những kỹ thuật này và một số kỹ thuật khác, xuất hiện những giả thuyết có thể kiểm chứng về các giải thuật chi phối mạch não. Người ta cũng đã bắt đầu xác định chức năng chính xác của một số vùng trong não. Ví dụ, hơn một thập niên nay, các nhà khoa học thần kinh đã biết công việc nhận dạng gương mặt thuộc về một bộ phận của não được gọi là hồi hình thoi⦾.

Vậy vấn đề là gì? Nếu một hệ thống điện toán được bắt nguồn từ bộ não (cách tiếp cận bằng khoa học thần kinh điện toán), nó có hoạt động tốt hơn một hệ thống được tạo ra theo kiểu de novo (cách tiếp cận bằng khoa học máy tính)?

Có một loại hệ thống khởi nguồn từ bộ não, đó là mạng neuron nhân tạo, nó hoạt động tốt và lâu đến mức đã trở thành xương sống của ngành AI. Như chúng ta đã thảo luận ở Chương 7, ANN (thứ có thể được tạo ra bằng phần cứng hoặc phần mềm) đã được phát minh vào những năm 1960 để vận hành như neuron. Một trong những lợi ích chủ chốt của nó là có thể dạy nó được. Ví dụ, nếu bạn muốn dạy cho một mạng neuron cách dịch từ tiếng Phap sang tiếng Anh, bạn có thể dạy nó bằng cách nhập các văn bản tiếng Pháp và bản dịch chính xác sang tiếng Anh của chúng vào máy. Cách này gọi là học có kiểm soát. Khi có đủ thí dụ, mạng này sẽ nhận ra được các quy luật kết nối các từ tiếng Pháp với các từ tiếng Anh tương ứng.

Trong não, các khớp thần kinh kết nối các neuron, và sự học xuất hiện trong những kết nối đó. Kết nối của khớp càng mạnh thì ký ức càng sâu sắc. Trong ANN, độ mạnh của một kết nối khớp được gọi là “độ nặng” của nó, và nó được biểu thị dưới dạng một xác suất. Một ANN sẽ gán các độ nặng của khớp với các quy tắc phiên dịch ngoại ngữ mà nó thu được từ việc huấn luyện. Huấn luyện càng nhiều thì nó dịch càng tốt. Trong huấn luyện, ANN sẽ học cách nhận ra các lỗi sai của nó, và điều chỉnh các độ nặng của khớp tùy theo đó. Điều đó có nghĩa là mạng neuron có tính chất tự cải tiến.

Sau quá trình huấn luyện, khi văn bản tiếng Pháp được nhập vào, ANN sẽ căn cứ vào các quy tắc được xác suất hóa mà nó thu được trong quá trình học và xuất ra bản dịch tốt nhất. Về bản chất, ANN đang nhận dạng các kiểu mẫu trong kho dữ liệu. Ngày nay, việc tìm ra các mẫu từ trong một lượng lớn dữ liệu hỗn độn là một trong những công việc sinh lợi nhất của AI.

Bên cạnh dịch thuật và khai thác dữ liệu, ANN hiện được dùng trong các AI trò chơi máy tính, trong việc phân tích thị trường chứng khoán và nhận diện các vật thể trong tranh ảnh. Chúng có trong các Chương trình Nhận dạng Ký tự bằng Thị giác dùng để đọc văn bản được in ra và trong các con chip máy tính dùng để điều khiển tên lửa. ANN thêm phần “thông minh” vào “bom thông minh” Chúng cũng sẽ là thứ có tính quyết định trong hầu hết các kiến trúc AGI.

Cần nhắc lại một số điều quan trọng ở Chương 7 về những mạng neuron thường gặp này. Giống các giải thuật di truyền, ANN là những hệ thống “hộp đen.” Tức dữ liệu đầu vào – trong ví dụ này là tiếng Pháp – là rõ ràng. Và dữ liệu đầu ra – ở đây là tiếng Anh – cũng dễ hiểu. Nhưng điều gì đã xảy ra giữa hai đầu đó thl không ai biết. Tất cả những gì nhà lập trình có thể làm là huấn luyện ANN bằng các ví dụ, và cố gắng cải thiện dữ liệu đầu ra. Bởi thứ mà các công cụ trí tuệ nhân tạo dạng “hộp đen” xuất ra không bao giờ có thể dự đoán được, chúng sẽ không bao giờ đáng tin và an toàn.

Dựa trên kết quả thu được, các giải thuật xuất phát từ não của Granger chúng minh rằng cách tốt nhất để tìm kiếm tri thông minh có lẽ là đi theo hình mẫu của tạo hóa – bộ não người – thay vì theo các hệ thống de novo của khoa học nhận thức.

Vào năm 2007, các sinh viên của ông tại Đại học Dartmouth đã tạo ra một giải thuật thị giác bắt nguồn từ bộ não, nó nhận dạng các vật thể nhanh hơn các giải thuật truyền thống 140 lần. Nó vượt qua 80.000 giải thuật khác để giành giải thưởng 10.000 đô-la của IBM.

Vào năm 2010, Granger và đồng nghiệp là Ashok Chandrashekar đã tạo ra các giải thuật bắt nguồn từ bộ não cho việc học có kiểm soát. Học có kiểm soát được dùng để dạy máy móc các ký tự hình ảnh và nhận dạng giọng nói, lọc thư rác… Được thiết kế để dùng với các vi xử lý song song, những giải thuật từ bộ não của họ thực hiện các công việc chính xác ngang với các giải thuật theo dãy, nhưng nhanh hơn 10 lần. Những giải thuật mới này được tìm ra khi quan sát các cụm, hay các mạng neuron thông thường nhất trong não.

Vào năm 2011, Granger và các đồng nghiệp được cấp bằng phát minh vì đã tạo ra một con chip xử lý song song có thể tái cấu hình dựa trên những giải thuật này Điều đó có nghĩa là một số phần cứng thường gặp nhất trong não có thể được tái sản xuất trong một con chip mấy tính. Khi liên kết các con chip đó với nhau, giống như chương trình SyNAPSE của IBM, bạn sẽ tạo ra một bộ não ảo. Và hiện nay, mỗi một con chip này có thể tăng tốc và tăng cường hiệu suất của các hệ thống được thiết kế để nhận dạng gương mặt trong đám đông, tìm bệ phóng tên lửa trong những bức ảnh vệ tinh, tự động dán nhãn cho bộ sưu tập ảnh kỹ thuật số lộn xộn của bạn, và hàng trăm việc khác. Theo thời gian, các mạch khởi nguồn từ não có thể đem tới khả năng chữa trị cho những bộ não bị tổn thương, bằng cách chế tạo các thiết bị hỗ trợ hoặc thay thế cho phần não yếu. Một ngày nào đó, những con chip xử lý song song mà đội của Granger đã phát minh sẽ thay thế cho các “phần ướt” bị hỏng của bộ não.

Trong khi đó, các phần mềm được suy luận từ não đang dần thâm nhập vào cách thức xử lý điện toán truyền thống. Hạch nền là một bộ phận cổ xưa của não có nguồn gốc từ loài bò sát, gắn với việc điều khiển vận động. Các nhà nghiên cứu nhận ra hạch nền sử dụng những giải thuật dạng học hỏi tăng cường để thu thập các kỹ năng. Đội của Granger đã khám phá ra các mạch trong vỏ não, phần được thêm vào não sau cùng, đã tạo ra những hệ thống thứ bậc về các thực tế và tạo ra các mối tương quan giữa các thực tế đó, tương tự như các cơ sở dữ liệu phân cấp. Đó là hai cơ chế khác nhau.

Bây giờ đến phần thú vị: các mạch trong hai phần nói trên của não (hạch nền và vỏ não) được kết nối bằng các mạch khác, kết hợp những hiệu năng của chúng. Trong điện toán cũng có một thứ tương tự. Các hệ thống máy tính học hỏi tăng cường hoạt động bằng cách thử-sai, chúng cần kiểm tra vô vàn khả năng để biết được câu trả lời đúng. Đó là cách thức nguyên thủy mà chúng ta dùng hạch nền để học các thói quen, ví dụ như cách đi xe đạp hay đánh một quả bóng chày.

Nhưng con người cũng có một hệ thống phân cấp ở vỏ não, thứ cho phép chúng ta thay vì tìm kiếm một cách mù quáng qua tất cả các khả năng thử-sai, thì sẽ phân loại chúng, sắp xếp thứ bậc cho chúng, và chọn lọc các khả năng đó theo cách thông minh hơn nhiều. Sự kết hợp này hoạt động nhanh hơn hẳn, đưa đến những giải pháp tốt hơn nhiều so với các động vật khác, ví dụ các loài bò sát vốn chỉ dùng mỗi hệ thống thử-sai của hạch nền.

Có lẽ thứ cao cấp nhất mà chúng ta có thể làm với sự kết hợp vỏ não – hạch nền là thực hiện các phép thử-sai trong não mà thậm chí không cần phải thử nghiệm chúng trong đời thực. Chúng ta có thể làm điều đó nhiều lần bằng cách chỉ cần nghĩ về nó: mô phỏng tất cả trong đầu mình. Các giải thuật nhân tạo kết hợp những phương pháp này thực hiện tốt hơn nhiều so với từng phương pháp riêng lẻ. Granger giả định rằng điều đó rất giống với ưu thế được tạo ra khi hai hệ thống trong não kết hợp với nhau.

Granger và các nhà khoa học thần kinh khác cũng đã khám phá ra rằng chỉ có một số ít loại giải thuật thống trị các mạch não. Các hệ thống điện toán cốt lõi giống nhau được sử dụng lặp đi lặp lại trong những hoạt động nhận thức và cảm giác khác nhau, chẳng hạn như nghe hoặc suy luận. Một khi những hoạt động này được tái lập trong phần mềm và phần cứng máy tính, có lẽ chúng có thể được nhân đôi một cách đơn giản để tạo ra các module mô phỏng những phần khác nhau của não. Và việc tái lập các giải thuật, ví dụ như giải thuật nghe, sẽ tạo ra những ứng dụng nhận dạng giọng nói tốt hơn. Thực tế, chuyện này đã diễn ra rồi.

Kurzweil là một trong những nhà phát minh đầu tiên áp dụng các hiểu biết về não vào lập trình. Như chúng ta đã thảo luận, ông cho rằng kỹ nghệ đảo ngược bộ não là con đường triển vọng nhất dẫn tới AGI. Trong một bài luận bảo vệ cho quan điểm này và các tiên đoán của ông về những cột mốc công nghệ, ông viết:

Về cơ bản, chúng ta đang tìm kiếm các phương pháp lấy cảm hứng từ sinh học để tăng tốc các tiến bộ trong ngành AI, một bộ phận lớn của ngành này đang phát triển mà không có những hiểu biết quan trọng về cách mà bộ não thực hiện những chức năng tương tự. Từ công việc của riêng tôi trong lĩnh vực nhận dạng giọng nói, tôi hiểu rằng công việc của chúng ta sẽ tiến triển nhanh hơn nhiều nếu chúng ta có được những hiểu biết sâu về cách bộ não chuẩn bị và biến đổi thông tin dạng âm thanh.2

Trở lại với những năm 1990, công ty Kurzweil Computer Technologies đã có đột phá mới trong nhận dạng giọng nói với những ứng dụng được thiết kế để các bác sĩ kê bệnh án bằng lời. Kurzweil đã bán công ty này, và nó trở thành một trong những tiền thân của Nuance Communications, Inc. Bất cứ khi nào bạn dùng Siri, các giải thuật của Nuance sẽ phụ trách phần nhận dạng giọng nói diệu kỳ của nó. Nhận dạng giọng nói là nghệ thuật dịch âm nói sang văn bản (đừng nhầm với NLP là hiểu nghĩa của văn bản viết). Sau khi Siri dịch câu hỏi của bạn sang dạng văn bản, ba khả năng khác của nó bắt đầu làm việc: triển khai NLP, tìm kiếm một cơ sở dữ liệu kiến thức rộng lớn, và tương tác với các nhà cung cấp dịch vụ tìm kiếm Internet như OpenTable, Movietickets và Wolfram Alpha.

Watson của IBM là một dạng Siri phiên bản khủng, và là một nhà vô địch về NLP. Vào tháng 2/2011, nó sử dụng cả hai loại hệ thống khởi nguồn từ não và hệ thống lấy cảm hứng từ não để có được chiến thắng ngoạn mục trước các đối thủ con người trong trò Jeopardy!. Cũng như máy tính vô địch cờ vua Deep Blue, Watson là cách để IBM phô diễn kỹ nghệ điện toán của mình trong quá trình theo đuổi lĩnh vực AI. Trò chơi lâu đời này hứa hẹn là một thử thách khó nhằn bởi tính mở của các dấu hiệu và trò chơi chữ. Người chơi phải hiểu được những cách chơi chữ, cách ví von, những điển tích văn hóa đặc thù, và họ phải đặt các câu trả lời dưới dạng các câu hỏi. Tuy nhiên, nhận dạng ngôn ngữ không phải là chuyên môn của Watson. Nó không có khả năng hiểu lời nói. Và vì nó không thể nhìn hoặc cảm nhận, cũng không đọc được, nên khi thi đội của Watson phải nhập bằng tay các câu hỏi của Jeopardy!. Và vì Watson cũng không thể nghe, nên các dấu hiệu bằng âm thanh và hình ảnh không được sử dụng.

Nào gượm đã, có thật là Watson đã thắng trò Jeopardy! không, hay chỉ là một phiên bản đặc biệt của nó thôi?

Kể từ chiến thắng đó, để Watson hiểu được mọi người nói gì, IBM đã tích hợp vào nó công nghệ nhận dạng giọng nói của Nuance. Và Watson đang đọc hàng terabyte dữ liệu về ngành y. Một trong các mục tiêu của IBM là thu nhỏ Watson lại từ kích thước hiện tại – một phòng đầy những máy chủ – thành kích cỡ một cái tủ lạnh và khiến nó trở thành bác sĩ khám bệnh tốt nhất thế giới. Một ngày nào đó không xa, có lẽ bạn sẽ có cuộc hẹn với một trợ lý ảo, nó sẽ đặt cho bạn rất nhiều câu hỏi và cung cấp cho dược sĩ của bạn một đơn thuốc.3 Không may là Watson vẫn chưa thể nhìn được và chưa thể nhận biết được các dấu hiệu sức khỏe như mắt sáng, má hồng, hay một vết thương do vừa bị bắn. IBM cũng lên kế hoạch đưa Watson vào điện thoại thông minh như một ứng dụng Hỏi-Đáp tối thượng.

Những kỹ năng khởi nguồn từ não của Watson đến từ đâu? Phần cứng của nó là một hệ thống song song siêu lớn, sử dụng khoảng 3.000 bộ vi xử lý song song để chạy 180 phần mềm khác nhau được viết chuyên dụng.4 Xử lý song song là khả năng tuyệt vời nhất của bộ não, các nhà phát triển phần mềm mô phỏng nó rất vất vả. Như Granger đã nói với tôi, các bộ vi xử lý song song và phần mềm được thiết kế cho chúng đã không đạt kỳ vọng. Tại sao? Bởi những chương trình viết cho chúng không giỏi chia nhỏ các nhiệm vụ để giải quyết song song. Nhưng như Watson từng trình diễn, các phần mềm song song được cải tiến đã thay đổi tất cả những điều đó, và phần cứng song song đang theo sát đằng sau. Các con chip song song mới đang được thiết kế để tăng tốc đáng kể phần mềm hiện có.

Watson cho thấy kỹ nghệ song song có thể giải quyết một lượng công việc điện toán khổng lồ với tốc độ tia chớp. Nhưng thành tựu chinh của Watson là ở chỗ nó có thể tự học. Các giải thuật của nó tìm các mối tương quan và hình mẫu trong dữ liệu văn bản mà nhà chế tạo đưa cho nó. Bao nhiêu dữ liệu? Các bộ bách khoa toàn thư, báo chí, tiểu thuyết, từ điển đồng nghĩa, toàn bộ Wikipedia, Kinh Thánh – tổng cộng bằng khoảng tám triệu cuốn sách dày, được nó đọc với tốc độ 500 gigabyte (1.000 cuốn sách dày) mỗi giây. Đáng kể ở chỗ những thứ đó bao gồm cơ sở dữ liệu từ vựng, phân loại từ vựng (từ vựng được sắp theo thư mục và phân loại) và từ điển tương quan (mô tả từ vựng và cách chúng liên hệ với nhau). Về cơ bản, đấy là một lượng lớn những hiểu biết thông thường về từ ngữ. Ví dụ: “Trần nhà là phần trên của ngôi nhà, không phải phần dưới, ví dụ tầng hầm, và không phải phần bên, ví dụ bức tường.” Câu này cho Watson biết một ít về trẩn nhà, ngôi nhà, tầng hầm và bức tường, nhưng nó cần phải biết định nghĩa của mỗi thứ đó để câu này có thể hiểu được, và cả định nghĩa của từ “phần” nữa. Và nó sẽ muốn xem những thuật ngữ này được dùng trong các câu thế nào, càng nhiều ví dụ càng tốt. Watson có được tất cả những điều đó.5

Trong phần hai của trò chơi Jeopardy!, gợi ý này được đưa ra: “Điều khoản này nằm trong một bản giao kèo công đoàn nói rằng lương sẽ tăng hoặc giảm tùy thuộc vào một số tiêu chí như chi phí sinh hoạt.” Đầu tiên Watson phân tích cú pháp, nghĩa là nó chọn và phân tích những từ chủ chốt của câu văn. Sau đó nó tìm thấy trong nguồn dữ liệu đã được tiếp nhận rằng lương là một thứ có thể tăng hoặc giảm, một bản giao kèo thì có chứa các thuật ngữ về lương, và những bản giao kèo bao gồm các điều khoản. Nó có một gợi ý khác rất quan trọng: tiêu đề của phạm trù đang bàn luận là “Luật ‘E.’ ” Điều đó cho Watson biết rằng câu trả lời có liên quan đến một thuật ngữ luật thông thường, và nó sẽ bắt đầu với chữ cái “E.” Watson đã thắng các đối thủ người với câu trả lời: “Có phải là điều khoản điều chỉnh trượt giá⦾ không?” Tất cả những việc đó mất ba giây.

Sau khi Watson có được câu trả lời đúng trong phạm trù này, nó trở nên tự tin hơn (và chơi mạnh dạn hơn) khi “nhận ra” nó đang diễn dịch hạng mục này một cách chuẩn xác. Nó thích nghi với trò chơi, hay học cách chơi tốt hơn, trong khi trò chơi đang diễn ra.

Hãy tạm không nghĩ đến Jeopardy! một lát và tưởng tượng kỹ nghệ máy học có tính thích nghi và tốc độ cao có thể được ứng dụng để lái xe, lái tàu chở dầu hoặc thăm dò mỏ vàng như thế nào. Hãy nghĩ về toàn bộ sức mạnh có được ở một trí thông minh ngang với con người.

Watson cũng đã biểu thị một loại trí thông minh khá thú vị khác. Phần mềm DeepQA của nó tạo ra hàng trăm câu trả lời tiềm năng và thu thập hàng trăm bằng chứng cho mỗi câu trả lời đó. Sau đó nó lọc và xếp hạng các câu trả lời theo mức độ tin cậy của mỗi câu. Nếu nó không cảm thấy đáng tin vào một câu trả lời, nó sẽ im lặng, bởi trong trò Jeopardy! trả lời sai sẽ bị phạt. Nói cách khác, Watson biết nó không biết cái gì. Giờ đây, bạn có thể không tin rằng một phép tính xác suất cấu thành nên sự tự nhận thức, nhưng phải chăng nó là một trong những bước đầu tiên dẫn tới đích? Watson có thực sự biết điều gì không?

Vậy nếu các mạch của não được điều khiển bởi các giải thuật, như Granger và những người khác trong ngành khoa học thần kinh điện toán khẳng định, liệu con người chúng ta có thực sự biết điều gì không? Hoặc nói cách khác, có lẽ cả người và máy đều biết một số thứ. Và dĩ nhiên Watson là một đột phá làm ta hiểu ra nhiều điều, Kurzweil lập luận như sau:

Đã có khá nhiều bài viết cho rằng Watson hoạt động bằng kiến thức thống kê thay vì “thực sự” hiểu. Nhiều độc giả diễn giải điều này theo nghĩa Watson chỉ đơn thuần thu thập số liệu thống kê về các chuỗi từ ngữ… Có thể dễ dàng cho rằng các vùng tập trung bộ phát tín hiệu của neuron trên vỏ não người là “thông tin thống kê.” Thực sự là chúng ta giải quyết những điều không rõ ràng theo cùng một cách mà Watson đã làm, qua việc xem xét tính hợp lý của những kiểu diễn dịch khác nhau của một nhóm từ.6

Nói cách khác, như chúng ta đã thảo luận, não bạn nhớ các thông tin dựa trên độ mạnh yếu của tín hiệu điện hóa trong các khớp thần kinh đã mã hóa các thông tin đó. Các tín hiệu điện hóa đó càng dày đặc thì thông tin càng được lưu lâu hơn và rõ rệt hơn. Các xác suất dựa trên bằng chứng của Watson cũng là một kiểu mã hóa, chỉ là nó ở dạng máy tính. Đó có phải là kiến thức không? Thế lưỡng nan này gợi nhớ đến câu đố Căn phòng tiếng Trung của John Searle ở Chương 3. Chúng ta có bao giờ biết được liệu máy tính có đang suy nghĩ thật sự hay chỉ là bắt chước rất giống mà thôi?

Đúng như chờ đợi, một ngày sau khi Watson thắng giải Jeopardy!, Searle nói: “IBM đã phát minh ra một chương trình tài tình – chứ không phải là một máy tính biết suy nghĩ. Watson không hiểu các câu hỏi, không hiểu các câu trả lời, cũng không biết một số câu trả lời của nó là đúng và một số là sai, không biết nó đang chơi một trò chơi, không biết là nó thắng – bởi nó không biết gì cả.”7

Khi được hỏi liệu Watson có suy nghĩ không, David Ferrucci, chủ nhiệm dự án Watson của IBM, đã dẫn lại lời của nhà khoa học máy tính người Hà Lan, Edger Dijkstra: “Tàu ngầm có biết bơi không?”8

Nghĩa là, tàu ngầm không “bơi” như cá bơi, nhưng nó di chuyển trong nước nhanh hơn hầu hết các loài cá, và có thể lặn lâu hơn bất cứ loài động vật có vú nào. Thực tế là tàu ngầm bơi giỏi hơn cá hay các động vật có vú trên một số phương diện, bởi nó không bơi giống như cá hay động vật có vú – nó có những thế mạnh và thế yếu riêng.9 Trí thông minh của Watson rất ấn tượng, tuy còn hẹp, vì nó không giống trí thông minh của con người. Thường thì nó nhanh hơn rất nhiều. Và nó có thể làm những thứ mà chỉ máy tính mới làm được, như trả lời các câu hỏi của Jeopardy! 24/7 bất cứ khi nào bạn muốn, hoặc tự gắn mình với dây chuyền sản xuất của những phiên bản Watson mới khi cần để chia sẻ kiến thức và dữ liệu lập trình một cách trơn tru. Khi hỏi liệu Watson có biết suy nghĩ không, tôi nghĩ điều này nên để mọi người tự cảm nhận.

Với Ken Jennings, một trong những đối thủ con người của Watson trong trò Jeopardy! (người tự xưng là “Hy vọng lớn của loài người”⦾), thì Watson cảm nhận giống một đối thủ con người.

Kỹ thuật để làm sáng tỏ các gợi ý trong Jeopardy! của cỗ máy này nghe có vẻ giống hệt kỹ thuật của tôi. Nó tập trung vào các từ chủ chốt trong gợi ý, sau đó đào xới ký ức của nó (trong trường hợp Watson là 15 terabyte ngân hàng dữ liệu của kiến thức con người) để tìm các cụm từ có liên quan đến các từ đó. Nó đối chiếu khắt khe những kết quả hàng đầu với tất cả những thông tin ngữ cảnh mà nó có được: tên của hạng mục đang thảo luận; loại câu trả lời đang cần; thời gian, địa điểm và giới tính ẩn trong gợi ý; và nhiều thứ khác. Và khi nó cảm thấy đủ “chắc chắn,” nó quyết định nhấn chuông.

Với một đối thủ con người trong Jeopardy!, tất cả những điều này diễn ra một cách bản năng, trong chớp mắt, nhưng tôi tin rằng trong hộp sọ, ít nhiều bộ não của mình cũng đang làm điều tương tự.10

Watson có thực sự biết suy nghĩ? Và nó thực sự hiểu được bao nhiêu? Tôi không chắc. Nhưng tôi chắc chắn rằng Watson là thực thể đầu tiên trong một hệ sinh thái hoàn toàn mới – cỗ máy đầu tiên khiến chúng ta phải tự hỏi liệu nó có hiểu hay không.

Vì vậy, Watson thành công ở một vài mức độ. Thứ nhất, nó là bộ xử lý ngôn ngữ tự nhiên mạnh mẽ nhất từng được tạo ra, kết hợp với một hệ thống khai thác dữ liệu rất nhanh. Có thể tìm được Watson trên laptop và điện thoại thông minh của bạn trong vài năm tới. Thứ hai, Watson đang được nhắm tới cho các công việc y học quan trọng. Tại phòng khám ung thư của Cedars-Sinai ở Los Angeles, Watson đang bận rộn tiêu hóa thư viện gồm những nghiên cứu về ung thư và hồ sơ bệnh nhân, và theo kịp các đột phá. Watson sẽ không phải là bác sĩ tại phòng khám, dù như chúng ta đã biết, đó là chuyện sẽ xảy ra. Nhưng nó sẽ là thủ thư nhanh nhất, có thể tùy chỉnh nhất mà bạn có thể tưởng tượng được.11 Đồng thời, tại bốn công ty dược phẩm lớn, trong đó có DuPont và Pfizer, Watson sẽ xử lý 200 triệu trang một giây các tạp chí y sinh học và các hồ sơ đăng ký bằng sáng chế để học về các hợp chất hóa học được sử dụng trong khám phá thuốc, các nhà nghiên cứu chính đằng sau các bằng sáng chế về thuốc, và nhiều nữa.12 Về dài hạn, liệu Watson có thể trở thành xương sống của một kiến trúc nhận thức AGI hoàn thiện? Nó có được sự hậu thuẫn mà không hệ thống đơn nhất nào có, bao gồm vốn tài trợ lớn, một công ty công khai chấp nhận các thử thách lớn và không sợ thất bại, một kế hoạch tài chính cho việc phát triển trong tương lai để giữ cho nó hoạt động và tiến triển. Nếu điều hành IBM, tôi sẽ xem xét số lựợng lớn những thành tựu quảng bá, thiện ý khách hàng, thành tựu bán hàng, kiến thức, những thứ đã thu được sau các thử thách lớn của Deep Blue và Watson, và tôi sẽ tuyên bố với thế giới rằng vào năm 2020, IBM sẽ chinh phục Bài kiểm tra Turing.

Các tiến bộ trong công nghệ xử lý ngôn ngữ tự nhiên sẽ làm thay đổi nhiều bộ phận của nền kinh tế, thứ hiện nay dường như vẫn trụ vững trước những thay đổi công nghệ. Trong vài năm sắp tới, những thủ thư và nhà nghiên cứu đủ loại sẽ xếp chung với các nhân viên bán lẻ, nhân viên tư vấn ngân hàng, đại lý du lịch, môi giới chứng khoán, nhân viên tín dụng và các trợ lý kỹ thuật trong một hàng dài những người thất nghiệp. Theo sau họ sẽ là các bác sĩ, luật sư, người tư vấn thuế và hưu trí. Hãy nghĩ về chuyện các cây ATM đã nhanh chóng thế chỗ những nhân viên giao dịch ở ngân hàng như thế nào, còn tại các siêu thị thì số quầy trả tiền tự động ngày càng nhiều hơn. Nếu bạn làm việc trong ngành công nghệ thông tin (và cuộc cách mạng số đang biến mọi thứ thành các ngành công nghệ thông tin), hãy coi chừng.

Sau đây là một ví dụ đơn giản. Bạn có thích bóng rổ không? Vậy đoạn văn nào trong hai đoạn sau được viết bởi một nhà bình luận thể thao là con người?

Ví dụ A

Ohio State (17) và Kansas (14) chia nhau vị trí đứng đầu trong bảng xếp hạng bầu chọn tối đa 31 phiếu của các huấn luyện viên. Thay đổi gần nhất ở nhóm đầu bảng là cần thiết sau khi Duke bất ngờ bị đối thủ ACC từ Đại học Virginia Tech đánh bại vào tối thứ Bảy. Buckeyes (27-2) thắng các đội trong Big Ten từ Đại học Illinois và Indiana một cách khá dễ dàng trên con đường trở lại nhóm đầu. Ohio State khởi đầu 24-0 và đứng thứ nhất trong bốn tuần liền ở mùa giải này trước khi tụt xuống thứ ba. Đây là tuần thứ 15 liên tục Ohio State được xếp trong tốp ba. Kansas (27-2) vẫn ở vị trí thứ hai và chí kém Ohio State 4 điểm bầu chọn.13

Ví dụ B

Ohio State trở lại vị trí đứng đầu trên bảng xếp hạng sau tuần thi đấu vừa rồi, với chiến thắng đầu tiên trước Illinois trên sân nhà, 89-70. Sau đó là một chiến thắng khác trên sân nhà trước Indiana, 82-61. Utah State được vào top 25 với vị trí số 25 sau một trận thắng trên sân nhà trước Idaho, 84-68. Temple rơi khỏi bảng xếp hạng tuần này sau một trận thua trước Duke, đội từng ở vị trí đầu bảng và một trận thắng trước George Washington, 57-41. Tuần này, Arizona rơi xuống thứ 18 sau một trận thua bất ngờ trước USC, 65-57 và một trận thua bất ngờ trước UCLA, 71-49. St. John nhảy tám bậc lên vị trí thứ 15 sau các chiến thắng trước đội xếp thứ 15 của tuần trước Villanova, 81-68 và DePaul, 76-51.

Bạn đã đoán ra chưa? Không đoạn nào được Red Smith⦾ viết, nhưng chỉ có một đoạn do con người viết. Đó là tác giả của ví dụ A, đoạn này đã xuất hiện trên trang web của ESPN. Ví dụ B được viết bởi một hệ thống xuất bản tự động do Robbie Alien của Automated Insights tạo ra. Trong vòng một năm, công ty của ông đặt tại Durham, nó đã sản xuất 100.000 bài báo thể thao được viết tự động và đăng chúng trên hàng trăm trang web chuyên tập trung vào một số đội nhất định (hãy tìm từ khóa Statsheet⦾). Tại sao thế giới cần những robot viết báo thể thao? Allen nói với tôi rằng có nhiều đội không được bất kỳ nhà báo nào để ý đến, trong khi vẫn có những người ủng hộ nhất định. Các bài báo hoàn chỉnh do AI viết sẽ được gửi đến các trang web của đội đó, và được các trang web khác đăng lại chỉ vài phút sau tiếng còi kết thúc trận đấu. Con người không thể làm việc nhanh như vậy. Allen, một cựu Kỹ sư Xuất sắc của Cisco Systems, không chịu nói với tôi “bí quyết” của kiến trúc nhận thức đáng kinh ngạc này. Nhưng sẽ chóng thôi, ông nói. Automated Insights sẽ cung cấp các tin tức về tài chính, thời tiết, bất động sản và bản tin địa phương. Tất cả những gì mà các máy chủ đói khát của ông cần là dữ liệu được sắp xếp một cách tương đối.

Một khi bạn đã bắt đầu khảo sát những kết quả của khoa học thần kinh điện toán, bạn sẽ thấy khó mà tưởng tượng được các tiến bộ đáng kể về kiến trúc AGI nếu chỉ dựa vào khoa học nhận thức đơn thuần (ít ra là đối với tôi). Phải chăng một sự thấu hiểu hoàn toàn về cách bộ não vận hành ở mọi mức độ sẽ là phương thức chắc chắn và toàn diện hơn việc cứ tiến tới không theo một nguyên tắc nào? Các nhà khoa học không cần phải mổ xẻ từng neuron trong 100 triệu neuron của bộ não để hiểu và mô phỏng các chức năng của chúng, bởi cấu trúc não là rất rườm rà. Họ cũng không cần phải mô phỏng một phần lớn não, bao gồm những vùng kiểm soát chức năng thần kinh thực vật như thở, nhịp tim, phản ứng tự vệ hoặc bỏ chạy, và ngủ. Mặt khác, có khả năng trí thông minh phải cư trú trong một cơ thể mà nó kiểm soát, và cơ thể đó phải tồn tại trong một môi trường phức tạp. Tranh luận về tính hiện thân đó sẽ không được trình bày ở đây Nhưng hãy nghĩ về các khái niệm như sáng, ngọt, cứng và sắc. Làm thế nào một AI có thể biết được những cảm giác đó nghĩa là gì, và xây dựng được các khái niệm dựa trên những cảm giác đó, nếu nó không có một cơ thể? Phải chăng sẽ có một rào cản đối với trí thông minh đang muốn đạt đến cấp độ con người của nó, nếu nó không có các giác quan?

Trước câu hỏi này. Granger nói: “Helen Keller⦾ có ít nhân tính hơn bạn không? Một người bị liệt cả tay chân thì sao? Tại sao chúng ta không thể hình dung ra một trí thông minh tài năng nhưng hoàn toàn khác biệt, có thị giác, cảm biến xúc giác, và nghe bằng micro? Chắc chắn trí thông minh ấy sẽ có những cảm nhận hơi khác về sáng, ngọt, cứng, sắc – nhưng rất có thể rằng nhiều, rất nhiều người với những cái lưỡi khác nhau, những khuyết tật khác nhau, thuộc những nền văn hóa khác nhau và có môi trường khác nhau đã có những phiên bản vô cùng đa dạng về các khái niệm trên.”

Cuối cùng, để trí thông minh nảy sinh, ngoài phần trí năng, có lẽ các nhà khoa học phải mô phỏng thêm một cơ quan cảm xúc. Khi chúng ta ra quyết định, thường thì cảm xúc có vẻ mạnh hơn lý trí; chúng ta là ai và chúng ta suy nghĩ thế nào, đa phần phụ thuộc vào những hormone đang làm chúng ta kích động hoặc bình tâm. Nếu chúng ta thực sự muốn mô phỏng trí tuệ con người, phải chăng kiến trúc đó nên có một hệ thống nội tiết? Và có lẽ trí thông minh cần có một cảm giác toàn diện về nhân sinh. Cảm thụ tính, nghĩa là những cảm nhận chủ quan có được khi có một cơ thể, và việc sống trong một trạng thái mà các cơ quan cảm giác liên tục gửi thông tin phản hồi có thể là điều cần thiết cho trí thông minh cấp độ con người. Dù Granger đã nói gì, thì các nghiên cứu cho thấy những người bị liệt hai chi do tai nạn đã trải qua một sự héo tàn về cảm xúc.14 Có thể tạo ra một cỗ máy có cảm xúc mà không có cơ thể được không, và nếu không được, liệu một phần quan trọng của trí tuệ con người có mãi là một dấu hỏi?

Tất nhiên, như tôi sẽ khảo sát ở những chương cuối của cuốn sách này, tôi e rằng trên con đường chế tạo AI với trí thông minh giống con người, thay vì các cỗ máy biết cảm nhận, các nhà khoa học sẽ tạo ra một thứ gì đó khác, kỳ lạ, phức tạp và không thể kiềm chế được.

Báo cáo nội dung xấu

Chi phí đọc tác phẩm trên Gác rất rẻ, 100 độc giả đọc mới đủ phí cho nhóm dịch, nên mong các bạn đừng copy.

Hệ thống sẽ tự động khóa các tài khoản có dấu hiệu cào nội dung.