Chương 3: Cỗ máy dự đoán ma thuật


Harry Potter, Bạch Tuyết, và Macbeth có điểm gì chung?

Những nhân vật này đều có động cơ hành động từ một lời tiên tri, một điều dự đoán. Ngay cả bộ phim The Matrix, tưởng chừng nội dung là về những cỗ máy thông minh, kịch bản vẫn xoay quanh niềm tin vào dự đoán của các nhân vật. Từ tôn giáo đến truyện cổ tích, kiến thức về tương lai vẫn có ý nghĩa quan trọng. Dự đoán tác động đến hành vi, ảnh hưởng đến quyết định.

Người Hy Lạp cổ đại dành nhiều tôn kính cho các bậc thầy tiên tri có khả năng dự đoán, đôi khi qua những câu đố đánh lừa người hỏi. Ví dụ, Vua Croesus của Lydia đang cân nhắc một cuộc tấn công rủi ro vào Đế chế Ba Tư. Đức vua không tin tưởng vào một bậc thần thánh nào, ông ấy muốn thử tài của từng người trước khi hỏi ý kiến có nên tấn công Ba Tư. Ông truyền lời đến từng người. Vào ngày thứ 100, sứ giả được gửi đến từng bậc thầy tiên tri hỏi xem Croesus đang làm gì vào đúng thời điểm này. Bậc tiên tri tại Delphi đã dự đoán chính xác nhất, nên đức vua đã tìm đến ông ấy để hỏi ý kiến và hoàn toàn tin tưởng vào dự đoán của ông ấy.

Như trong trường hợp của Croesus, dự đoán này là về hiện tại. Chúng ta dự đoán xem giao dịch thẻ tín dụng hiện tại có hợp pháp hay gian lận, xem khối u trong hình chụp là ác tính hay lành tính, xem người đang nhìn vào máy ảnh của chiếc iPhone có phải là chủ của nó hay không. Mặc dù gốc từ dự đoán có mang ý nghĩa là biết trước, nhưng trong suy nghĩ của chúng ta lại chú trọng nhiều hơn đến khả năng nhìn ra những thông tin ẩn giấu, bất kể là quá khứ, hiện tại, hay tương lai. Quả cầu phép thuật có lẽ là biểu tượng phổ biến nhất cho việc dự đoán đầy ma thuật. Hình ảnh này thường gắn liền với nhóm người bói toán có thể dự đoán tiền tài hay tình duyên tương lai, nhưng trong The Wizard of Oz, quả cầu lại giúp Dorothy thấy được Dì Em trong hiện tại. Từ đó, chúng tôi có định nghĩa về dự đoán như sau:

Dự đoán là quá trình điền vào thông tin còn thiếu. Dự đoán sử dụng thông tin mà bạn đang có, thường được gọi là dữ liệu, để tạo sinh ra thông tin mà bạn không có.

Điều kỳ diệu của dự đoán

Cách đây vài năm, Avi (một trong số các tác giả) phát hiện có một giao dịch lớn bất thường ở một sòng bài tại Las Vegas trên sao kê thẻ tín dụng của mình. Ông không đến Las Vegas. Ông chỉ từng đến đây một lần từ lâu lắm rồi; việc cá cược ở thế thua không phù hợp với cái nhìn về thế giới của một nhà kinh tế học như ông. Sau một hồi tranh luận, ngân hàng đã phải hủy giao dịch này và phát hành cho ông một chiếc thẻ khác.

Gần đây, chuyện này lại xảy ra một lần nữa. Có người đã dùng thẻ của Avi để mua hàng. Lần này Avi không nhìn thấy bảng sao kê và cũng không phải trải qua quy trình mệt mỏi để giải trình với bộ phận chăm sóc khách hàng đầy cứng nhắc. Thay vào đó, ông nhận được cuộc gọi chủ động từ họ rằng chiếc thẻ này đã bị lộ thông tin và họ đã phát hành cho ông một chiếc thẻ mới.

Ngân hàng phát hành thẻ đã suy luận một cách chính xác, dựa trên thói quen chi tiêu của Avi và hàng loạt các dữ liệu có sẵn khác, rằng giao dịch này là gian lận. Công ty phát hành thẻ rất tự tin với quyết định của mình và thậm chí không thèm khóa thẻ của ông trong lúc họ điều tra. Thay vào đó, như một phép mầu, họ gửi thẳng cho ông một chiếc thẻ khác và ông cũng không phải làm gì cả. Dĩ nhiên, ngân hàng không hề có quả cầu phép thuật. Họ chỉ có dữ liệu và một mô hình dự đoán tốt: một cỗ máy dự đoán. Dự đoán tốt hơn giúp họ giảm được các giao dịch gian lận, như Ajay Bhalla, Chủ tịch phụ trách rủi ro và bảo mật doanh nghiệp của Mastercard, đã nói, "giải quyết được một điểm khó khăn của người tiêu dùng là bị từ chối vô lý."

Các ứng dụng kinh doanh có thiết kế tương ứng với định nghĩa của chúng tôi về dự đoán là quá trình điền vào thông tin còn thiếu. Mạng lưới thẻ tín dụng nhận thấy việc nhận biết một giao dịch thẻ gần đây có phải là gian lận hay không là việc hữu ích. Mạng lưới thẻ sử dụng thông tin về các giao dịch gian lận (và không hợp pháp) trong quá khứ để dự đoán một giao dịch cụ thể trước mắt có phải là gian lận hay không. Nếu đúng là gian lận, họ có thể ngăn cản các giao dịch trong tương lai trên chiếc thẻ này, và nếu việc dự đoán được thực hiện nhanh chóng, thậm chí họ có thể ngăn chặn giao dịch hiện đang xảy ra.

Khái niệm dùng một thông tin này và biến nó thành một thông tin khác chính là tâm điểm của một trong những thành tựu lớn gần đây của AI: chuyển dịch ngôn ngữ, một mục tiêu đã có từ lúc bắt đầu có nền văn minh nhân loại, thậm chí còn được tôn vinh qua câu chuyện kể Tháp Babel với lịch sử hàng ngàn năm. Trước kia, cách chuyển ngữ tự động là thuê chuyên gia ngôn ngữ, có hiểu biết về các quy luật của ngôn ngữ, để lập ra các quy luật và dịch chúng sao cho phù hợp với ngôn ngữ lập trình. Chẳng hạn, lấy ví dụ một cụm từ tiếng Tây Ban Nha, thay vì dịch đúng theo nghĩa đen của từng từ, bạn hiểu là phải thay đổi vị trí danh từ và tính từ thì mới tạo ra được một cụm từ tiếng Anh có nghĩa.

Những tiến bộ gần đây của AI đã cho phép chúng ta nhìn lại việc dịch thuật là vấn đề dự đoán. Chúng ta có thể thấy bản chấp kỳ diệu của việc dự đoán trong dịch thuật qua sự thay đổi vượt bậc trong chất lượng của dịch vụ dịch thuật của Google. Truyện ngắn The Snows of Kilimanjaro của Ernest Hemingway mở đầu thật đẹp:

Kilimanjaro là ngọn núi phủ đầy tuyết cao 19.710 feet, và được cho là ngọn núi cao nhất tại Châu Phi.

(Kilimanjaro is a snow-covered mountain 19,710 feet high, and is said to be the highest mountain in Africa.)

Một ngày nọ vào tháng 11/2016, khi giáo sư Jun Rekimoto, một nhà khoa học máy tính tại ĐH Tokyo, dùng Google để dịch bản tiếng Nhật của truyện ngắn kinh điển này ngược lại thành tiếng Anh, ông có được bản dịch như sau:

Kilimanjaro is 19,710 feet of the mountain covered with snow, and it is said that the highest mountain in Africa.

Ngày hôm sau nữa, bản dịch của Google lại là:

Kilimanjaro is a mountain of 19,710 feet covered with snow and is said to be the highest mountain in Africa.

Sự khác biệt là rõ ràng. Chỉ sau một đêm, từ một bản dịch thấy rõ là câu cú lủng củng, được dịch tự động, của một người đang vật lộn với từ điển, chuyển thành bản dịch dường như của một người khá thông thạo cả hai thứ tiếng.

Cũng phải thừa nhận là bản dịch này không tương xứng với ngòi bút của Hemingway, nhưng sự cải thiện là quá đáng khen. Tháp Babel đã trở lại. Và sự thay đổi này không hề là vô tình hay bất chợt. Google đã cập nhật cỗ máy đứng sau hoạt động dịch thuật của mình để tận dụng những tiến bộ gần đây của AI. Cụ thể, dịch vụ dịch thuật của Google giờ đây trông cậy nhiều vào việc học sâu và đẩy mạnh khả năng dự đoán.

Dịch thuật từ tiếng Anh sang tiếng Nhật chính là dự đoán những từ ngữ hay cụm từ trong tiếng Nhật tương ứng với tiếng Anh. Thông tin còn thiếu cần được dự đoán là cụm từ tiếng Nhật và thứ tự sắp xếp của chúng. Lấy dữ liệu từ một ngoại ngữ và từ đó dự đoán cụm từ chính xác theo đúng thứ tự trong một ngôn ngữ bạn biết, thế là bạn có thể hiểu được ngoại ngữ kia. Nếu bạn làm thật tốt, bạn sẽ không nhận ra đang có quá trình dịch thuật ở đây.

Các công ty đã không chần chừ tranh thủ tận dụng công nghệ kỳ diệu này vào hoạt động thương mại. Ví dụ, hơn 500 triệu người tại Trung Quốc đã sử dụng dịch vụ học sâu của iFlytek để dịch thuật, chuyển lời, và giao tiếp. Chủ nhà dùng nó để giao tiếp với người thuê nhà nói khác ngôn ngữ, bệnh nhân dùng nó để giao tiếp với robot để hiểu các chỉ dẫn, bác sĩ dùng nó để đọc chính tả nội dung bệnh án của bệnh nhân, tài xế dùng nó để giao tiếp với xe của mình. AI càng được sử dụng nhiều, nó càng thu thập được nhiều dữ liệu, nó càng học được nhiều, hiệu quả càng tốt hơn. Với rất nhiều người dùng, AI đang được cải thiện nhanh chóng.

Dự đoán đã tốt hơn trước nhiều như thế nào?

Những thay đổi của Google Translate minh họa cho việc học máy (trong đó học sâu là một mảng) đã làm giảm mạnh chi phí của việc dự đoán dựa trên chất lượng. Với cùng mức chi phí cho năng lực tính toán, Google hiện nay đã cho ra bản dịch có chất lượng cao hơn. Chi phí để tạo ra dự đoán với kết quả tương đương đã giảm mạnh đáng kể.

Đột phá trong công nghệ dự đoán có tác động đến những lĩnh vực trước kia liên quan đến dự báo, ví dụ như phát hiện gian lận. Phát hiện gian lận thẻ tín dụng đã cải thiện rất nhiều, các công ty phát hành thẻ có thể phát hiện và xử lý giao dịch gian lận trước khi người sử dụng nhận thấy có điều bất thường. Tuy nhiên, quá trình cải thiện này có vẻ như chỉ gia tăng từng bước. Cuối những năm 1990, các phương pháp hàng đầu đã tóm được khoảng 80% các giao dịch gian lận.

Tỉ lệ này tăng lên 90 – 95% trong năm 2000 và đạt 98 – 99,9% hiện nay. Bước nhảy cuối cùng này là kết quả của việc học máy; sự thay đổi từ 98% lên 99,9% thật là phi thường.

Thay đổi từ 98% lên 99,9% xét về con số thì nhỏ, nhưng thay đổi nhỏ vẫn có ý nghĩa lớn nếu mỗi sai phạm đều gây hậu quả nghiêm trọng. Tính chính xác tăng từ 85% lên 90% nghĩa là số lượng sai lầm giảm một phần ba. Cải thiện từ 98% lên 99,9% là sai lầm giảm 20 lần. Cải thiện ở mức 20 lần thì không còn là cải thiện từng bước.

Việc giảm chi phí dự đoán cũng làm chuyển biến nhiều hoạt động của con người. Cũng giống như khi lần đầu ứng dụng năng lực tính toán cho các vấn đề số học gia đình như điều tra dân số và bảng đạn đạo, đã có nhiều ứng dụng năng lực dự đoán giá rẻ từ học máy vào các vấn đề dự đoán kinh điển. Ngoài việc phát hiện gian lận, nó đã ứng dụng cho việc tính điểm uy tín tín dụng, bảo hiểm y tế, và quản lý hàng tồn kho. Điểm tín dụng bao gồm dự đoán khả năng hoàn trả khoản vay của người vay. Bảo hiểm y tế bao gồm dự đoán mức chi trả cho chăm sóc y tế của cá nhân. Quản lý hàng tồn kho là dự đoán có bao nhiêu mặt hàng trong kho tại một thời điểm nhất định.

Gần đây, hàng loạt các vấn đề dự đoán mới xuất hiện. Nhiều vấn đề gần như là không thể dự đoán trước khi có những tiến bộ trong công nghệ trí tuệ máy, bao gồm nhận dạng đối tượng, dịch ngôn ngữ, phát hiện thuốc. Ví dụ, ImageNet Challenge là một cuộc thi nổi tiếng hàng năm nhằm dự đoán tên của vật trong hình ảnh. Dự đoán một vật thể trong một hình ảnh là nhiệm vụ khó, ngay cả đối với con người. Dữ liệu ImageNet bao gồm một ngàn hạng mục vật thể, bao gồm nhiều giống chó và các hình ảnh tương tự. Thật khó mà nhận ra sự khác biệt giữa một con chó ngao Tây Tạng và một con chó Bern, hay phân biệt giữa két sắt và ổ khóa kết hợp. Con người cũng phạm sai lầm với tỉ lệ 5%.

Từ năm thi đầu tiên là 2010 đến năm thi cuối cùng là 2017, tỉ lệ dự đoán đã tốt hơn nhiều. Hình bên dưới cho thấy tỉ lệ chính xác của người thắng cuộc qua các năm. Cột dọc là tỉ lệ sai lầm, càng thấp càng tốt. Năm 2010, dự đoán máy tốt nhất có tỉ lệ sai lầm là 28%. Năm 2012, các thí sinh lần đầu tiên sử dụng học sâu và tỉ lệ sai lầm giảm xuống còn 16%. Olga Russakovsky, giáo sư và nhà khoa học máy tính tại Princeton nhận xét, "2012 quả thật là một năm có bước đột phá lớn về độ chính xác, và nó cũng là bằng chứng cho các mô hình học sâu, vốn dĩ đã tồn tại được hàng chục năm." Thuật toán ngày càng được cải thiện nhanh chóng, và lần đầu tiên một đội đã vượt qua được ngưỡng sai của con người trong cuộc thi năm 2015. Năm 2017, đa số thí sinh của 38 đội đều làm tốt hơn ngưỡng sai của con người, và đội tốt nhất có tỉ lệ sai chưa bằng một nửa của con người. Máy có thể xác định những loại hình ảnh này tốt hơn con người.

Hệ quả của việc dự đoán giá rẻ

Thế hệ AI hiện tại vẫn còn cách rất xa cỗ máy thông minh trong truyện khoa học viễn tưởng. Dự đoán không thể mang lại cho chúng ta HAL trong 2001: A Space Odyssey, Skynet trong The Terminator, hay C3PO trong Star Wars. Nếu AI hiện đại thật ra chỉ là dự đoán, vậy thì tại sao người ta lại tung hô nó đến thế? Lý do là vì dự đoán là yếu tố đầu vào căn bản. Bạn không nhận thấy chứ dự đoán có mặt ở khắp mọi nơi. Hoạt động kinh doanh và cuộc sống cá nhân đều chứa đầy các dự đoán. Thông thường dự đoán bị che lấp dưới lớp vỏ đầu vào cho việc ra quyết định. Dự đoán tốt hơn có nghĩa là thông tin tốt hơn, và từ đó ra quyết định tốt hơn.

Dự đoán là "tình báo"theo nghĩa "thu thập thông tin hữu ích." Dự đoán của máy là thông tin hữu ích do máy tạo ra. Tình báo có ý nghĩa quan trọng. Dự đoán tốt hơn tạo ra kết quả tốt hơn, như đã chứng minh trong ví dụ về phát hiện gian lận. Khi chi phí dự đoán ngày càng giảm, chúng ta ngày càng phát hiện ra tính hữu ích của nó cho hàng loạt các hoạt động khác, và qua đó, tạo điều kiện cho thêm rất nhiều thứ, ví dụ như dịch máy, mà trước kia còn chưa thể tưởng tượng đến.

Điểm chính

· Dự đoán là quá trình điền vào thông tin còn thiếu. Dự đoán lấy thông tin bạn có, thường được gọi là dữ liệu, và dùng nó để tạo ra thông tin bạn chưa có. Bên cạnh việc tạo ra thông tin về tương lai, dự đoán cũng có thể tạo ra thông tin về hiện tại và quá khứ. Ví dụ như trường hợp dự đoán xếp loại giao dịch thẻ tín dụng là gian lận, đánh giá khối u trong hình ảnh là ác tính, hay xác thực người đang cầm chiếc iPhone là chủ của nó.

· Tác động của những cải thiện nhỏ về tính chính xác trong dự đoán có thể không được nhìn nhận đúng. Ví dụ, cải thiện từ 85% lên 90% chính xác có vẻ là lớn gấp hai lần so với cải thiện từ 98% lên 99,9%. Tuy nhiên, trong trường hợp trước, sai lầm chỉ giảm 1/3, còn trong trường hợp sau, sai lầm giảm 20 lần. Trong một số trường hợp, sai lầm giảm 20 lần là kết quả phi thường.

· Quá trình điền vào thông tin còn thiếu thoạt nhìn có vẻ nhàm chán nhưng chính nó là yếu tố tạo nên điều kỳ diệu cho dự đoán máy. Thực tế đã xảy ra trong những cỗ máy có thể nhìn (nhận dạng đối tượng), điều hướng (xe không người lái), và dịch thuật.


Bạn đang đọc truyện trên: AzTruyen.Top

Tags: #sachkinhte