Chương 5: Tại sao lại gọi nó là trí tuệ?
Năm 1956, một nhóm học giả đã gặp nhau tại ĐH Dartmouth, New Hampshire, để phác họa lộ trình nghiên cứu cho trí tuệ nhân tạo. Họ muốn xem liệu máy tính có thể được lập trình để thực hiện tư duy nhận thức, ví dụ như chơi trò chơi, chứng minh định lý toán học, vân vân. Họ cũng suy ngẫm cẩn thận về ngôn ngữ và kiến thức để máy tính có thể miêu tả về sự vật. Họ cũng tính đến việc cho máy tính quyền lựa chọn và để nó tự chọn thứ tốt nhất. Các nhà nghiên cứu rất lạc quan về khả năng của AI. Họ đã viết cho Quỹ Rockefeller đề nghị được cấp kinh phí:
Chúng tôi đang nỗ lực tìm cách cho máy móc sử dụng ngôn ngữ, hình thành khái niệm và trừu tượng, giải quyết những vấn đề của con người, và tự cải thiện. Chúng tôi cho rằng sẽ có tiến bộ đáng kể trong ít nhất một trong số các vấn đề trên nếu có thể thành lập một nhóm nhà khoa học chuyên trách nghiên cứu về nó trong một mùa hè.
Kế hoạch hành động này hóa ra là không thực tế những mang tầm nhìn. Trong số những hạn chế là máy tính ở những năm 1950 chưa đủ mạnh để xử lý theo hình dung của các học giả.
Sau tuyên bố nghiên cứu đó, AI đã có những tiến bộ ban đầu, nhưng còn rất chậm. Nghiên cứu về AI trong những môi trường cụ thể (ví dụ, AI làm nhà trị liệu) đã không tạo ra kết quả. Những năm đầu thập niên 80 làm dấy lên hy vọng khi các kỹ sư có thể lập trình ra các hệ thống chuyên gia để tái tạo những lĩnh vực kỹ năng như chẩn đoán y khoa, nhưng các hệ thống này rất tốn kém, cồng kềnh, và không thể xử lý nổi hàng loạt những trường hợp hay khả năng ngoại lệ, dẫn đến một đoạn thời gian được gọi là "mùa đông AI."
Dường như mùa đông này đã qua. Dữ liệu, mô hình, máy tính tốt hơn đã thúc đẩy bước tiến gần đây trong lĩnh vực học máy để cải thiện dự đoán. Cải thiện trong việc thu thập và lưu trữ dữ liệu lớn cũng tạo nguồn đầu vào cho các thuật toán học máy mới. So với mô hình thống kê trước kia, cộng thêm sự phát minh của bộ xử lý phù hợp, mô hình máy học mới có tính linh hoạt nhiều hơn và tạo ra kết quả dự đoán tốt hơn - tốt đến mức mà người ta phải miêu tả lĩnh vực này là "trí tuệ nhân tạo."
Dự đoán tỉ lệ rời bỏ
Dữ liệu, mô hình, và máy tính tốt hơn là cốt lõi tạo nên bước phát triển cho dự đoán. Để hiểu được giá trị của nó, hãy xem qua một vấn đề đau đầu từ lâu liên quan đến dự đoán: dự báo tỉ lệ rời bỏ của khách hàng. Đối với nhiều doanh nghiệp, việc thu hút khách hàng là rất tốn kém, do đó, việc khách hàng rời bỏ cũng là chi phí. Một khi đã thu hút được khách hàng, doanh nghiệp cần phải tranh thủ chi phí đó bằng cách làm giảm tỉ lệ rời đi. Trong ngành dịch vụ như bảo hiểm, tài chính, viễn thông, quản trị tỉ lệ rời bỏ có thể nói là mục tiêu quan trọng nhất của tiếp thị. Bước đầu tiên để giảm tỉ lệ rời bỏ là xác định khách hàng đang có nguy cơ rời bỏ. Doanh nghiệp có thể sử dụng công nghệ dự đoán cho nhiệm vụ này.
Trong lịch sử, phương pháp chủ đạo để dự đoán tỉ lệ rời bỏ là công cụ thống kê gọi là "hồi quy." Các nghiên cứu đều tập trung cải thiện công cụ hồi quy. Các nhà nghiên cứu đã đề xuất và thử nghiệm hàng trăm phương pháp hồi quy khác nhau trên các tạp chí chuyên ngành và trong thực tế.
Hồi quy là làm gì? Nó tìm kết quả dự đoán dựa trên trung bình của những gì đã xảy ra trong quá khứ. VÍ dụ, nếu bạn phải dự đoán xem ngày mai trời có mưa hay không dựa trên thời tiết của bảy ngày qua, thì bạn cũng chỉ có thể lấy trung bình. Nếu có 2/7 ngày có mưa, bạn dự đoán khả năng ngày mai trời mưa là 29%. Phần lớn những gì diễn ra khi dự đoán là tính toán giá trị trung bình tốt hơn bằng cách xây dựng mô hình có thể khai thác tốt hơn nhiều dữ liệu về bối cảnh.
Chúng ta đã làm như thế bằng "trung bình có điều kiện." Ví dụ, nếu bạn sống ở bắc California, bạn đã biết qua rằng khả năng trời mưa còn tùy theo mùa - mùa thấp điểm là mùa hè và cao điểm là mùa đông. Bạn quan sát thấy trong mùa đông, tỉ lệ có mưa là 25%, trong khi vào mùa hè, tỉ lệ đó là 5%, bạn sẽ không lấy trung bình để cho ra khả năng có mưa ngày mai là 15%. Tại sao ư? Vì bạn biết ngày mai đang là trong mùa đông hay mùa hè, do đó bạn sẽ đặt điều kiện tương ứng cho cách tính của mình.
Điều chỉnh tùy theo mùa là một ví dụ về cách chúng ta tính trung bình có điều kiện (đây cũng là một cách tính phổ biến trong ngành bán lẻ). Chúng ta cũng có thể tính trung bình có điều kiện tùy theo thời điểm trong ngày, độ ô nhiễm, độ bao phủ của mây, nhiệt độ đại dương, hay bất cứ thông tin sẵn có nào khác.
Chúng ta thậm chí có thể đặt điều kiện cho nhiều thứ cùng lúc: Liệu ngày mai có mưa không nếu hôm nay trời mưa, đang là mùa đông, địa điểm có mưa là hai trăm dặm về phía tây, khu vực có nắng là một trăm dặm về phía nam, mặt đất ẩm ướt, nhiệt độ của Bắc Băng Dương là thấp, và hướng gió là từ tây nam với vận tốc là 15 dặm/giờ? Tuy nhiên, việc kết hợp này dễ trở nên cồng kềnh. Tính toán trị số trung bình cho 7 nhóm thông tin này tương ứng với 128 kết hợp khác nhau. Đưa thêm nhiều loại thông tin sẽ làm tăng số lượng các kết hợp theo cấp số nhân.
Trước khi có học máy, hồi quy đa biến là cách hiệu quả để đặt điều kiện cho nhiều thứ mà không cần phải tính toán hàng chục, hàng trăm, hay hàng ngàn giá trị trung bình có điều kiện. Hồi quy sử dụng dữ liệu và cố gắng tìm kết quả giảm thiểu sai lầm của dự đoán, tối đa thứ gọi là "mức độ phù hợp."
Thật may là cụm từ "mức độ phù hợp" có độ chính xác cao về mặt toán học hơn là mặt ngữ nghĩa. Hồi quy giảm thiểu sai lầm của dự đoán trung bình và chú trọng loại bỏ các sai lầm lớn hơn là các sai lầm nhỏ. Đây là phương pháp mạnh mẽ, đặc biệt là với những tệp dữ liệu nhỏ và cảm nhận khá tốt về điều gì hữu ích cho dự đoán. Ví dụ khi dự đoán tỉ lệ rời bỏ của người sử dụng truyền hình cáp, đó có thể là mức độ thường xuyên xem TV; nếu người ta không dùng đến dịch vụ đã đăng ký, thì nhiều khả năng họ sẽ không đăng ký nữa.
Ngoài ra, các mô hình hồi quy mong muốn tạo ra kết quả không thiên vị, như vậy khi dự đoán đủ, những kết quả dự đoán này chính xác là trị số trung bình. Mặc dù chúng ta nghiêng về phía dự đoán không thiên vị (không đánh giá quá cao hay quá thấp một giá trị nào), dự đoán không thiên vị cũng chưa phải là hoàn hảo. Chúng tôi có thể lý giải bằng một câu chuyện đùa đã cũ trong thống kê:
Một nhà vật lý, một kỹ sư, và một nhà thống kê cùng nhau đi săn. Họ đang đi trong rừng thì phát hiện con nai ngoài bãi đất trống.
Nhà vật lý tính toán khoảng cách đến mục tiêu, vận tốc và độ rơi của viên đạn, điều chỉnh và bắn, kết quả lệch 1,5m về bên trái con nai.
Vị kỹ sư tỏ ra bực mình. "Anh quên tính đến tốc độ gió rồi. Đưa qua đây." Sau khi liếm ngón tay rồi giơ ra đoán tốc độ và hướng gió, vị kỹ sư chộp lấy khẩu súng và bắn, kết quả lệch 1,5m về bên phải con nai.
Đột nhiên, không hề bắn viên đạn nào, nhà thống kê reo mừng, "A ha, được rồi!"
Chính xác là trung bình đến hoàn hảo vẫn có thể là sai trên thực tế. Hồi quy vẫn có thể lại lệch mục tiêu vài mét về bên trái hay vài mét về bên phải. Ngay cả khi trung bình cho ra kết quả chính xác thì hồi quy vẫn có thể không bao giờ bắn trúng mục tiêu.
Với máy học, dự đoán có thể không đúng theo trung bình, nhưng nếu dự đoán sai, thì nó lại không quá chênh lệch. Nhà thống kê mô tả hiện tượng này là chấp nhận thiên vị để đổi lấy rút ngắn độ biến thiên.
Một khác biệt quan trọng giữa học máy và phân tích hồi quy là cách phát triển các kỹ thuật mới. Phát minh một phương pháp học máy mới nghĩa là chứng minh nó vận hành tốt hơn trong thực tế. Ngược lại, phát minh một phương pháp hồi quy mới là phải chứng minh nó đúng về mặt lý thuyết. Việc tập trung vào vận hành thực tế giúp cho những người nghiên cứu học máy có nhiều không gian để thử nghiệm, ngay cả khi các phương pháp của họ cho ra kết quả không chính xác với giá trị trung bình, hay có thiên vị. Việc tự do thử nghiệm này thúc đẩy sự cải tiến diễn ra nhanh hơn bằng cách khai thác dữ liệu phong phú và máy tính mạnh xuất hiện trong mười năm qua.
Những năm cuối 1990 đầu 2000, thử nghiệm trong học máy về dự đoán tỉ lệ khách hàng rời bỏ chỉ có thành công hạn chế. Phương pháp học máy có cải tiến, nhưng hồi quy vẫn cho ra kết quả tốt hơn. Dữ liệu chưa đủ nhiều, và máy tính chưa đủ mạnh để khai thác hết khả năng của học máy.
Ví dụ, Trung tâm Teradata của ĐH Duke tổ chức cuộc thi khoa học dữ liệu năm 2004 để dự đoán tỉ lệ rời bỏ. Thời đó những cuộc thi như thế này vẫn chưa phổ biến. Ai cũng có thể đăng ký, và bài thi thắng cuộc nhận được giải thưởng là hiện kim. Các bài thi thắng cuộc đều dùng mô hình hồi quy. Một vài phương pháp máy học cũng có kết quả chấp nhận được, nhưng phương pháp mạng nơron sau này là nền tảng cho cuộc cách mạng AI thì làm không tốt. Đến năm 2016, mọi thứ đã thay đổi. Mô hình dự đoán tỉ lệ rời bỏ tốt nhất sử dụng máy học, và mô hình học sâu bằng mạng nơron nhìn chung có hiệu quả vượt bậc tất cả mọi phương pháp khác.
Điều gì đã thay đổi? Đầu tiên, dữ liệu và máy tính cuối cùng cũng đã đủ tốt giúp cho học máy thống trị. Trong thập niên 1990, rất khó mà thiết lập những tệp dữ liệu đủ lớn. Ví dụ, một nghiên cứu kinh điển về dự đoán tỉ lệ rời bỏ sử dụng dữ liệu của 650 khách hàng và không vượt quá 30 biến số.
Đến năm 2004, khả năng xử lý và lưu trữ của máy tính đã được cải thiện. Trong cuộc thi của ĐH Duke, tệp dữ liệu dtao bao gồm thông tin của hàng trăm biến số cho hàng chục ngàn khách hàng. Khi số lượng khách hàng và biến số tăng thêm, phương pháp học máy bắt đầu cho kết quả tốt, nếu không muốn nói là tốt hơn, so với phương pháp hồi quy.
Hiện nay các nhà nghiên cứu dự đoán tỉ lệ rời bỏ dựa trên hàng ngàn biến số và hàng triệu khách hàng. Năng lực máy tính tăng lên nghĩa là người ta có thể đưa vào khối lượng dữ liệu cực lớn, bao gồm cả chữ, cả hình, cả số. Ví dụ, trong một mô hình dự đoán tỉ lệ rời bỏ điện thoại, nhà nghiên cứu sử dụng dữ liệu là ghi nhận cuộc gọi theo giờ bên cạnh những biến số chuẩn như số tiền thanh toán và thời gian thanh toán.
Phương pháp học máy cũng tiến bộ nhờ tận dụng dữ liệu sẵn có. Trong cuộc thi tại ĐH Duke, một yếu tố chủ chốt đóng góp cho thành công là lựa chọn trong số hàng trăm biến số và lựa chọn mô hình thống kê phù hợp. Phương pháp tốt nhất vào lúc đó, bất kể là học máy hay hồi quy, đều kết hợp giữa trực giác và kiểm tra thống kê để chọn biến số và mô hình phù hợp. Hiện nay, phương pháp học máy, đặc biệt là phương pháp học sâu, cho phép mô hình có tính linh hoạt, và như vậy các biến số có thể kết hợp với nhau theo nhiều cách không ngờ. Những người có tiền cước nhiều vào đầu tháng thường ít có khả năng rời bỏ hơn những người có tiền cước nhiều vào cuối tháng. Hay những người có tiền cước đường dài nhiều vào cuối tuần mà lại chậm thanh toán và có xu hướng nhắn tin nhiều là nhóm đặc biệt có xu hướng rời bỏ cao. Những sự kết hợp này khó mà tiên đoán, nhưng chúng có thể giúp rất nhiều cho việc dự đoán. Bởi vì khó tiên đoán, nên những người lập mô hình không đưa chúng vào khi dự đoán theo phương pháp hồi quy. Học máy cho phép máy tự chọn các kết hợp và tương tác mà không lệ thuộc vào người lập trình.
Cải tiến trong phương pháp học máy nói chung và học sâu nói riêng giúp người ta có thể biến dữ liệu sẵn có thành dự đoán tỉ lệ rời bỏ chính xác hơn một cách dễ dàng. Và phương pháp học máy hiện nay rõ ràng đã chiếm ưu thế hơn so với hồi quy hay các phương pháp khác.
Các dự đoán khác ngoài tỉ lệ rời bỏ
Học máy đang cải thiện kết quả dự đoán trong nhiều lĩnh vực khác nhau ngoài việc dự đoán tỉ lệ rời bỏ, ví dụ như trong thị trường tài chính và dự báo thời tiết.
Cuộc khủng hoảng tài chính năm 2008 là sự thất bại thảm hại của các phương pháp dự đoán dựa trên hồi quy. Một trong những yếu tố thúc đẩy cuộc khủng hoảng là dự đoán khả năng vỡ nợ của các khoản vay có thế chấp, hay CDO. Năm 2007, các tổ chức xếp hạng như Standard & Poor's dự báo rằng CDO hạng AAA có nguy cơ thấp hơn 1/800 sẽ không thu lại lợi nhuận sau năm năm. Năm năm sau, hơn ¼ số CDO này không mang lại lợi nhuận. Dự đoán ban đầu sai đến thảm hại mặc dù đã có rất nhiều dữ liệu lịch sử về các vụ vỡ nợ.
Sai lầm này không phải do thiếu dữ liệu, mà là do cách nhà phân tích sử dụng dữ liệu để cho ra kết quả dự đoán. Các tổ chức xếp hạng dự đoán dựa trên các mô hình hồi quy cho rằng giá nhà tại các thị trường khác nhau không có mối liên kết với nhau. Điều này hóa ra không đúng, không chỉ trong nam 2007 mà cả trước đó. Xét thực tế cú sốc xảy ra đồng thời cho nhiều thị trường nhà ở, mối nguy mất cả chì lẫn chài do CDO tăng lên gấp nhiều lần, cho dù chúng dàn trải khắp các thành phố của Mỹ.
Nhà phân tích xây dựng mô hình hồi quy dựa trên giả thiết tự họ xác định những yếu tố quan trọng và mối quan hệ của chúng, những lập luận không cần thiết đối với học máy. Mô hình học máy đặc biệt giỏi trong việc xác định sự kết hợp của các biến số và nhận biết những yếu tố nào là quan trọng, và những yếu tố nào bất ngờ thay lại không quan trọng. Lúc này đây, trực giác và giả thiết của nhà phân tích không còn quá quan trọng nữa. Bằng cách này, học máy cho ra kết quả dự đoán dựa trên những mối tương quan chưa từng nghĩ đến, ví dụ như giá nhà tại Las Vegas, Phoenix, và Miami có thể đi cùng chiều với nhau.
Nếu chỉ là dự đoán thì sao lại gọi nó là Trí tuệ?
Những tiến bộ gần đây trong lĩnh vực học máy đã làm thay đổi toàn bộ cách chúng ta sử dụng thống kê để dự đoán. Cũng có thể nói những tiến bộ gần đây trong AI và học máy chỉ là "thống kê truyền thống được tiêm thuốc nổ." Từ một góc nhìn nào đó thì cũng đúng, vì mục đích cuối cùng của việc đưa ra dự đoán là lấp đầy thông tin còn thiếu. Ngoài ra, quá trình học máy cũng là tìm kiếm một giải pháp có ít lỗi sai nhất.
Vậy thì điều gì đã giúp cho học máy trở thành một công nghệ máy tính mang tính bản lề xứng đáng với danh xưng "trí tuệ nhân tạo"? Trong nhiều trường hợp, kết quả dự đoán tốt đến mức người ta có thể sử dụng dự đoán thay cho logic lập luận.
Dự đoán tốt đã làm thay đổi cách lập trình máy tính. Cả hai phương pháp thống kê truyền thống và thuật toán dựa trên những câu lệnh nếu-thì đều không làm tốt trong những môi trường phức tạp. Bạn muốn tìm ra con mèo trong một tệp hình ảnh ư? Hãy nhớ rằng mèo có nhiều màu và hình dáng lông khác nhau. Chúng có thể đang đứng, ngồi, nằm, nhảy, mặt quạu quọ. Chúng có thể ở trong nhà hay ngoài trời. Nhiệm vụ trở nên quá phức tạp. Như vậy, nếu muốn làm được làng nhàng thôi cũng mất rất nhiều công sức. Mà đó chỉ mới là con mèo thôi. Giả sử chúng ta muốn có một cách nào mục tiêu được hết mọi vật thể có trong hình? Chúng ta cần bảng mô tả riêng cho từng vật.
Một công nghệ chủ đạo là nền tảng của những tiến bộ gần đây, được gọi là học sâu, dựa trên phương pháp lan truyền ngược. Nó tránh được những việc kể trên theo một cách giống như bộ não của con người, đó là học hỏi bằng ví dụ (việc nơron nhân tạo có bắt chước nơron thật hay không cũng là một vấn đề thú vị bên cạnh tính hữu ích của công nghệ này). Nếu bạn muốn dạy cho đứa trẻ từ "con mèo," thì mỗi lần nhìn thấy con mèo, bạn sẽ chỉ vào nó và nói "con mèo." Học máy cũng giống như vậy. Bạn đưa cho nó rất nhiều bức hình có mèo và có gắn thẻ "con mèo" và nhiều bức hình không có con mèo và không có gắn thẻ "con mèo." Máy sẽ học cách nhận dạng mô hình các điểm chấm pixel được gắn thẻ "con mèo."
Nếu bạn có một loại hình có mèo và chó, mối liên kết giữa mèo và vật thể bốn chân được củng cố mạnh hơn, và tương tự cho mối liên hệ với chó. Bạn không cần phải định nghĩa nhiều, một khi bạn đã đưa vào máy hàng triệu tấm hình khác nhau (bao gồm nhiều tấm không có chó) và gắn thẻ tương ứng, nó sẽ tạo được thêm nhiều mối liên kết và học được cách phân biệt giữa mèo và chó.
Nhiều vấn đề đã chuyển mình thoát khỏi vấn đề thuật toán ("đâu là đặc tính của con mèo?") trở thành vấn đề dự đoán ("tấm hình này thiếu nhãn liệu có các đặc tính giống như những con mèo đã thấy trước kia không?"). Học máy dùng mô hình xác suất để giải quyết vấn đề.
Vậy thì tại sao nhiều nhà công nghệ lại gọi học máy là "trí tuệ nhân tạo"? Vì kết quả của việc học máy - dự đoán - là thành tố chủ đạo của trí tuệ, tính chính xác của dự đoán được cải thiện qua quá trình học tập, và tính chính xác cao cho phép máy móc thực hiện những nhiệm vụ mà đến lúc này vẫn gắn liền với trí tuệ của con người, ví dụ như nhận dạng đối tượng.
Jeff Hawkins, trong tác phẩm On Intelligence, là một trong những người đầu tiên lập luận rằng dự đoán là nền tảng của trí thông minh của con người. Cốt lõi của lý thuyết này là trí tuệ nhân loại, tâm điểm của tính sáng tạo và tiến bộ năng suất, chính là cách bộ não sử dụng ký ức để đưa ra dự đoán: "Chúng ta liên tục song song nhau đưa ra dự đoán cấp độ thấp bằng mọi giác quan. Nhưng không chỉ có thế. Tôi muốn đưa ra một lập luận mạnh hơn nữa. Dự đoán không chỉ là một trong những điều mà bộ não thực hiện. Đây là chức năng chủ đạo của vỏ não mới, là nền tảng của trí thông minh. Vỏ não là một cơ quan dùng để dự đoán."
Hawkins lập luận rằng bộ não của chúng ta liên tục đưa ra dự đoán về những gì chúng ta sắp trải nghiệm - những gì chúng ta sẽ thấy, cảm giác, nghe thấy. Khi chúng ta lớn lên và trưởng thành, dự đoán của não bộ ngày càng chính xác hơn; các dự đoán thường biến thành sự thật. Tuy nhiên, khi dự đoán không thể hiện chính xác tương lai, chúng ta nhận thấy sự bất thường này, và thông tin được đưa ngược trở lại cho não bộ, nó cập nhật thuật toán, học hỏi và gia cố thêm cho mô hình.
Tác phẩm của Hawkins gây nhiều tranh cãi. Các ý tưởng của ông ấy được tranh luận trong ngành tâm lý học, và nhiều nhà khoa học máy tính thẳng thừng bác bỏ quan điểm nhấn mạnh của ông ấy về vỏ não là mô hình cho cỗ máy dự đoán. Quan điểm cho rằng AI có thể vượt qua bài kiểm tra Turing vẫn còn rất xa trong thực tế (bài kiểm tra Turing là khi chiếc máy có thể đánh lừa con người để con người tưởng rằng máy thật sự là người). Những thuật toán AI hiện nay chưa thể lý luận, và cũng rất khó tra khảo chúng để tìm hiểu nguồn cơn mà chúng đưa ra kết quả dự đoán.
Mặc dù mô hình nền tảng của ông ấy chưa phù hợp, sự nhấn mạnh rằng dự đoán là nền tảng của trí tuệ là rất hữu ích để hiểu được tác động của những thay đổi gần đây trong AI. Ở đây chúng tôi nhấn mạnh đến hệ quả của những cải thiện đột phá trong công nghệ dự đoán. Rất nhiều nguyện vọng của các học giả tham dự hội nghị Dartmouth năm 1956 hiện đã ở gần trong tầm tay. Theo nhiều cách khác nhau, cỗ máy dự đoán có thể "dùng ngôn ngữ, tạo khái niệm và trừu tượng, giải quyết những vấn đề hiện nay [tại thời điểm 1955] đang là độc quyền của con người, và tự hoàn thiện bản thân."
Chúng tôi không suy đoán liệu sự phát triển này có báo trước sự xuất hiện của một thế lực trí tuệ nhân tạo như Skynet hay không. Tuy nhiên, như bạn sẽ thấy, việc tập trung hẹp vào dự đoán chắc chắn sẽ mang lại những thay đổi phi thường trong vài năm nữa. Cũng như năng lực tính toán giá rẻ do máy tính mang lại là động lực mạnh mẽ thúc đẩy những thay đổi đột phá cho doanh nghiệp và đời sống, những biến hóa tương tự rồi sẽ đến nhờ việc dự đoán giá rẻ.
Nhìn chung, cho dù có xứng danh trí tuệ hay không, việc phát triển từ lập trình xác định sang lập trình xác suất cũng là một bước chuyển mình quan trọng về chức năng, nhất quán với sự phát triển của khoa học xã hội và vật lý. Triết gia Ian Hacking, trong tác phẩm The Taming of Chance, đã nói rằng trước thế kỷ 19, xác suất là lĩnh vực của những tay cờ bạc. Đến thế kỷ 19, dữ liệu thống kê của chính phủ gia tăng đã áp dụng các phép toán xác suất vào bộ môn khoa học xã hội. Thế kỷ 20 chứng kiến sự tái lập lại kiến thức về thế giới vật lý, dịch chuyển từ quan điểm tất định của Newton sang những bất định của cơ học lượng tử. Có lẽ tiến bộ quan trọng nhất của khoa học máy tính trong thế kỷ 21 cũng tương ứng với những tiến bộ trước đó trong lĩnh vực khoa học xã hội và vật lý học: việc thừa nhận thuật toán hoạt động tốt nhất khi được cấu trúc theo xác suất, dựa trên dữ liệu.
Điểm chính
· Học máy có mục tiêu khác với thống kê. Thống kê nhấn mạnh yếu tố trung bình chính xác, học máy không cần điều này. Mục tiêu của nó là hiệu quả hoạt động. Dự đoán có thể thiên vị miễn là nó tốt hơn (nhờ vào những chiếc máy tính mạnh mẽ). Các nhà khoa học do đó được tự do thử nghiệm và tạo ra những cải tiến nhanh chóng nhờ tận dụng dữ liệu phong phú và máy tính mạnh có mặt từ 10 năm qua.
· Phương pháp thống kê truyền thống đòi hỏi phải trình bày rõ ràng giả thuyết hay ít nhất là trực giác của người thực hiện để xác định mô hình. Học máy không nhất thiết phải xác định từ trước nên đưa những dữ liệu nào vào mô hình; nó có thể xử lý những mô hình phức tạp với nhiều tương tác giữa các biến số.
· Những tiến bộ gần đây trong học máy thường được nhắc đến như là tiến bộ của trí tuệ nhân tạo vì: 1) hệ thống dựa trên kỹ thuật này phải học và cải tiến dần theo thời gian; 2) những hệ thống này cho ra kết quả dự đoán chính xác hơn rất nhiều so với những cách làm khác trong cùng điều kiện, và nhiều chuyên gia lập luận rằng dự đoán là cốt lõi của trí tuệ; và 3) tính chính xác của dự đoán từ những hệ thống này cho phép chúng làm những nhiệm vụ như dịch thuật và điều hướng vốn dĩ trước kia được xem là lĩnh vực độc quyền của trí tuệ nhân loại. Chúng tôi không bình luận về mối liên hệ giữa dự đoán và trí tuệ. Những kết luận của chúng tôi không lệ thuộc vào quan điểm liệu tiến bộ trước dự đoán có đại diện cho tiến bộ của trí tuệ. Chúng tôi tập trung vào hệ quả của việc giảm chi phí dự đoán, chứ không phải giảm chi phí của trí tuệ.
Bạn đang đọc truyện trên: AzTruyen.Top