Lee Sedol lần đầu tiên đánh bại AlphaGo của Google

Hồng Khang

9 năm trước

Trong một “trận chiến” vô cùng kịch tính, Kỳ thủ Hàn Quốc Lee Sedol đã giành chiến thắng đầu tiên trước hệ thống máy tính trí tuệ nhân tạo AlphaGo của Google, sau khi thua liên tiếp 3 ván đấu trước đó.

Mặc dù sau khi thắng 3 ván đầu tiên của trận đấu năm ván, AlphaGo đã giành chiến thắng chung cuộc, nhưng hai ván đấu còn lại vẫn diễn ra dù chỉ mang tính thủ tục. Lee Sedol đã lấy lại một chút sự tự hào cho bản thân và cho hàng triệu người đang theo dõi trực tuyến trận đấu này.

Các phóng viên và các nhà nhiếp ảnh đã vỗ tay reo hò khi AlphaGo tuyên bố thua cuộc sau ván đấu kéo dài 5h. Và họ còn reo hò ầm ĩ hơn khi bước vào phòng họp báo sau trận đấu.

Sự thống trị của AlphaGo trong suốt 3 ván đấu trước cho thấy sức mạnh vượt trội của những công nghệ hiện đại bên trong nó – những công nghệ có thể dùng để sáng tạo lại mọi thứ từ nghiên cứu khoa học đến robot. Trong khi đó, chiến thắng lần này của Lee Sedol cho thấy, máy móc không có nghĩa là không thể mắc sai lầm.

Chiến thắng của Lee Sedol ở ván thứ 4 cho thấy ngay cả một cỗ máy AI tài giỏi nhất cũng còn một chặng đường dài trước khi có thể thực sự lặp lại suy nghĩ của con người.

Một cỗ máy có thể đánh bại kỳ thủ hàng đầu về cờ vây, nhưng không có nghĩa là nó sẽ vượt qua bài kiểm tra khoa học ở lớp 8, trò chuyện như con người hay biểu lộ các cảm xúc thường thấy.

Như nhà bình luận Chris Garlock nói trước khi ván đấu bắt đầu, một câu hỏi lớn: “Liệu AlphaGo có điểm yếu nào không?”

Đó là câu hỏi đặt ra trong phòng họp báo sau ván đấu thứ 3, khi Lee Sedol xin lỗi công chúng Hàn Quốc và công đồng chơi cờ vây.

“Tôi không biết phải nói gì hôm nay, nhưng tôi nghĩ tôi phải nói lời xin lỗi của mình trước“, “Tôi nên có một kết quả tốt hơn, một trận đấu tốt hơn so với các ván đấu trước“, anh nói.

Kỳ thủ người Hàn Quốc thừa nhận đã phải chịu tác động của áp lực từ công chúng. Trận đấu đang là tâm điểm chú ý ở Hàn Quốc, nơi có khoảng 8 triệu người chơi cờ vây. Nhưng giờ khi áp lực chiến thắng đã không còn, anh tuyên bố sẽ tiếp tục tìm kiếm điểm yếu của cỗ máy.

“Cho dù AlphaGo là một chương trình rất mạnh, tôi không nói đó là một chương trình hoàn hảo, so với con người, nước đi của nó rất khác biệt và có những lúc vượt trội. Nhưng tôi nghĩ AlphaGo vẫn có điểm yếu nào đó“, Lee cho biết.

Anh tỏ ra không vui với ván đấu thứ 2, khi anh cảm thấy mình đã mắc sai lầm nghiêm trọng và không tận dụng những lỗi của AlphaGo. “Có một số cơ hội mà tôi đã bỏ lỡ”, anh nói.

Ván đấu thứ 4 khởi đầu rất giống với ván thứ 2. Như ván đấu thứ 2, anh lại chơi quân trắng, nghĩa là đi sau đối phương. Lee đáp trả lại bước khai cuộc của AlphaGo tương tự ván thứ 2.

“Nó như cùng một ván đấu vậy“, nhà bình luận Michael Redmond nói sau 6 bước đi của ván đấu.

Chris Garlock đặt ra câu hỏi: “Phải chăng Lee Sedol muốn chơi các nước đi bất thường nhất có thể để tìm ra điểm yếu của AlphaGo?“.

Nhưng như Redmond chỉ ra:

“Điều đó không thực sự có tác dụng trong ván đấu thứ 1. Từ cơ chế hoạt động của AlphaGo, dường như không chắc các nước đi bất thường, hay thậm chí kỳ lạ có thể mang lại hiệu quả với cỗ máy này.

Bằng cách sử dụng công nghệ mạng lưới thần kinh – mô phỏng mạng nơ ron thần kinh của não người – AlphaGo tự học chơi cờ vây bằng cách phân tích hàng ngàn hàng vạn nước đi của người chơi trước. Sau đó, kết hợp với công nghệ học tăng cường, nó tự chơi cờ với chính bản thân mình để đẩy trình độ của mình lên các đẳng cấp cao hơn.

Về bản chất, các lần tự chơi này giúp tạo ra các nước đi mới mà máy tính có thể sử dụng để đào tạo lại chính bản thân. Vì vậy, đây không phải là nước đi của con người.

Nói cách khác, hệ thống AlphaGo không vận hành để chơi theo cách thông thường, nó chơi theo cách con người sẽ không bao giờ làm“.

Chris Garlock đặt ra câu hỏi phải chăng Lee Sedol muốn chơi các nước đi bất thường nhất có thể để tìm ra điểm yếu của AlphaGo

Khi trận đấu diễn ra, Lee Sedol mất thời gian cho mỗi nước đi hơn rất nhiều so với đối thủ của mình. Điều tương tự cũng đã xảy ra trong ván thứ 2 và thứ 3. Vì vậy, khi đồng hồ của anh hết thời gian, kỳ thủ Hàn Quốc buộc phải tăng tốc độ đặt quân lên.

Trong khi đó, ngược lại, AlphaGo quản lý thời gian khá tốt, và nó hầu như không mắc sai lầm nào. Trước trận đấu, Demis Hassabis, người giám sát đội chế tạo AlphaGo cho biết, một mạng lưới thần kinh đã được bổ sung cho AlphaGo để kiểm soát thời gian.

Một vài nhà bình luận đã đưa ra “chiến lược” của mình: “Tôi chỉ cần rút dây cắm“. Redmond nói về AlphaGo. “Nó phụ thuộc vào kết nối Internet, đúng không? Tất cả những gì chúng ta cần là một ai đó với cái kéo”.

Khi lần đầu xây dựng AlphaGo, Hassabis và nhóm của mình đào tạo và chạy hệ thống trên một máy tính đơn. Nhưng đến tháng 10, trước khi đấu với người 3 lần vô địch cờ vây châu Âu, Fan Hui, nhóm nghiên cứu đã được nâng cấp hệ thống với sức mạnh xử lý cao hơn.

Các mạng lưới thần kinh điển hình chạy trên một lượng lớn các máy tính kết nối với nhau, mỗi chiếc được trang bị các chip xử lý đồ họa GPU, phục vụ cho thuật toán máy học. Vào tháng 10, Hassabis cho biết AlphaGo chạy trên một mạng lưới với 170 thẻ GPU và 1.200 bộ xử lý tiêu chuẩn.

Khi đồng hồ điểm 2 tiếng, Redmond đã gọi trận đấu này là một ván đấu điển hình của Lee Sedol.

Lúc này Lee Sedol dường như có vị trí tốt hơn trong ván thứ 3. Anh cũng tỏ ra bình tĩnh hơn. Nhưng sau khoảng 25 phút chơi tiếp, Redmond, cũng là một người giỏi về cờ vây, cảm thấy AlphaGo đã rơi vào tình thế gay go.

Thời gian của Lee Sedol chỉ còn 25 phút nữa trên đồng hồ, ít hơn gần một giờ so với AlphaGo. Sự khác biệt này rất quan trọng, vì khi đồng hồ của mình hết thời gian, người chơi phải thực hiện nước đi trong chưa đến 60s.

Tại thời điểm này, AlphaGo bắt đầu chơi theo cách mà Redmond và Garlock thấy không ấn tượng lắm hay các nước đi “chùng xuống“. Dấu hiệu này cho thấy cỗ máy đang quá tự tin về thắng lợi của mình.

AlphaGo được lập trình để tối đa hóa khả năng chiến thắng, không phải điểm số của chiến thắng. Trong khi đó, Lee Sedol hơi cúi mặt về phía trước, tập trung suy nghĩ, mất vài phút cho bước đi tiếp theo của mình.

Nước đi số 78 của Lee Sedol và 79 của AlphaGo: bước ngoặt của ván đấu.

Cuối cùng Lee đã đi 1 nước lớn thay đổi cả cục diện trận đấu. Đó là nước đi thứ 78, khi Lee Sedol đặt một quân của mình – một mũi nhọn – vào giữa bàn cờ. “Đó là nước đi làm ván đấu phức tạp nhất“. Andrew Jackson, nhà bình luận trực tuyến cho Hiệp hội cờ vây Mỹ, cho biết.

Sự phức tạp này đã làm thay đổi lối chơi của cỗ máy. Demis Hassabis sau đó đăng lên Twitter cho rằng AlphaGo đã mắc một sai lầm nghiêm trọng ở nước đi thứ 79, ngay sau nước đi lớn của Lee Sedol. Và khoảng 10 nước đi sau đó, những tính toán của AlphaGo chỉ ra rằng cơ hội chiến thắng của nó đã mất.

Sau đó, gần lúc đồng hồ điểm 3 giờ chơi đã hết, đồng hồ của Lee Sedol đã hết thời gian. Nhưng lối chơi của AlphaGo tiếp tục làm bối rối các nhà bình luận.

“Tôi có ấn tượng rằng AlphaGo đã mất tuyến đường của mình“. Redmond nói.

Một lần nữa, điều này cho thấy AlphaGo đang gặp khó khắn, nhưng nó nhắc Garlock đặt câu hỏi liệu cỗ máy có bao giờ đầu hàng.

Theo David Silver, một nhà nghiên cứu khác trong nhóm tạo ra AlphaGo, cỗ máy sẽ đầu hàng, không phải khi khả năng chiến thắng của nó bằng không, mà khi khả năng chiến thắng xuống dưới 20%.

Silver nói. “Thật thiếu tôn trọng khi tiếp tục chơi ở vị thế rõ ràng là đã rất gần với thất bại“.

Tại thời điểm này, cỗ máy vẫn chưa quyết định cơ hội của nó đã giảm xuống dưới ngưỡng đó. Nhưng theo các nhà bình luận, vị thế của nó đã bắt đầu xấu đi.

“Tôi có cảm giác rằng AlphaGo đang hết nước đi chiến thắng“, Redmond nói.

Cuối cùng, cả Redmond và Garlock đều đồng ý rằng thế trận đang diễn ra khá tốt với Lee Sedol. Nhưng kỳ thủ Hàn Quốc tiếp tục gặp khó về thời gian. Anh đã hai lần mắc lỗi khi thực hiện nước đi nhiều hơn 60s. Sau đó anh đi thực hiện nước đi chỉ trong vài phần nghìn giây trước khi đồng hồ hết thời gian. Nếu mắc lỗi tiếp, anh sẽ chỉ còn 30s để thực hiện nước đi.

Khi ván đấu đã được 3h40, Lee Sedol đứng dậy rời khỏi phòng để tạm nghỉ. Kịch tính của ván đấu được đẩy lên mức cao nhất kể từ ván thứ nhất.

“Lee Sedol đang có cơ hội“, Redmond nói.

Khoảnh khắc AlphaGo đầu hàng, tiếng reo hò vang lên từ phòng bình luận tiếng Hàn Quốc và đám đông phóng viên.

Kỳ thủ Hàn Quốc vẫn phải đối mặt với rắc rối về thời gian và AlphaGo vẫn chưa đầu hàng. Cỗ máy vẫn còn 15 phút nữa trên đồng hồ chơi. Sau đó, AlphaGo đi một nước mà Redmond gọi là “một nước đi vô nghĩa khác“.

Rất nhanh sau đó, cỗ máy đầu hàng.

Sau trận đấu, Redmond và những người khác chỉ ra bước ngoặt của ván đấu là nước đi số 78 của Lee Sedol. Ở giữa ván đấu, Lee Sedol vẫn đang ở phía sau. Nhưng anh đã củng cố nước đi đó thành trung tâm của bàn cờ và chuyển hướng trận đấu. “Lee Sedol đã đi một nước tuyệt vời. Nó đã làm tôi ngạc nhiên. Tôi chắc rằng nó sẽ làm hầu hết các đối thủ sẽ bất ngờ. Tôi nghĩ nó đã làm AlphaGo bất ngờ“, Redmond nói.

Khoảnh khắc AlphaGo đầu hàng, tiếng reo hò vang lên từ phòng bình luận tiếng Hàn Quốc và đám đông phóng viên. Sau đó đến tiếng vỗ tay từ phòng bình luận bằng tiếng Anh. Trái ngược hẳn với không khí của một ngày trước tại đây.

Theo Tri Thức Trẻ