Nguồn Codelearn

https://codelearn.io/blog/view/co-vay-va-thach-thuc-cua-tri-tue-nhan-tao-phan-1

Những người quan tâm đến Cờ vây - bộ môn board game đối kháng, băn khoăn rằng, liệu có một thuật toán AI nào có thể chiến thắng được trí tuệ của người chơi vĩ đại nhất trong bộ môn Cờ Vây hay không? Bài viết ngày hôm nay chính là lời giải đáp về câu hỏi này.

Cờ vây (tiếng Anh: Go) là một trong những trò chơi bảng (board game) lâu đời nhất còn tồn tại đến ngày nay. Mục tiêu chính tập trung vào việc bao vây được một vùng lãnh thổ lớn hơn so với đối thủ. Một bàn Cờ vây tiêu chuẩn có kích cỡ lưới 19x19 đường kẻ, ngoài ra còn có một số kích thước khác như 13x13 hay 9x9; thậm chí kích thước 17x17 cũng đã từng được sử dụng trong lịch sử.

Hình ảnh một bàn Cờ vây 19x19 tiêu chuẩn cùng các quân cờ đá (stone).

Luật chơi

Các kỳ thủ lần lượt đặt quân cờ trên các nút giao còn trống. Nút giao (điểm nút, tiếng Anh: point) là giao điểm của các đường kẻ. Sau khi một quân cờ được đặt lên bàn, quân cờ đó sẽ không thể di chuyển. Tuy nhiên, một quân cờ có thể bị “bắt” (capture) và bị loại khỏi bàn cờ khi nó bị bao vây bởi những quân cờ đối thủ ở tất cả các điểm nút lân cận gần kề. Ván cờ sẽ kết thúc khi có một bên chịu nhận thua (resign), hoặc hai bên không muốn thực hiện tiếp nước đi nào nữa. Thắng thua được xác định bằng cách đếm vùng lãnh thổ cùng với quân cờ bị bắt và điểm komi (số điểm thêm vào tổng điểm của người chơi cầm quân trắng để tạo một lợi thế bù đắp cho việc bắt đầu ván cờ sau người còn lại - cầm quân đen). Bên nào có tổng điểm lớn hơn sẽ giành chiến thắng.

Quy tắc chơi Cờ vây tương đối đơn giản, nhưng về mặt chiến thuật, Cờ vây lại vô cùng thiên biến. Bạn biết rõ mình được phép làm gì, nhưng khi ngồi xuống chơi, bạn lại không biết nên làm gì cả. So với Cờ vua, số nước đi khả thi cho một vị trí lớn hơn rất nhiều lần: ở Cờ vua, con số này là 20, nhưng ở Cờ vây con số này là 200. Nếu xét số lượng khả năng cho toàn bộ các nước đi trên bàn cờ, thậm chí nó còn nhiều hơn tổng số nguyên tử trong vũ trụ. Đây là thách thức cực lớn đối với các nghiên cứu về AI khi muốn tạo ra một phần mềm đánh Cờ vây với con người.

DeepMind và AlphaGo

DeepMind (hay Google DeepMind sau khi được Google mua lại vào năm 2014) là một công ty Trí tuệ nhân tạo (AI) của Anh được thành lập vào tháng 9 năm 2010 với tên DeepMind Technologies. Kể từ tháng 1/2014, sau khi về tay Google, DeepMind đã bắt tay vào thực hiện các dự án chuyên sâu về AI. Hiện nay, CEO và đồng sáng lập của công ty là Tiến sĩ Demis Hassabis.

AlphaGo là một chương trình máy tính được DeepMind phát triển để có thể chơi Cờ vây. Trước năm 2015, các chương trình chơi Cờ vây tốt nhất thế giới chỉ đạt được đến mức độ nghiệp dư. Thậm chí từ nhiều thập niên qua, người ta tin rằng Cờ vây khó có thể bị đánh bại bởi các máy tính do nó chứa nhiều nước cờ sáng tạo và phức tạp mà chỉ bộ óc con người mới làm chủ được. AlphaGo là chương trình có sự khác biệt đáng kể nhất so với những nỗ lực AI trước đó ở chỗ: nó được áp dụng mạng thần kinh nhân tạo, trong đó phương pháp tự giải quyết vấn đề bằng cách đánh giá, thử nghiệm và rút kinh nghiệm không bị mã hóa cứng bởi con người, mà thay vào đó là sự tự học ở mức độ lớn bởi bản thân chương trình, thông qua hàng chục triệu ván cờ vây cũng như những ván cờ tự chơi của chính nó.

AlphaGo - chương trình máy tính chơi Cờ vây của Google DeepMind

Trận đấu lịch sử giữa AlphaGo và Lee Sedol

Trước hết hãy tìm hiểu một chút về hệ thống xếp hạng của Cờ vây. Đẳng cấp của Cờ vây được phân tách trên hai hệ thống riêng biệt: hệ thống đẳng cấp nghiệp dư và hệ thống đẳng cấp chuyên nghiệp. Người ta sử dụng thuật ngữ kyu và thuật ngữ dan để xếp hạng kỳ thủ. Đối với một kỳ thủ chuyên nghiệp, đẳng cao nhất mà họ có thể đạt tới được là chuyên nghiệp 9-dan (9p).

Bối cảnh trận đấu

Tháng 10 năm 2015, AlphaGo đánh bại nhà Vô địch Cờ vây châu Âu Fan Hui. Fan Hui khi đó là một kỳ thủ chuyên nghiệp 2-dan (2p). Đây là lần đầu tiên một sản phẩm của Trí tuệ nhân tạo (AI) có thể đánh bại một kỳ thủ con người chuyên nghiệp trong một trận đấu sử dụng bàn cờ cỡ lớn tiêu chuẩn 19x19 và không sử dụng lợi thế. Trận đấu kết thúc với kết quả thắng lợi hoàn toàn của AlphaGo trước Fan Hui (5-0). Sau trận đấu quá chóng vánh ấy, giới Cờ vây chuyên nghiệp hoài nghi về sức mạnh thực sự của AlphaGo. Họ đặt ra câu hỏi “Sức mạnh thực sự của AlphaGo là gì?” và “Cần thêm bao lâu nữa để nó có thể đánh bại các kỳ thủ giỏi nhất thế giới?” Những câu hỏi này thúc giục các nhà nghiên cứu của DeepMind tiếp tục cải thiện chương trình, và họ muốn đẩy thuật toán AI đến giới hạn để xem quá trình tự học tập và cải thiện này có thể đi bao xa. Để kiểm tra điều đó, các chuyên gia của DeepMind cần phải tìm một đối thủ mới mạnh hơn…

Lee Sedol là một kỳ thủ chuyên nghiệp 9-dan (đẳng cấp cao nhất của Cờ vây) người Hàn Quốc. Anh là người hùng, niềm tự hào dân tộc của xứ sở kim chi và là một trong những kỳ thủ mạnh nhất trong lịch sử Cờ vây. Lee Sedol bắt đầu thi đấu chuyên nghiệp vào năm 13 tuổi (thăng cấp bậc dan chuyên nghiệp ở tuổi 12). Lee Sedol thống trị Cờ vây thế giới trong hơn một thập kỷ với 18 chức Vô địch thế giới. DeepMind lựa chọn Lee Sedol vì họ muốn chọn một người chơi huyền thoại, người mà được công nhận là kỳ thủ Cờ vây vĩ đại nhất trong thập kỷ vừa qua.

Lee Sedol - Kỳ thủ Cờ vây vĩ đại người Hàn Quốc.

Demis Hassabis nói về trận đấu đặc biệt giữa AlphaGo và Lee Sedol:

“Đây là khoảnh khắc lịch sử của cả thế giới Trí tuệ nhân tạo lẫn thế giới Cờ vây. Đến hiện tại, AlphaGo đã đánh bại mọi thử thách mà chúng tôi đưa ra. Nhưng chúng tôi không thể biết sức mạnh thực sự của nó cho tới khi chúng tôi cho đấu với kỳ thủ Cờ vây hàng đầu thế giới như Lee Sedol.”

Fan Hui cũng đưa ra bình luận:

“Cả thế giới đang đặt áp lực lên Lee Sedol. Trước đây, anh ấy tham gia các giải đấu vì tổ quốc, vì bản thân anh ta. Còn lần này, anh ấy thi đấu nhân loại, ví trí tuệ con người.”

Trái ngược lại, Lee Sedol cảm thấy tự tin về trận đấu này. Anh ấy tin rằng trực giác của con người vẫn còn quá cao cấp để cho Trí tuệ nhân tạo có thể bắt kịp. Lee Sedol hi vọng sẽ giành được chiến thắng 5-0 hoặc 4-1 trước AlphaGo.

Trận đấu chính thức - Cuộc quyết đấu đại diện cho nhân loại

Trận thách đấu của DeepMind trước kỳ thủ Cờ vây mạnh nhất thế giới Lee Sedol diễn ra từ ngày 8 tháng 3 năm 2016 đến ngày 15 tháng 3 năm 2016 tại khách sạn Four Seasons ở Seoul, Hàn Quốc. Michael Redmond (9-dan chuyên nghiệp) cùng Chris Garlock là 2 bình luận viên của trận đấu. 5 ván đấu được diễn ra vào các ngày 9/3, 10/3, 12/3, 13/3 và 15/3 và được truyền hình trực tiếp dưới sự theo dõi của 8 triệu người chơi Cờ vây tại Hàn Quốc. Hai bên sẽ thi đấu theo luật Trung Quốc, với 7.5 điểm komi. Trong mỗi ván, thời gian thi đấu giới hạn trong 2 giờ, sau đó là giai đoạn byo-yomi, mỗi người có 60 giây để đưa ra mỗi nước đi, không quá 3 lần để hoàn thành ván cờ. Aja Huang là đại diện bên phía DeepMind chịu trách nhiệm đặt quân cờ vào bàn cờ vây cho AlphaGo.

Tiến sĩ Demis Hassabis (trái) và kỳ thủ Lee Sedol (phải).

Liệu Lee Sedol có bảo vệ được trí thông minh của con người hay AlphaGo sẽ viết nên lịch sử?

Hãy cùng chờ đón phần tiếp theo

Ticker

Cờ Vây Và Thách Thức Của Trí Tuệ Nhân Tạo (Phần 1)

Luật chơi

DeepMind và AlphaGo

Trận đấu lịch sử giữa AlphaGo và Lee Sedol

Trận đấu chính thức - Cuộc quyết đấu đại diện cho nhân loại

Đăng nhận xét

1 Nhận xét

Thống kê

Người lạ ơi cho tôi xin 1 Like

CV của tôi

Bài viết nhiều views

Mô hình Message Queue trong Microservice

Hiểu Domain Design theo cách bá đạo - part 1

DevOps đốt tiền infra tập 1

Bài viết ngẫu nhiên

Ticker

Cờ Vây Và Thách Thức Của Trí Tuệ Nhân Tạo (Phần 1)

Luật chơi

DeepMind và AlphaGo

Trận đấu lịch sử giữa AlphaGo và Lee Sedol

Trận đấu chính thức - Cuộc quyết đấu đại diện cho nhân loại

Bạn có thể thích những bài đăng này

Đăng nhận xét

1 Nhận xét

Thống kê

Người lạ ơi cho tôi xin 1 Like

CV của tôi

Bài viết nhiều views

Mô hình Message Queue trong Microservice

Hiểu Domain Design theo cách bá đạo - part 1

DevOps đốt tiền infra tập 1

Bài viết ngẫu nhiên