Siêu máy tính đoán đúng ba trận cuối Euro 2024 hoạt động thế nào?
Siêu máy tính của công ty dữ liệu thể thao Opta Sports thu hút sự chú ý sau khi đoán đúng kết quả hai trận bán kết và chung kết Euro 2024.
Opta là siêu máy tính quen thuộc với các cổ động viên thể thao ở nhiều giải đấu. Dù không phải lúc nào cũng chính xác do nhiều yếu tố khó đoán trước trong mỗi trận đấu, Opta được mô tả là "nhà phân tích tạo ra những ngạc nhiên lớn". Siêu máy tính này cũng trở thành nguồn tham khảo cho các bài phân tích, dự đoán kết quả tại Euro 2024.
Khi Euro 2024 chưa diễn ra, Opta cho rằng Anh sẽ lên ngôi vô địch. Tuy nhiên, trong suốt giải đấu, siêu máy tính liên tục được cập nhật các thông số về các đội bóng đang chơi để tiến hành phân tích, từ đó dự đoán Tây Ban Nha và Anh sẽ đi tiến vào chung kết và chiếc cup sẽ thuộc về Tây Ban Nha.
Cách Opta dự đoán
Opta Sports, có trụ sở tại London, phân tích các trận đấu bóng đá từ năm 1996. CEO Aiden Cooney được đánh giá không am hiểu về thể thao nhưng nhạy cảm với dữ liệu thống kê và đã đưa những con số "vô hồn" trở thành món hàng đắt giá.
Chia sẻ trên Twitter năm 2018, Cooney cho biết ông lên ý tưởng thu thập các chỉ số cầu thủ theo "phong cách của NASA", như dữ liệu từ chip theo dõi cầu thủ, vệ tinh đo quãng đường cầu thủ đã chạy trong 90 phút, xem xét hướng tấn công, bản đồ nhiệt khi cầu thủ di chuyển. Họ cũng sử dụng laptop, PC siêu mạnh, máy chủ lưu trữ dữ liệu khổng lồ và bảo vệ nó "như một pháo đài".
Opta ra mắt quy trình thu thập dữ liệu thời gian thực cho các trận đấu bóng đá năm 2006. Sau đó, công ty tiếp tục mở rộng cho các giải đấu ở các môn thể thao khác.
Simon Banoub, Giám đốc tiếp thị của Opta, nói với Stuff rằng công ty tổng hợp hơn 2.000 dữ liệu trong mỗi trận đấu, hơn 60.000 trận đấu mỗi năm ở 30 môn thể thao tại 70 quốc gia, cung cấp kết quả cho các trang web, báo chí, đài truyền hình và các đội tuyển.
"Chúng tôi có nhiều trung tâm thu thập dữ liệu trên toàn thế giới. Trong mỗi trận đấu, chúng tôi có ba người sử dụng phần mềm tùy chỉnh theo dõi trực tiếp trên sân: một người phụ trách đội chủ nhà, một người đảm nhiệm đội khách và người thứ ba chuyển dữ liệu này về siêu máy tính", Banoub cho biết.
Theo Banoub, với các trận ít quan trọng hơn, việc phân tích được thực hiện qua video ghi lại hoặc số liệu từ nhân viên có mặt trên sân bóng. Tuy nhiên, tất cả đều được đào tạo để hiểu một pha vào bóng hay một pha tranh chấp tay đôi, biết sự khác biệt giữa một đường chuyền ngắn và một đường phát bóng.
"Người được tuyển dụng ở Opta cần hai kỹ năng chính là giỏi trò chơi điện tử và biết về bóng đá", Banoub cho biết, đồng thời nói đó cũng là lý do công ty tuyển một lượng lớn sinh viên làm chuyên viên phân tích.
Trước khi được đưa vào siêu máy tính, dữ liệu được xử lý thô. Các con số được chuyên viên mã hóa theo hành động của cầu thủ, tức các cú sút, đường chuyền, pha cứu thua, đánh đầu, tạt bóng... đều được phân loại. "Không đơn giản chỉ ngồi xem bóng đá. Do đó, cứ 100 người được phỏng vấn, chỉ 5 người vượt qua quy trình đào tạo ban đầu", Banoub nói.
Opta cũng sử dụng công nghệ thị giác máy tính để tự động theo dõi chuyển động và hành động của cầu thủ cụ thể trong trận đấu. Bằng cách phân tích nguồn cấp dữ liệu video, thuật toán máy tính có thể xác định và trích xuất các điểm dữ liệu như vị trí của người chơi, khoảng cách chạy và độ chính xác của đường chuyền.
Cùng với đó, Opta sử dụng công nghệ như thiết bị GPS, máy đo gia tốc và các thiết bị đeo khác để thu thập dữ liệu hiệu suất của cầu thủ trong buổi tập luyện và trận đấu. Các công nghệ này đem đến thông tin chi tiết về thể lực, tốc độ, quãng đường đã chạy và các số liệu hiệu suất khác.
Công ty hiện hợp tác với nhiều giải đấu và tổ chức thể thao để nhận dữ liệu chính thức như số liệu thống kê, thông tin cầu thủ và các chi tiết liên quan khác.
Cuối cùng, dữ liệu kể trên sẽ được tổng hợp và đưa vào siêu máy tính để chạy mô phỏng trận đấu giả định khoảng 10.000 lần, sau đó lấy giá trị trung bình. Tuy nhiên, dữ liệu liên tục thay đổi trước và trong giải đấu, nên kết quả cũng sẽ được điều chỉnh thường xuyên.
Theo Metro, khác với các siêu máy tính khác thường xử lý toàn bộ dữ liệu trên hệ thống, Opta Sports sử dụng sự kết hợp giữa chuyên môn của con người, công nghệ tiên tiến và quan hệ đối tác để thu thập và phân tích, cuối cùng cho ra thống kê mang tính tham khảo có giá trị cho các đội thể thao, phương tiện truyền thông và người hâm mộ trên toàn thế giới.
Không thể chính xác tuyệt đối
Dù dựa trên hàng loạt dữ liệu thống kê, không phải khi nào Opta cũng dự đoán đúng. Đây là điều hiển nhiên bởi luôn có những yếu tố phát sinh và gây bất ngờ trong suốt mùa giải mà siêu máy tính không thể tính toán trước được.
Chẳng hạn, khi dự đoán đội vô địch Premier League 2022-2023, Opta cho rằng Liverpool sẽ đoạt cúp với 49,7% cơ hội, còn Manchester City là 47%. Kết quả, Liverpool xếp thứ 5, còn Manchester City vô địch.
Tại Euro 2024, trước giải đấu, Opta dự đoán Anh có 48,2% cơ hội vào bán kết, 31,1% vào chung kết và 19,9% giành cúp vô địch. Tây Ban Nha chỉ xếp thứ tư với 9,6% cơ hội, được thể hiện bằng màu xanh tím trong biểu đồ trên.
Tuy nhiên, sau khi cập nhật dữ liệu của vòng 1/8, siêu máy tính này dự đoán lại, đưa Tây Ban Nha lên vị trí số một, còn Anh ở vị trí thứ hai (màu đỏ). Thực tế, hai đội này đều tiến vào trận chung kết với chiến thắng thuộc về Tây Ban Nha.
Ông Banoub cho biết, tỷ lệ chính xác của Opta cao nhất "có thể tới 98%". "Luôn có sự kết hợp giữa yếu tố khách quan và chủ quan, như động lực, cách cầu thủ giúp đồng đội chơi thế nào, cách họ phản ứng khi gặp khó khăn", ông nói.
Tuy nhiên, tiến sĩ Alireza Monajati, nhà nghiên cứu dữ liệu tại Anh, cho rằng tỷ lệ công bố 98% khó có cơ sở. "Họ không thể bảo đảm độ chính xác như vậy", Monajati nói với BBC. Ông cũng đánh giá Opta là kênh tham khảo nhưng cần so sánh thêm từ nhiều nguồn khác, thay vì tin theo hoàn toàn.
Ngoài bóng đá, Opta cũng cung cấp dữ liệu cho các môn thể thao khác trên toàn cầu. Đối thủ lớn nhất của công ty là ProZone khi cung cấp nhiều dữ liệu dự đoán thậm chí chi tiết hơn Opta, nhưng không công khai mà chỉ bán cho các tập đoàn lớn.