xG là gì? Cách AI dùng Expected Goals để dự đoán bóng đá
xG là gì? Cách AI dùng Expected Goals để dự đoán bóng đá
xG là gì?
xG (Expected Goals) là chỉ số xác suất một cú sút trở thành bàn thắng, có giá trị từ 0 đến 1. Một cú sút penalty có xG ≈ 0.76, một cú sút xa ngoài vòng cấm có xG ≈ 0.03. Tổng xG của một đội trong trận là kỳ vọng số bàn thắng đội đó “đáng lẽ” ghi được dựa trên chất lượng cơ hội tạo ra.
xG ra đời từ giới phân tích dữ liệu bóng đá khoảng 2012, ngày nay là input chuẩn của hầu hết mô hình AI dự đoán bóng đá.
Vì sao AI cần xG thay vì chỉ dùng bàn thắng?
Bàn thắng là biến rời rạc, phương sai lớn, nhiễu cao. Một đội thống trị 80% thời lượng có thể thua 0-1 vì một pha phản công ăn may. Nếu mô hình AI chỉ học từ bàn thắng, nó sẽ học cả nhiễu ngẫu nhiên.
xG giảm nhiễu vì nó đo chất lượng thay vì kết quả. Khi gom dữ liệu 38 trận một mùa, xG trung bình ổn định hơn bàn thắng trung bình khoảng 30-40% theo nghiên cứu của FiveThirtyEight và StatsBomb.
Kết hợp xG vào mô hình Poisson
Mô hình Poisson cơ bản giả định số bàn thắng của một đội tuân theo phân phối Poisson với tham số λ:
P(X = k) = (λ^k * e^(-λ)) / k!
Cách truyền thống ước lượng λ là dùng trung bình bàn thắng. Cách AI hiện đại dùng:
λ_home = α * xG_home_offense * xG_away_defense * home_advantage
λ_away = α * xG_away_offense * xG_home_defense
Trong đó:
xG_home_offense: xG trung bình tạo ra mỗi trận của đội nhà 10 trận gần nhấtxG_away_defense: xG đối thủ trung bình tạo ra khi gặp đội khách (xGA)home_advantage: hệ số sân nhà, thường 1.1-1.3α: hệ số chuẩn hóa giải đấu
Sau khi có λ_home và λ_away, mô hình tính ma trận xác suất tỉ số 6x6 (từ 0-0 đến 5-5) bằng tích Poisson độc lập:
P(home=i, away=j) = Poisson(i; λ_home) * Poisson(j; λ_away)
Từ ma trận này suy ra xác suất 1X2, Over/Under, BTTS, AH.
Case thực tế: dự báo Man City vs Arsenal
Giả sử trước trận:
- Man City: xG/trận = 2.4, xGA/trận = 0.9
- Arsenal: xG/trận = 2.1, xGA/trận = 1.0
- Hệ số sân nhà: 1.15
Tính λ:
- λ_City = 1.0 * 2.4 * 1.0 * 1.15 ≈ 2.76
- λ_Arsenal = 1.0 * 2.1 * 0.9 ≈ 1.89
Đưa vào ma trận Poisson:
- P(City thắng) ≈ 51%
- P(hòa) ≈ 22%
- P(Arsenal thắng) ≈ 27%
- P(Over 2.5) ≈ 73%
- P(BTTS Yes) ≈ 71%
So với kèo thị trường (City 1.95, hòa 3.6, Arsenal 4.0), mô hình thấy giá trị ở Over 2.5 và BTTS Yes.
Vì sao Poisson thuần không đủ, cần xG?
Poisson thuần dùng bàn thắng trung bình bị “regression to the mean” chậm. Một đội mới có HLV mới, đội hình mới, bàn thắng quá khứ lỗi thời. xG cập nhật nhanh hơn vì nó phản ánh chất lượng cơ hội của lối chơi hiện tại, không phải hiệu suất dứt điểm trong quá khứ.
Ngoài ra Poisson thuần giả định độc lập giữa hai đội, không thực tế. Các biến thể như Dixon-Coles điều chỉnh xác suất tỉ số thấp (0-0, 1-1, 1-0, 0-1) để khớp dữ liệu thực hơn. AI hiện đại dùng Dixon-Coles + xG input là chuẩn công nghiệp.
Hạn chế của xG trong mô hình AI
- Chất lượng dữ liệu: xG phụ thuộc nhà cung cấp (Opta, StatsBomb, Understat). Các nhà cung cấp tính xG khác nhau, sai số 5-15%.
- Không tính context: xG không biết đội đang bị đuổi 1 người, đang dẫn 3-0, hay đang đá luân lưu giả định.
- Bias với đội phòng ngự sâu: Đội đá phản công có ít cú sút nhưng chất lượng cao, xG có thể đánh giá thấp.
- Thủ môn: xG không tính chất lượng thủ môn. Bổ sung xGOT (Expected Goals on Target) giúp khắc phục.
FAQ ngắn
xG bao nhiêu là tốt cho một đội mỗi trận? Top giải lớn: 1.8-2.5 xG/trận là tấn công mạnh. Dưới 1.0 xG/trận là tấn công yếu.
Mô hình AI dùng xG có chính xác hơn kèo nhà cái? Không hẳn, vì nhà cái cũng dùng xG + nhiều dữ liệu nội bộ. Nhưng mô hình AI cá nhân hóa có thể tìm ra value bet ở những trận nhà cái pricing chưa hiệu quả.
Có thể tự tính xG không? Có, nhưng cần dữ liệu shot-by-shot (vị trí, loại sút, tình huống). Các site như Understat cung cấp miễn phí cho 5 giải lớn.
👉 Xem lịch thi đấu & kèo cụ thể: bongda369.com
Trang liên kết
Partners