Mô hình AI dự đoán số phạt góc: Poisson cho corner kicks
Mô hình AI dự đoán số phạt góc: Poisson cho corner kicks
Phạt góc là sự kiện model hóa được
Số phạt góc trong một trận bóng đá có 3 đặc tính:
- Rời rạc, đếm được: 0, 1, 2, 3… lần
- Tần suất ổn định: Top 5 giải châu Âu trung bình 10-11 góc/trận (5.5 đội nhà + 4.5 đội khách)
- Tương đối độc lập: 2 quả góc liên tiếp do cùng pha tấn công có tương quan, nhưng nhìn tổng 90 phút thì gần như Poisson
Vì 3 điểm này, phân phối Poisson là lựa chọn tự nhiên để model số phạt góc, giống như cho bàn thắng nhưng λ cao hơn (~5 thay vì ~1.5).
Phân phối Poisson cho corners
Gọi C_h, C_a là số phạt góc đội nhà và đội khách. Giả định Poisson độc lập:
P(C_h = i) = (λ_ch^i * e^(-λ_ch)) / i!
P(C_a = j) = (λ_ca^j * e^(-λ_ca)) / j!
Tổng số phạt góc trận: C_total = C_h + C_a. Vì tổng hai biến Poisson độc lập cũng là Poisson:
C_total ~ Poisson(λ_ch + λ_ca)
Đây là tính chất rất tiện: chỉ cần ước lượng λ tổng là tính được mọi xác suất P(C_total ≥ k), P(C_total ≤ k), P(C_total = k).
xC (Expected Corners) khái niệm
Tương tự xG cho bàn thắng, xC (Expected Corners) ước lượng số phạt góc một đội “đáng lẽ” tạo ra dựa trên chất lượng tấn công. Các input phổ biến:
- Số đường tạt cánh (crosses)
- Số cú sút bị block ở rìa vòng cấm
- Số pha cầm bóng ở 1/3 cuối sân
- Áp lực phòng ngự đối thủ (PPDA)
Mô hình hồi quy (XGBoost hoặc Poisson regression) học từ dữ liệu shot-by-shot và touch-by-touch để map các input này về kỳ vọng số góc tạo ra.
xC ổn định hơn số góc thô vì giảm nhiễu từ chiến thuật phòng ngự đối thủ trong trận đơn lẻ.
Ước lượng λ cho mô hình AI
Cách traditional:
λ_ch = corners_for_home_avg * corners_against_away_avg / corners_league_avg
λ_ca = corners_for_away_avg * corners_against_home_avg / corners_league_avg
Cách AI hiện đại:
λ_ch = xC_home_for * xCA_away * H_corner
λ_ca = xC_away_for * xCA_home
Với H_corner là hệ số sân nhà cho phạt góc, thường 1.1-1.2 (thấp hơn hệ số sân nhà cho bàn thắng).
Case thực tế
Giả định trận Bayern Munich vs Dortmund:
- Bayern: xC_for = 6.5, xCA = 3.5
- Dortmund: xC_for = 5.8, xCA = 4.8
- H_corner = 1.15
Tính:
- λ_ch = 6.5 * 4.8 / 5.0 * 1.15 ≈ 7.18 (giả định corners_league_avg = 5.0)
- λ_ca = 5.8 * 3.5 / 5.0 ≈ 4.06
- λ_total = 11.24
P(Over 10.5 corners) = P(Poisson(11.24) ≥ 11) ≈ 0.59 P(Over 11.5 corners) ≈ 0.48 P(Over 9.5 corners) ≈ 0.71
Hiệu chỉnh và calibration
Brier score
Brier score đo độ chính xác xác suất:
Brier = (1/N) * Σ (p_pred - y_actual)^2
Với p_pred là xác suất mô hình dự đoán, y_actual ∈ {0, 1} là kết quả thực tế (1 nếu Over, 0 nếu Under).
Mô hình phạt góc tốt có Brier score 0.20-0.22 trên top 5 giải. Mô hình ngẫu nhiên (p = 0.5 mọi trận) có Brier = 0.25. Mô hình hoàn hảo có Brier = 0.
Reliability diagram
Vẽ biểu đồ độ tin cậy: trục x là xác suất mô hình dự đoán, trục y là tần suất thực tế. Đường lý tưởng là y = x. Mô hình tốt thì các điểm bám sát đường này.
Mô hình corner thường bị overconfidence ở vùng xác suất cao (predict 80% nhưng thực tế chỉ trúng 72%). Hiệu chỉnh bằng Platt scaling hoặc isotonic regression.
Hạn chế của Poisson cho corners
- Tương quan với chiến thuật: Đội đang dẫn 1-0 phút 80 sẽ phòng ngự, đối thủ tấn công ép → góc dồn về cuối trận, không đều như giả định Poisson.
- Thẻ đỏ: 11v10 thay đổi đáng kể tốc độ tạo góc. Mô hình AI cần input live nếu predict in-play.
- Phong cách HLV: Một số HLV (Klopp, Guardiola) chủ động tăng số góc qua pressing cao. Cần feature riêng cho HLV.
- Sân và thời tiết: Sân hẹp, mưa nhiều → ít tạt cánh → ít góc. Hiếm thấy mô hình nào tính tới feature này.
Validation trên dữ liệu lịch sử
Backtest 3 mùa Premier League + La Liga + Bundesliga:
- Hit rate Over/Under (line phổ biến nhất): 53-55%
- Brier score: 0.215
- ROI giả định break-even line 1.90: -0.2% đến +1.5%
Mô hình corners khó tạo edge lớn vì sample size góc nhỏ hơn bàn thắng (10 sự kiện thay vì 2-3, nhưng variance cao hơn).
FAQ ngắn
Bao nhiêu trận cần để ước lượng xC ổn định? Tối thiểu 10 trận, lý tưởng 15-20 trận. Đầu mùa sai số lớn vì sample chưa đủ.
Có nên dùng phạt góc nửa hiệp riêng? Có. λ hiệp 1 ≈ 40% λ tổng (đội còn sung sức, ít cầm bóng phòng ngự). Hiệp 2 nhiều góc hơn vì đội thua dồn ép.
Tỉ lệ góc đội nhà so với khách trung bình? Khoảng 55/45. Hệ số sân nhà cho góc nhỏ hơn cho bàn thắng.
👉 Xem lịch thi đấu & kèo cụ thể: bongda369.com
Trang liên kết
Partners