Kaggle Competitions

Các cuộc thi Kaggle là những cuộc thi hàng đầu trong chủ đề về thách thức về khoa học dữ liệu và học máy, cung cấp một sân chơi nơi các thí sinh giải quyết các vấn đề thực tế do các tổ chức và nhà nghiên cứu đưa ra. Các cuộc thi này bao gồm từ phân tích dự đoán và nhận dạng hình ảnh máy tính đến xử lý ngôn ngữ tự nhiên và dự báo chuỗi thời gian.
Bạn có đang quan tâm đến cuộc thi?
Kaggle Competitions

Tổng quan về cuộc thi

Thí sinh từ tất cả mọi nơi trên thế giới
Điều kiện tham gia
Miễn phí
Phí dự thi
Tùy thuộc vào cuộc thi bạn tham gia sẽ có các mức phí khác nhau
Hạn nộp bài

Chi tiết về cuộc thi

1. Hạng mục thi đấu

  • Các Cuộc Thi Nổi Bật: Đây là những thử thách đặc trưng của Kaggle, cung cấp các giải thưởng tiền mặt lớn và giải quyết các vấn đề dự đoán phức tạp, mang tính thương mại. Những ví dụ nổi bật bao gồm Thử Thách Dự Đoán Yêu Cầu Bảo Hiểm Allstate, Thử Thách Phân Loại Bình Luận Độc Hại Jigsaw và Giải Thưởng Zillow. Chúng thu hút các chuyên gia hàng đầu trong lĩnh vực khoa học máy tính tham gia nhưng vẫn mở rộng cho tất cả mọi người, khuyến khích việc phát triển kỹ năng thông qua việc học hỏi từ những người bạn cùng tham gia.
  • Cuộc Thi Nghiên Cứu: Các vấn đề này mang tính thử nghiệm và chuyên ngành, thường không có giải pháp rõ ràng và tập trung vào việc phát triển các lĩnh vực chuyên sâu như nhận dạng hình ảnh hoặc phân loại văn bản quy mô lớn. Các thử thách trước đây bao gồm Thử Thách Tìm Kiếm Cảnh Quan Google và Nhận Dạng Cá Hỏa Tiễn Right Whale. Những cuộc thi này thường không có giải thưởng, khiến chúng trở thành lựa chọn lý tưởng cho việc khám phá thử nghiệm.
  • Cuộc Thi Dành Cho Người Mới Bắt Đầu: Được thiết kế dành riêng cho người mới, các thử thách không vĩnh viễn này gồm các bài toán có hướng dẫn để hỗ trợ cho thí sinh là người mới học khoa học máy tính. Ví dụ bao gồm Titanic: Học Máy từ Thảm Họa và Giá Nhà: Kỹ Thuật Hồi Quy Nâng Cao. Những cuộc thi này có bảng xếp hạng liên tục, đảm bảo môi trường cạnh tranh mới mẻ cho các thí sinh mới.

2. Hình thức thi đấu

Cuộc thi cá nhân:

  • Tuân theo một định dạng tiêu chuẩn, trong đó người tham gia tải xuống bộ dữ liệu sau khi chấp nhận các quy tắc. Các thí sinh xây dựng mô hình trên máy tính của mình hoặc trong Notebooks và tải lên dự đoán dưới dạng bài nộp.
  • Ví dụ: Dự đoán người lái xe an toàn Porto Seguro.

Cuộc thi hai giai đoạn:

  • Cuộc thi chia thành Hai giai đoạn: Giai đoạn 1 và Giai đoạn 2, với một bộ dữ liệu kiểm tra mới được cung cấp trong Giai đoạn 2. Để tham gia Giai đoạn 2, người tham gia cần hoàn thành Giai đoạn 1.
  • Ví dụ: Giám sát Ngành thủy sản của Nature Conservancy.

Cuộc thi Lập trình:

  • Tất cả các bài nộp đều được thực hiện trực tiếp từ Kaggle Notebooks, đảm bảo các điều kiện phần cứng công bằng cho tất cả người tham gia. Các mô hình đơn giản hơn do các giới hạn về tính toán được áp đặt bởi nền tảng, chẳng hạn như thời gian chạy, bộ nhớ và việc sử dụng dữ liệu bên ngoài.
  • Ví dụ: Phân loại câu hỏi thiếu chân thành trên Quora.

3. Thông tin tham khảo

Bạn có thể tìm thêm tài liệu để bắt đầu tại đây.

Thành lập đội thi

1. Thành viên và vai trò

  • Trưởng nhóm: Người liên lạc chính của nhóm. Có quyền hạn bổ sung, như thay đổi người lãnh đạo nhóm.
  • Thành viên: Tất cả các người tham gia khác trong nhóm. Trưởng nhóm có thể chuyển giao quyền lãnh đạo cho một thành viên khác.

2. Các hoạt động quan trọng của nhóm

  • Thay đổi tên nhóm: Bất kỳ thành viên nào trong nhóm cũng có thể cập nhật tên nhóm tùy chỉnh qua tab Nhóm. Tên này sẽ xuất hiện trên bảng xếp hạng.
  • Ghép nhóm (yêu cầu sự chấp thuận của trưởng nhóm): Các nhóm có thể gộp lại nếu (1) thời gian giới hạn ghép nhóm của cuộc thi chưa kết thúc, (2) số lượng thành viên của nhóm ghép không vượt quá giới hạn kích thước nhóm tối đa, và (3) tổng số lượt nộp hàng ngày của các nhóm ghép tuân thủ giới hạn nộp bài.
  • Tan rã nhóm: Các nhóm chỉ có thể tan rã nếu chưa có bài nộp nào được thực hiện.

3. Lưu ý

  • Giới hạn bài nộp: số lượng thành viên trong nhóm nhóm không làm tăng giới hạn bài nộp hàng ngày.
  • Lợi ích của việc hợp tác: Tham gia một nhóm giúp bạn học hỏi từ người khác, kết hợp các phương pháp và cải thiện kết quả.

Làm thế nào để đăng ký tham gia

1. Tìm kiếm các cuộc thi

  • Xem danh sách các cuộc thi để xem tất cả các cuộc thi đang diễn ra.
  • Các cuộc thi công khai có thể tìm kiếm được, trong khi các cuộc thi riêng tư yêu cầu một URL duy nhất được chia sẻ.

2. Truy cập Trang chủ Cuộc thi

Nhấn vào một cuộc thi để xem trang chủ của nó. Các phần chính bao gồm:

  • Quy định: Chứa các quy tắc bắt buộc để tham gia. Việc chấp nhận các quy tắc là điều kiện để tải dữ liệu hoặc gửi bài dự thi.
  • Tổng quan: Bao gồm:
    Mô tả: Giải thích mục tiêu của cuộc thi và mục đích của nhà tài trợ.
    Dữ liệu: Cung cấp quyền truy cập vào bộ dữ liệu huấn luyện và kiểm tra để xây dựng và đánh giá mô hình.
    Đánh giá: Chi tiết cách thức bài dự thi được định dạng và đánh giá (ví dụ: các chỉ số xếp hạng).
    Lịch trình: Liệt kê các thời hạn quan trọng, chẳng hạn như thời gian chấp nhận quy tắc và thời gian nộp bài.
    Giải thưởng: Liệt kê các phần thưởng (tiền thưởng, quà tặng, điểm xếp hạng, v.v.) nếu có.

3. Hưóng dẫn tham gia

  • Tham gia bằng cách nhấp vào “Join” và chấp nhận các quy tắc (đối với các cuộc thi công khai).
  • Đối với các cuộc thi riêng tư, quyền truy cập yêu cầu liên kết do người tổ chức cung cấp.

4. Mẹo hữu ích

  • Luôn đọc và tuân thủ các quy định để tránh bị loại hoặc chịu hình phạt.
  • Sử dụng diễn đàn để làm rõ các thắc mắc hoặc tìm kiếm sự trợ giúp từ cộng đồng.
  • Hãy chú ý đến các hạn nộp bài dự thi để đảm bảo tham gia đầy đủ.

Hướng dẫn nộp bài

Để tham gia vào các cuộc thi Kaggle, việc nộp dự đoán mô hình của bạn là điều cần thiết. Mỗi lần nộp dự đoán sẽ được đánh giá dựa trên phương pháp chấm điểm của cuộc thi và sẽ đưa bạn lên bảng xếp hạng.

1. Các loại bảng xếp hạng

  • Bảng xếp hạng công khai: Hiển thị điểm số của các bài nộp dựa trên một phần dữ liệu kiểm tra. Hiển thị suốt quá trình thi đấu.
  • Bảng xếp hạng riêng tư: Theo dõi hiệu suất dựa trên phần dữ liệu kiểm tra còn lại và xác định thứ hạng cuối cùng sau khi cuộc thi kết thúc. Cần thận trọng với hiện tượng overfitting: các mô hình có hiệu suất tốt trên bảng xếp hạng công khai có thể không đạt kết quả tương tự trên bảng xếp hạng riêng tư.
  • Quy tắc phân định thắng thua: Nếu có sự hòa điểm chính xác, đội nộp bài sớm hơn sẽ chiến thắng.

2. Giới hạn nộp bài

  • Các đội có giới hạn nộp bài hàng ngày (thường là 5, nhưng có thể thay đổi tùy theo cuộc thi). Nộp bài nhiều hơn giới hạn không làm tăng cơ hội chiến thắng và có thể là lãng phí tài nguyên.

3. Nộp dự đoán

Bằng cách tải lên tệp tin:

  • Hầu hết các cuộc thi cho phép bạn nộp dự đoán bằng cách tải lên một “tệp nộp bài.”
  • Để nộp bài: Nhấn vào “Submit Predictions” trên trang cuộc thi. Sau đó, tải lên tệp dự đoán khi được yêu cầu. Khi bài nộp được xử lý, nó sẽ xuất hiện dưới mục “My Submisions”.
  • Nếu tệp không được xử lý thành công, nó sẽ không được tính và cũng không ảnh hưởng đến giới hạn nộp bài hàng ngày của bạn.

Bằng cách tải lên từ Notebook:

  • Một số cuộc thi cho phép nộp bài trực tiếp từ Kaggle Notebooks.
  • Các bước để nộp bài từ một Notebook:
    Tạo một Notebook mới với bộ dữ liệu của cuộc thi làm nguồn dữ liệu.
    Xây dựng và kiểm tra mô hình của bạn trong Notebook.
    Tạo và lưu tệp nộp bài của bạn.
    Nhấn “Save & Run All” để hoàn tất notebook.
    Sau khi chạy thành công, chuyển đến trang Notebook Viewer để nộp tệp của bạn.

4. Chọn bài nộp cuối cùng

Bạn có thể chọn bài nộp nào để được chấm điểm trước khi cuộc thi kết thúc. Nếu không chọn bài nộp nào, nền tảng sẽ tự động chọn bài nộp có hiệu suất cao nhất trên bảng xếp hạng công khai.

Tham gia khóa luyện thi ngay!

Scroll to Top