Kaggle 數據科學競賽

Kaggle 資料科學競賽位於資料科學和機器學習挑戰的前沿,提供了一個平台,參賽者在這裡解決由組織和研究人員提出的實際問題。這些競賽涵蓋了預測分析、電腦視覺、自然語言處理和時間序列預測等領域。
想要挑戰這項比賽?
Kaggle Competitions

競賽訊息

全球學生
參賽資格
免費
參賽費用
不定,取決於具體競賽
提交截止日期

競賽細節

1. 競賽類別

  • 特色競賽:這些是 Kaggle 的標誌性挑戰,提供豐厚的現金獎品,解決複雜的、商業驅動的預測問題。典型例子包括 Allstate 索賠預測挑戰、Jigsaw 有毒評論分類挑戰和 Zillow 獎。它們吸引了頂級專家,但仍然對所有人開放,促進了透過與同行學習來提陞技能。
  • 研究競賽:這些競賽實驗性強,通常沒有明確的解決方案,專注於推進影像辨識或大規模文字分類等專業領域。過去的挑戰包括 Google 地標檢索挑戰和右鯨辨識挑戰。這些競賽通常不提供獎品,適合進行實驗性探索。
  • 入門競賽:為初學者量身定制,這些長期存在的挑戰具有教程問題,幫助新手學習。例如 Titanic: 機器學習災難預測和房屋價格:高級回歸技術。這些競賽有滾動的排行榜,確保新用戶有一個新的競爭環境。

2. 競賽格式

簡單競賽:

  • 遵循標準格式,參賽者在接受規則後下載資料集。競爭者在本地或 Notebooks 中建立模型,並上傳預測作為提交。
  • 範例:Porto Seguro 安全駕駛員預測。

兩階段競賽:

  • 分為第一階段和第二階段,第二階段提供新的測試資料集。參加第二階段需要參加第一階段。
  • 例:自然保護基金會漁業監控。

程式碼競賽:

  • 所有提交都直接從 Kaggle Notebooks 提交,確保硬體資源平等。由於平台對運算資源如運行時間、記憶體和外部資料使用的限制,模型較為簡單。
  • 例:Quora 不真誠問題分類。

3. 資源

更多資源可以在這裡找到。

團隊組建

1. 團隊成員和角色

  • 團隊負責人:團隊的主要聯絡人,具有額外權限,例如更改團隊領導。
  • 成員:團隊中的其他所有參與者。團隊負責人可以將領導職務重新分配給其他成員。

2. 關鍵團隊操作

  • 更改團隊名稱:任何團隊成員都可以透過團隊標籤更新團隊的自訂名稱,該名稱會顯示在排行榜上。
  • 合併團隊(需要團隊負責人批准):如果滿足以下條件,團隊可以合併:(1) 競賽的團隊合併截止日期尚未過,(2) 合併後的團隊人數不超過最大團隊人數限制,(3) 其合併後的每日提交數量符合提交限制。
  • 解散團隊:只有在團隊沒有進行任何提交的情況下,才能解散團隊。

3. 注意事項

  • 提交限制:團隊人數不會增加每日提交數量限制。
  • 合作優勢:加入團隊有助於向他人學習、結合不同方法並提升成果。
    諮詢備賽課程

如何參賽

1. 尋找競賽

  • 查看競賽列表,查看所有正在進行的競賽。
  • 公開競賽可以搜索,私密競賽需要共享唯一的連結才能訪問。

2. 造訪競賽首頁

點擊競賽查看其主頁。關鍵部分包括:

  • 規則:包含參與競賽的強制性規則。接受規則後才能下載資料或提交作品。
  • 概覽:包括:
    描述:解釋競賽的目標和贊助方的目的。
    資料:提供用於建立和評估模型的訓練集和測試集資料存取。
    評估:詳細說明提交的格式和評估方式(例如,排名指標)。
    時間表:列出重要的截止日期,如規則接受和提交截止日期。
    獎品:如果適用,概述獎勵(現金、紀念品、積分等)。

3. 參與

  • 透過點擊「加入」並接受規則(適用於公開競賽)來加入。
  • 對於私密競賽,存取需要主辦方提供的連結。

4. 關鍵提示

  • 始終閱讀並遵守規則,以避免被取消資格或受到處罰。
  • 使用論壇來澄清疑問或尋求社群協助。
  • 注意截止日期,確保能順利參與。

提交指南

要參與 Kaggle 競賽,提交你的模型預測是必不可少的。你的提交將根據競賽的評分方式進行評估,並將決定你在排行榜上的排名。

1. 排行榜類型

  • 公開排行榜:根據測驗資料的一個子集顯示提交得分。競賽期間一直可見。
  • 私密排行榜:根據剩餘的測試數據追蹤效能,並在競賽結束後確定最終排名。注意避免過擬合:在公開排行榜上表現良好的模型,在私密排行榜上的表現可能不一樣。
  • 平手打破規則:如果得分完全相同,提交較早的團隊將獲勝。

2. 提交限制

  • 團隊每天有提交數量限制(通常為5次,但具體根據競賽而定)。提交次數超過限制不會增加獲勝機會,反而可能浪費資源。

3. 提交預測

透過上傳文件提交:

  • 大多數競賽允許透過上傳「提交文件」來提交預測。
  • 提交步驟:點選競賽頁面上的「提交預測」。然後,在提示時上傳預測檔。一旦處理完成,你的提交將出現在「我的提交」下。
  • 如果文件處理失敗,則不會計入提交,也不會影響每日提交限制。

透過 Notebooks 提交:

  • 一些競賽允許直接透過 Kaggle Notebooks 提交。
  • 從 Notebook 提交的步驟:
    建立一個新的 Notebook,並將競賽資料集作為資料來源。
    在 Notebook 中建立並測試模型。
    產生並儲存提交文件。
    點擊「儲存並運行所有」以完成 Notebook。
    成功運行後,前往 Notebook 查看頁面提交文件。

4. 選擇最終提交

在競賽結束前,你可以選擇哪些提交進行評分。如果沒有選擇,平台將自動選擇在公開排行榜上表現最佳的提交。

與睿雅一起,踏上學術提升之旅!

返回頂端