作者:李覺白/有勁生物科技

 

人工智慧(Artificial Intelligence, AI)早在1950年代就被提出;隨著時間的演進,於1980年又衍伸出機器學習(machine learning)這塊領域,但礙於早期電腦及演算法上的效能與限制,能被應用解決的問題始終相當有限。近兩年因為AlphaGo在圍棋上不斷擊敗人類棋王,AI技術再次被人們討論並掀起熱潮。

 

對於想接觸人工智慧、機器學習或近十年出現的新領域─深度學習的人來說,線上有相當多資源可供使用及參考。今天筆者將介紹其中一個數據科學的網路社群平台,任何人皆可在其網頁上直接進行人工智慧相關的數據分析與社群討論。

 

此平台名為Kaggle1,2010年由Anthony Goldbloom於墨爾本創立,搬遷到舊金山之後開始崛起,開疆闢土;2017年時被Google收購。Kaggle早期因與各領域的公司單位合作舉辦數據分析競賽而出名;競賽的舉辦由與其合作的公司或單位來定義想解決的問題並提供相關數據資料,然後開放給各路好手建立解決問題的預測模型。舉例來說,2017年Kaggle與博思艾倫資訊科技顧問公司合辦一個「對抗肺癌」的競賽 (Data Science Bowl 2017),參與者將低劑量電腦斷層掃描的使用結果資料,運用機器學習來建立<預測病人是否罹患肺癌>的模型;此次競賽的獎金總金額高達100萬美金,吸引了近萬名資料科學家競爭角逐。而今年2018年,Kaggle、博思艾倫及麻省理工的Broad institute再度舉辦獎金總額10萬美金的<從不同條件的生物醫學影像下辨識細胞核>競賽 (Data Science Bowl 2018),目標是為了加速藥物的開發。

 

Kaggle的數據競賽曾被美國大西洋雜誌評論:「將會掀起超高效就業市場(hyper-efficient job markets)」2。Kaggle競賽的參與者皆超過數萬人次,每位參賽者的參賽紀錄都會有一個自己的積分排名。Kaggle集結了一群世界上最聰明的數據科學家,旗下的Kaggle Connect服務則會針對特殊技能數據科學家與需要解決特定問題的公司進行媒合,為公司找到最合適的人才,也為人才找到最適任的職場。

 

除了數據建模競賽,Kaggle也提供名為Kernels的線上程式開發測試環境。Kernels提供的R及Python開發環境,利用內建的常用相關函式庫讓使用者可以在Kernels網頁上直接讀取Kaggle內建的資料集,並直接在上面撰寫解決問題的程式建立模型。使用者也可以讀取Kaggle中其他使用者所提供的開放程式碼來進行建模問題的測試。想進一步了解Kernels的讀者可前往Kaggle Kernels的「鐵達尼號教學網址(https://www.kaggle.com/c/titanic#tutorials)」學習;教學網中提供了鐵達尼號乘客的艙等、性別、年齡、船票費用與實際存活結果等資料,教學內容則包括如何使用R進行Random Forest(隨機森林)方法來預測鐵達尼號乘客的存活機會。

 

總言之,對於想接觸人工智慧、機器學習等建模預測領域的人來說,Kaggle為大家整合各式各樣的資料數據集,提供了練習以及與同領域高手交流切磋的方便好平台。

 

 

參考文獻

1. Kaggle Inc. (2018) The Home of Data Science & Machine Learning: Kaggle helps you learn, work, and play. Kaggle Website.

https://www.kaggle.com/

2. Goetz, Thomas (2013, Apr 12). How Kaggle Is Changing How We Work: Like it or not, hyper-efficient job markets are on their way. The Atlantic Daily. Retrieved from

https://www.theatlantic.com/technology/archive/2013/04/how-kaggle-is-changing-how-we-work/274908/

 

 

官網用CC創用_SA.png

arrow
arrow
    創作者介紹
    創作者 TIGS 的頭像
    TIGS

    有勁的基因資訊

    TIGS 發表在 痞客邦 留言(0) 人氣()