一般 ML library with AWS ML 的方便性差異

(只提供繁体中文版本)

Machine Learning – Blog by Kuo

一般 ML library with AWS ML 的方便性差異

scikit-learn

 

今天要使用的是 Python 機器學習套件是 scikit-learn它利用 NumPy、SciPy 與 matplotlib 是 open source 並且可以做商業使用與 AWS ML 比較。

 

今天要分享的是 ML 最簡單的線性迴歸屬於監督是學習。

假設一個我們想要做一個天氣氣溫與冰水銷售程度的關係利用線性迴歸在做預測未來的銷售數據。

 

source code

 

import numpy as np
from sklearn.linear_model import LinearRegression

temperatures = np.array([29, 28, 34, 31, 25, 29, 32, 31, 24, 33, 25, 31, 26, 30])
tea_sales = np.array([77, 62, 93, 84, 59, 64, 80, 75, 58, 91, 51, 73, 65, 84])

lm = LinearRegression()
lm.fit(np.reshape(temperatures, (len(temperatures), 1)), np.reshape(tea_sales, (len(tea_sales), 1)))

# 印出係數
print(lm.coef_) , 約為 3. 73
# 印出截距
print(lm.intercept_ ) 約為 -36.3

 

#預測未來的一個天氣與冰水銷售

# 設定一個新的天氣氣溫
to_be_predicted = np.array([30])
predicted_sales = lm.predict(np.reshape(to_be_predicted, (len(to_be_predicted), 1)))

# 得到預測的冰水銷量
print(predicted_sales)

scikit-learn 使用感想與 AWS ML

scikit-learn 無法單獨對付大量資料通常需要搭配 spark 一起服用才會順利工作。

但是 AWS ML 可以將資料放在 S3 , RDS 並且可以利用 real time api 就可以進行大量的資料處理與預測。AWS ML 可以利用視覺化工具與精靈幫助建立數數學模型不用像 scikit-learn 需要 hard code 才可以做到 ML 的功能。

 

AWS ML 使用大致流程

 

 

 

 

 

 

 

 

 

選擇資料

 

 

 

 

 

 

 

 

 

 

輸入資料

 

 

 

 

 

 

 

 

 

review 設定

 

 

 

 

 

 

 

 

 

 

 

可以做 batch predictions

 

 

Posted in ICG日志.