Profile cover photo
Profile photo
Alan Tsai
28 followers
28 followers
About
Posts

Post has attachment
最近忙到留一堆待補文章要寫....

要學習一個語言要從最底層的language paradigm(語言特性)和data type(資料形態)看起。
這篇來看一下R的語言基礎。
Add a comment...

Post has attachment
上篇了解了R的歷史和準備好開發環境之後
在這篇將來看看我個人認為是R的Hello World,用quantmod R套件做股票分析,了解R在繪圖,資料分析上面的便利
Add a comment...

Post has attachment
有了好的問題了之後,接下來就是收集資料、處理資料、分析資料和視覺化資料
不過要用什麼來處理、分析和視覺化資料呢?
這篇介紹幾種可能的處理方式,和接下來會使用的R的歷史介紹,用Visual Studio或者RStudio作為開發的IDE的設定。
Add a comment...

Post has attachment
上篇了解了整個的Data Process Workflow
整篇將會先從最重要的一環開始,定義一個好問題。
定義一個好的問題非常重要,不止接下來的階段都會相依它,有任何疑惑都可以回去看要解決的問題
一個好的問題,應該要在資料範圍、預測內容、可接受的準確度、整個使用情境及做法都要定義到
Add a comment...

Post has attachment
如果說,Big Data的儲存和運算同等於武林高手的內功的話
那麼Data應用就是武林高手的招式。
要成為武林高手,兩者缺一不可。
上篇總結了Big Data的運算和儲存的Hadoop之後
接下來要開始介紹Data應用的部分 - 這篇是整個概觀介紹
Add a comment...

Post has attachment
上篇看完Hadoop的Ecosystem
這篇將介紹包括這些package變成一個套裝軟體的Hadoop Distribution,並且以此為這個階段的Hadoop做一個結束
接下來要進入Data的處理、了解和最後變成預測模型的階段
Add a comment...

Post has attachment
上篇介紹完了Hadoop Streaming和.Net Core的搭配之後,Hadoop系列也到了一個尾聲
這篇先介紹Hadoop的Ecosystem,然後下篇在以Hadoop Distribution作為結束
Add a comment...

Post has attachment
Add a comment...

Post has attachment
上篇看完了fully distributed mode之後,整個hadoop還剩下一個部分還沒介紹 - 到底什麼是MapReduce?
這篇介紹MapReduce的概念,並且看看如何用java寫一個map reduce
Add a comment...

Post has attachment
上篇更深入一些了解了YARN和HDFS了之後,在這篇在回到測試Hadoop的部分,這次把pseudo-distributed mode 改成 fully-distributed mode
調整目前的master然後複製一份出來做出cluster - 總共會有一個master和兩個slave(master本身也是slave)
Add a comment...
Wait while more posts are being loaded