總網頁瀏覽量

顯示具有 資料科學 標籤的文章。 顯示所有文章
顯示具有 資料科學 標籤的文章。 顯示所有文章

星期三, 7月 29, 2020

8th REJ from UMich MSDS Fall 2020 + 努力上自己的每一天都很充實!

University of Michigan — Ann Arbor, College of LSA
Masters in Data Science

算是一間蠻可惜的學校,但是可能我一開始就不屬於這裡,但至少來過了!
其實我一直對密西根的印象是整個州長得很像是一個手掌,一個外國朋友曾經跟我說過:如果你來自密西根,你只需要比出一個很像high five的手勢,就可以讓別人知道。

這幾個禮拜處於「多工」的狀態,想做的事太多,分身乏術,但還是努力做到最好!

長頸鹿寶寶「麥照」

星期二, 7月 30, 2019

LightGBM explained系列——Gradient-based One-Side Sampling(GOSS)是什麼?

之前有介紹

LightGBM, Light Gradient Boosting Machine

演算法如何使用,那天我突然覺得會使用machine learning的package固然很厲害,但有些時候還是要有一個尋根的心態,所以想帶給大家一個新的系列:
Lightgbm explained系列


如果想更了解LightGBM,可以看我的LightGBM explained系列文


這次是介紹一下,lgb在減少計算成本所用的抽樣演算法 "Gradient-based One-Side Sampling(GOSS)"

中文名稱翻作"梯度單邊抽樣"

星期日, 7月 14, 2019

LightGBM explained系列——Exclusive Feature Bundling(EFB)是什麼?

之前有介紹

LightGBM, Light Gradient Boosting Machine

演算法如何使用,那天我突然覺得會使用machine learning的package固然很厲害,但有些時候還是要有一個尋根的心態,所以想帶給大家一個新的系列:
Lightgbm explained系列


如果想更了解LightGBM,可以看我的LightGBM explained系列文


這次是介紹一下,LightGBM用來降維的演算法 "Exclusive Feature Bundling"
中文名稱翻作"獨立特徵合併"


星期三, 5月 29, 2019

LightGBM explained系列——Histogram-based algorithm是什麼?

之前有介紹

LightGBM, Light Gradient Boosting Machine

演算法如何使用,那天我突然覺得會使用machine learning的package固然很厲害,但有些時候還是要有一個尋根的心態,所以想帶給大家一個新的系列:
Lightgbm explained系列

如果想更了解LightGBM,可以看我的LightGBM explained系列文


這次是介紹一下,LightGBM在決定best split point所用的演算法 "Histogram-based algorithm"
中文名稱翻作"直方圖優化演算法"

星期日, 12月 30, 2018

LightGBM + GridSearchCV 調整參數(調參)feat. Categorical Data處理

其實這篇認真只是想整理給自己看的:SS
先說因為最近在參加一些KAGGLE比賽,看看各位大大們都是用lgb或是xgb來跑,認真研究了一下,整理一下結論,文章出爐啦!!!

如果想更了解LightGBM,可以看我的LightGBM explained系列文


LightGBM(lgb)

https://github.com/Microsoft/LightGBM
準確率不變(與xgb差別不大)的狀況下,


  • 訓練效率更高更快
  • 適用處理大量資料
  • 支援並行學習(我可能要再研究一下)


星期四, 12月 13, 2018

資料探勘(Data Mining) ID3決策樹(Decision Tree)怎麼計算?

資料探勘(Data Mining) ID3決策樹(Decision Tree)怎麼計算?


看到都是類別資料,在R裡面用rpart就可以了!
決策樹是ID3演算法 (好像是澳洲昆士蘭大學一個教授研究出來的)

圖略醜,因為怕有版權問題哈哈ZZ


這堂課是
INTRODUCTION TO DATA SCIENCE AND BIG DATA課堂筆記

星期四, 9月 27, 2018

資料探勘(Data Mining) 概念是什麼?

資料探勘(Data Mining) 概念是什麼?

INTRODUCTION TO DATA SCIENCE AND BIG DATA課堂筆記

Content

1.瞭解分類Classification的概念
2.學習簡單的分類演算法
  • 決策樹
  • 最鄰近法
  • 簡單貝氏分類(機率)
3.認識評估分類模型的方法

星期三, 6月 13, 2018

程式設計 Python OpenCV 影像辨識 PART1

程式設計這堂課

在期末安排了兩堂影像辨識的課,相當精彩以下做一些分享:
本堂課採用的是OpenCV 
https://opencv.org/
因為OpenCV本身從2000年至今,所以資料庫算是比較完整的。其他像是TenserFlow也是不錯的選擇,但以初學者來說可以先學OpenCV。

星期五, 5月 25, 2018

【ACER】2018 Summer Intern 創新技術研發 Research & Development面經

不得不說,ACER在實習面試的流程,真的有用心的感覺!
相對上難度我覺得3.75/5

面試的RD部門給了我很多我以前對RD不瞭解的地方和新的見解。
This summer join us! Become a Part of Our Story
確實有一個story可以跟大家分享

星期四, 5月 24, 2018

大家都想學的Google Analytics(GA),期末前的一些小心得 PART2 完結篇

我後來發現可以採竹塘更新的方式!!!

GA第五堂

GA蜘蛛的排除

https://www.google.com/robots.txt
這叫做蜘蛛(網路網網相連,形成很大蜘蛛網WWW)
出現最多的是allow跟disallow
Google會設置蜘蛛去逛很多網站。
假設搜尋演算法,如果搜尋不到資料,可以按綠色往下箭頭下面的頁面庫存(可以看先前蜘蛛的儲存資料)
User-agent: * 就是蜘蛛,你要同意哪一家蜘蛛進他的網站,*代表歡迎蜘蛛
GA的報表中需不需要保留蜘蛛的流量?不需要的怎麼排除?
GA>管理>資料檢視>查看設定>漫遊器篩選(排除所有來自已知漫遊器和自動尋檢程式的匹配)

星期日, 4月 22, 2018

大家都想學的Google Analytics(GA),期中前的一些小心得 PART1

本文是SCU BDM 網路行銷與搜尋引擎最佳化 課程整理,江宇老師

GA第一堂(補)

每一個網頁都有一個後台的html,上課所用的是學校提供的免費平台,供教育使用。
運用後臺我們可以去設計想呈現的網站,本課呈現的是最陽春的網站,用GA來追蹤

運用到的程式包含

FileZilla Client:用來上更改過的html上傳到學校平台。

Microsoft Office FrontPage 2003:用來編輯網頁。
就可以創造以下的網站了!
http://myweb.scu.edu.tw/~03152138/03152138.htm

GA最重要的就是要有一個"橋樑",橋梁使我們創造一個讓GA追蹤的途徑。
https://developers.google.com/analytics/devguides/collection/analyticsjs/
現在Google已經推出新的橋樑,但我們選擇使用舊的,因為新的使用率還沒有那麼廣泛。

橋梁(重要)

<!-- Google Analytics -->
<script>
(function(i,s,o,g,r,a,m){i['GoogleAnalyticsObject']=r;i[r]=i[r]||function(){
(i[r].q=i[r].q||[]).push(arguments)},i[r].l=1*new Date();a=s.createElement(o),
m=s.getElementsByTagName(o)[0];a.async=1;a.src=g;m.parentNode.insertBefore(a,m)
})(window,document,'script','https://www.google-analytics.com/analytics.js','ga');

ga('create', 'UA-XXXXX-Y', 'auto');
ga('send', 'pageview');
</script>
<!-- End Google Analytics -->

星期五, 4月 06, 2018

AI隨桌大使系列 台灣人工智慧學校執行長 陳昇瑋 「人工智慧民主化在台灣」

今天剛過兒童節,決定要開啟我當AI隨桌大使
「世界公民智庫:人工智慧AI+願景論壇」
聽到一些專家演講的內容概要。
http://www.wisland.org/Web/Main.php?stat=ai_forum
當然希望大家能互相討論、進步、精進,不要有非法用途唷!

第一篇

台灣人工智慧學校執行長 陳昇瑋 先生 

演講關於 人工智慧民主化在台灣


Related Posts Plugin for WordPress, Blogger...