資料載入處理中...
圖書館首頁
|
網站地圖
|
首頁
|
本站說明
|
聯絡我們
|
相關資源
|
台聯大論文系統
|
操作說明
|
English
簡易查詢
進階查詢
論文瀏覽
熱門排行
我的研究室
上傳論文
新版博碩士論文系統
建檔說明
常見問題
帳號:guest(216.73.216.146)
離開系統
字體大小:
詳目顯示
第 1 筆 / 共 1 筆
/1
頁
以作者查詢圖書館館藏
、
以作者查詢臺灣博碩士論文系統
、
以作者查詢全國書目
論文基本資料
摘要
外文摘要
論文目次
參考文獻
電子全文
作者(中文):
曾淯湞
作者(外文):
Tseng, Yu-Chen
論文名稱(中文):
集成學習與深度學習在系外行星研究的應用
論文名稱(外文):
The Applications of Ensemble Learning and Deep Learning on the Exoplanet Researches
指導教授(中文):
葉麗琴
指導教授(外文):
Yeh, Li-Chin
口試委員(中文):
江瑛貴
陳賢修
口試委員(外文):
Jiang, Ing-Guey
Chen, Shyan-Shiou
學位類別:
碩士
校院名稱:
國立清華大學
系所名稱:
計算與建模科學研究所
學號:
111026507
出版年(民國):
113
畢業學年度:
112
語文別:
英文
論文頁數:
86
中文關鍵詞:
集成學習
、
深度學習
、
凌日法
、
系外行星
、
卷積神經網路
、
人工智慧
、
特徵工程
、
機器學習
外文關鍵詞:
Ensemble Learning
、
Deep Learning
、
TESS
、
Exoplanet
、
Convolutional Neural Network
、
Artificial Intelligence
、
TSfresh
、
Machine Learning
相關次數:
推薦:0
點閱:322
評分:
下載:0
收藏:0
本研究結合了機器學習中的集成學習和深度學習方法,並利用凌星法尋找TESS[6]數據中凌星週期在一到二天的候選系外行星。在模型訓練之前,我們使用了TSfresh特徵工程,並比較了使用Random Forest、Adaboost、XGBoost、LightGBM和CNN模型進行預測的差異。我們將原始光曲線處理成雜訊,並利用凌星模組Mandel&Agol[5]加入凌星訊號,建立了RF、Adab、XGB、LGBM和CNN模型。我們選擇適當的樣本大小,並使用交叉驗證法訓練模型。隨後,我們選擇效能較好的模型進行預測,尋找可能的候選系外行星。最終,我們在研究中發現了4個候選系外行星。
This study combines ensemble learning and deep learning methods in machine learning, integrated with the transit method to identify candidate exoplanets with transit periods ranging from one to two days in TESS[6] data. Prior to model training, we utilized TSfresh feature engineering and compared the predictive performance of Random Forest, Adaboost, XGBoost, LightGBM, and CNN models. We processed the original light curves as noise and incorporated transit signals using the Mandel & Agol [5] transit module, establishing RF, Adab, XGB, LGBM, and CNN models. Optimal sample sizes were selected, and models were trained using cross-validation. Subsequently, we employed the best-performing models for prediction to identify potential candidate exoplanets. Ultimately, our research identified four candidate exoplanets.
Abstract--------------------------------------------------------------3
摘要------------------------------------------------------------------4
致謝------------------------------------------------------------------5
Chapter 1: Introduction-----------------------------------------------6
Chapter 2: Dataset Introduction---------------------------------------9
2.1 Data Sources------------------------------------------------------9
2.2 Data Preparation-------------------------------------------------11
2.3 Data Preprocessing-----------------------------------------------15
2.3.1 Clustering And Standardization--------------------------15
2.3.2 Removing Outliers And Processing Scattered Data Points--19
2.3.3 Data Folding--------------------------------------------22
2.3.4 Interpolation For Imputation---------------------------23
Chapter 3: Feature Engineering---------------------------------------25
3.1 Purpose And Effects Of Feature Engineering-----------------------25
3.2 Using TSfresh For Feature Extraction ----------------------------25
3.3 Specific Feature Engineering Steps And Methods----------------26
Chapter 4: Model Selection-------------------------------------------33
4.1 Development Of Artificial Intelligence---------------------------33
4.2 Introduction And Development Of Machine Learning-----------------34
4.3 Decision Tree----------------------------------------------------36
4.4 Ensemble Learning Methods----------------------------------------37
4.4.1 Random Forest-------------------------------------------42
4.4.2 Adaboost------------------------------------------------43
4.4.3 XGboost(Extreme Gradient Boosting)----------------------46
4.4.4 LightGBM------------------------------------------------48
4.5 Development Of Deep Learning-------------------------------------50
4.6 Convolutional Neural Network---------------------------------51
Chapter 5: Model Selection-------------------------------------------60
5.1 Training、Validation、Testing Set--------------------------------60
5.2 K-Fold Cross-Validation -----------------------------------------61
5.3 Model Evaluation(Random Forest, Adaboost, XGBoost, LightGBM)63
5.4 Model Evaluation(Convolutional Neural Networks)-------------71
Chapter 6: Results and Discussions-----------------------------------75
6.1 RF、XGB、LGBM Model----------------------------------------------76
6.2 Adab、 CNN Model---------------------------------------------79
Chapter 7: Conclutions-----------------------------------------------80
References-----------------------------------------------------------81
Python Code-------------------------------------------------------82~86
[1] Christ, M., et al. (2024). tsfresh documentation (Version 0.20.2.post0.dev4+g3da2360) [Software documentation]. Blue Yonder GmbH. Retrieved from https://tsfresh.readthedocs.io/en/latest/
[2] Huang, C.-S. (2018). 機器學習 Ensemble Learning之Bagging, Boosting與AdaBoost. Medium. Retrieved from https://chih-sheng-huang821.medium.com/機器學習-ensemble-learning之bagging-boosting與adaboost-af031229ebc3
[3] Leo, chiu. (2018). 使用 TensorFlow 了解 Dropout. Medium. Retrieved from https://medium.com/手寫筆記/使用-tensorflow-了解-dropout-bf64a6785431
[4] Malik, A., Moster, B. P., & Obermeier, C. (2021). Exoplanet Detection using Machine Learning. arXiv preprint arXiv:2011.14135. Retrieved from https://arxiv.org/abs/2011.14135
[5] Mandel, K., & Agol, E. (2002). Analytic Light Curves for Planetary Transit
Searches. The Astrophysical Journal, 580(2): L171.
[6] TESS - FFI/TP/LC Bulk Downloads :
https://archive.stsci.edu/tess/bulk_downloads/bulk_downloads_ffi-tp-lc-dv.html.
[7] Yeh, L.-C., & Jiang, I.-G. (2020). Searching for Possible Exoplanet Transits from BRITE Data through a Machine Learning Technique. Publications of the Astronomical Society of the Pacific, 133(1019), 014401.
電子全文
摘要
推文
當script無法執行時可按︰
推文
推薦
當script無法執行時可按︰
推薦
評分
當script無法執行時可按︰
評分
引用網址
當script無法執行時可按︰
引用網址
轉寄
當script無法執行時可按︰
轉寄
top
相關論文
1.
混合式集成系統生物學特徵選取
2.
基於集成學習的電子元件足跡圖樣分析
3.
基於集成學習的非結構化網路威脅情報分析
4.
應用基於遷移學習之卷積神經網路於缺陷分類:比較研究
5.
特徵轉換與特徵過濾法建構之台指期當沖策略
6.
基於集成學習之農業灌溉預測模型
7.
改良動態因子關聯結構於死亡率的估計
8.
基於集成式學習之快速成本估算於航太製造業之應用
9.
以可分離濾波器增進卷積神經網路的效能
10.
基於姿勢感知之深度卷積網路的人臉特徵點偵測
11.
以遞歸卷積神經網路擷取財經新聞知識預測股價
12.
結合語意關鍵詞與卷積神經網路之文本分類研究
13.
應用卷積神經網路於機台振動錯誤診斷
14.
利用基於深度學習之Mask-RCNN於乳房超音波影像腫瘤區塊檢測以及輪廓切割
15.
基於語言模板之分散式表示法於社群媒體主題分類之研究
簡易查詢
|
進階查詢
|
論文瀏覽
|
熱門排行
|
管理/審核者登入
前往新版 [國立清華大學博碩士論文庫]
Go [NTHU Theses & Dissertations Repository]
關閉