作者(外文):Su, Li-Heng
論文名稱(外文):Robot Arm Grasping Based on Machine Learning and Images
指導教授(外文):Yeh, Ting-Jen
口試委員(外文):Yen, Ping-Lang
Chen, Rong-Shun
外文關鍵詞:machine learningDeep Q Networkrobotic armunderactuated adaptive gripper
本研究以七自由度機械手結合影像與機器學習應用於抓取。傳統上需利用多組方程式描述抓取的動態與模型,進而尋找適當夾取點,然而本研究利用機器學習來找尋最佳夾取點,免除數學模擬與實務上的差距。本系統以機器學習的方式,辨識物品並找出目標物,接著建立目標物在三維空間的位置與姿態之模型,再以物體三維空間資訊做為資料,以強化學習的方式,學習機械手臂最佳的夾取位置與姿態。而本研究所用之機器學習分為三大部分,分別為物體辨識、形心與姿態估測,以及最佳抓取點系統,其中前兩部分採用卷積神經網路(Convolutional Neural Network)做為學習之架構,而最佳抓取點系統使用深度Q網絡(Deep Q Network)決定抓取策略。在機械手臂的部分,本系統使用六自由度的機械手臂加上一自由度的欠致動自適應性夾爪(underactuated adaptive gripper),此自適應性夾爪可針對各式外型物品自動轉換成平行式與張角式夾爪,進行彈性化夾取。
This study uses a 7-DOF robotic arm combined with image and machine learning for grasping. Traditionally, multiple sets of equations are needed to describe the dynamics and models of the grabs, and then to find the appropriate gripping points. This system uses machine learning to find the best gripping points, eliminate the gap between mathematical simulation and practice. First, we use machine learning to identify the object and find the target. Second, the system builds the model of the centroid and posture of the target in three-dimensional space. Finally, the system uses the three-dimensional information of the target as The data to reinforcement learning and learn the best gripping points. The machine learning used in this study is divided into three parts, object identification, centroid and posture estimation, and the best grab point system. The first two parts use the Convolutional Neural Network as the learning framework, and the best grab point system uses the Deep Q Network to determine the grasping strategy. In the part of the hardware, the system uses a 6-DOF robotic arm plus 1-DOF underactuated adaptive gripper, which automatically converts parallel and angled jaws for various types of items for elastic clamping.
第一章 緒論----------------------------------1
1.1 研究動機與目的----------------------------1
1.2 文獻回顧---------------------------------3
1.3 論文簡介---------------------------------6
第二章 硬體設備-------------------------------8
2.1 機械手臂---------------------------------8
2.2 自適應性夾爪-----------------------------10
2.2.1 張角式夾爪-----------------------------11
2.2.2 平行式夾爪-----------------------------12
2.2.3 自適應性夾爪夾取之控制------------------18
第三章 運動學--------------------------------21
3.1 D-H參數法--------------------------------21
3.2 順向運動學-------------------------------23
3.3 逆向運動學-------------------------------24
3.3.1 關節一之逆向運動學----------------------24
3.3.2 關節二之逆向運動學----------------------26
3.3.3 關節三之逆向運動學----------------------27
3.3.4 關節四之逆向運動學----------------------29
3.3.5 關節五之逆向運動學----------------------30
3.3.6 關節六之逆向運動學----------------------31
3.4 模擬結果---------------------------------32
3.4.1 順向運動學模擬結果----------------------32
3.4.2 逆向運動學模擬結果----------------------34
3.5 機械手臂運動控制--------------------------35
第四章 機器學習-------------------------------36
4.1 機器學習介紹------------------------------36
4.1.1 受監督學習法----------------------------37
4.1.2 強化學習--------------------------------37
4.1.3 卷積神經網絡----------------------------39
4.1.4 優化器(Optimizer)----------------------41
4.1.5 批次標準化(Batch Normalization)---------44
4.1.6 物體辨識與框選--------------------------46
4.1.7 形心與姿態估測--------------------------48
4.1.8 最佳抓取點系統--------------------------51
第五章 結論與未來工作--------------------------55
5.1 結論--------------------------------------55
5.2 未來工作----------------------------------56
