一、自主機器人的系統(tǒng)組成
1、視覺系統(tǒng)
負責(zé)感知球場上的態(tài)勢,視覺系統(tǒng)獲得球場上的實時圖像,對圖像進行顏色分割,識別出球場上的各個目標,然后進行距離校正,將結(jié)果發(fā)給決策程序。
2、決策系統(tǒng)
接收視覺系統(tǒng)的辨識結(jié)果,對球場態(tài)勢進行分析,然后做出合理決策,將命令發(fā)送給底層控制系統(tǒng)。
3、底層控制系統(tǒng)
通過串口接收上位機的命令,控制各輪走行電機按照指定速度運行,控制彈射和持球電機,將底層傳感器的數(shù)據(jù)通過串口發(fā)送給上位機 。
4、通信系統(tǒng)
通過無線網(wǎng)絡(luò)聯(lián)系場內(nèi)機器人和場外計算機,進行遙控測試,參數(shù)設(shè)置等操作以及控制比賽的開始和終止。
二、自主機器人如何實現(xiàn)學(xué)習(xí)
絕大多數(shù)的基于行為的實現(xiàn)方法都是對不同的任務(wù)進行手工編程的,這需要編程人員能充分地考慮到各種可能出現(xiàn)的情況,對機器人與環(huán)境之間的交互有充分的理解,雖然有些設(shè)計出的系統(tǒng)對于很多任務(wù)和環(huán)境而言性能都是魯棒的,但系統(tǒng)對環(huán)境并不具有適應(yīng)性。
人不能窮盡一切可能。機器人能否通過學(xué)習(xí)獲得不能由程序員手工編碼進去的知識,比如構(gòu)建一個未知環(huán)境的地圖,在任何環(huán)境的性質(zhì)隨時間變化的任務(wù)中都是必要的。
當機器人元件老化后,機器人的傳感器和執(zhí)行機構(gòu)的性質(zhì)是可能會發(fā)生改變的。
機器人在多機器人的環(huán)境中執(zhí)行,由于需要對其他機器人作出反應(yīng),它的策略是需要改變的。學(xué)習(xí)方法在這些情況下都能發(fā)揮重要的作用。用學(xué)習(xí)方法為機器人進行編程,而無須告訴它怎樣達到它的目標,只要告訴它目標是什么,讓它通過學(xué)習(xí)去滿足這個目標,無疑,這種方法具有很大的吸引力。它是提高機器人的適應(yīng)性,降低編程人員編程強度的必由之路。
分類
機器人有不同層次的行為,它們由不同層次的信息表達所決定,因此就存在著不同類型的學(xué)習(xí)。Broo ks和Mataric總結(jié)出了以下類型的學(xué)習(xí):
1、為傳感設(shè)備標定或則參數(shù)調(diào)節(jié)進行學(xué)習(xí)。這種類型的學(xué)習(xí)只在一個特定行為結(jié)構(gòu)中優(yōu)化操作參數(shù)。
2、學(xué)習(xí)真實世界的知識。這種類型的學(xué)習(xí)構(gòu)建與修改機器人對于真實世界的內(nèi)部表達,以利于機器人作出行為規(guī)劃和決策等高層的智能行為。
3、學(xué)習(xí)已有行為的協(xié)調(diào)。這種類型的學(xué)習(xí)中通過協(xié)調(diào)已經(jīng)存在的行為被觸發(fā)和被執(zhí)行的順序來改變它們對世界的作用。
4、學(xué)習(xí)新的行為。這種類型的學(xué)習(xí)建立新的行為結(jié)構(gòu)。
實際問題
機器人領(lǐng)域?qū)θ魏螌W(xué)習(xí)算法而言都是一個挑戰(zhàn)。在構(gòu)建擁有學(xué)習(xí)能力,能自動進行知識獲取的自主機器人的過程中必須面對許多煩瑣的有關(guān)真實世界的問題。
1、傳感器噪聲。大多數(shù)機器人的傳感器是不可靠的。于是由傳感器信號得到的狀態(tài)描述注定是不精確的。學(xué)習(xí)算法必須能夠處理噪聲,因此經(jīng)常需要用統(tǒng)計平滑技術(shù)克服噪音的影響。
算法的易駕馭性。機器人必須對不可預(yù)見的環(huán)境進行實時響應(yīng)。因此學(xué)習(xí)算法必須不能過于復(fù)雜,算法的每一次迭代都必須能實時地完成。
2、增量式的算法。學(xué)習(xí)算法必須允許機器人邊學(xué)習(xí)邊改善自己的性能。因為機器人必須一邊收集經(jīng)驗一邊進行學(xué)習(xí). 形成經(jīng)驗的數(shù)據(jù)不能離線獲得。
3、有限的訓(xùn)練時間。機器人的訓(xùn)練時間是非常有限的。學(xué)習(xí)算法必須在合理的運算次數(shù)中收斂,因為機器人需要完成任務(wù),在真實的機器人上進行上百萬次的動作是極為困難的。
堅實的信息來源。 所有機器人可以獲得的信息都必須最終來至從它的傳感器抽取得到的信息或初始狀態(tài)時強行編碼進去的知識。由于狀態(tài)信息是由傳感器數(shù)據(jù)計算得到的,學(xué)習(xí)算法必須能和感知設(shè)備的限制一起工作.明顯地,能否解決以上提出的一些問題決定了用在真實機器人上的學(xué)習(xí)算法的成功與否。
學(xué)習(xí)方法
在機器人研究領(lǐng)域中有三種主要的學(xué)習(xí)方法變得越來越流行。它們是強化學(xué)習(xí)( RL) ,進化方法( GA和EP)和基于人工神經(jīng)網(wǎng)絡(luò)( ANN )的方法。其中應(yīng)用得最為廣泛的方法是強化學(xué)習(xí)方法.在學(xué)習(xí)新的行為和學(xué)習(xí)協(xié)調(diào)已經(jīng)存在的行為兩種情況下都可以用到強化學(xué)習(xí)的方法。 強化方法是一種無監(jiān)督的學(xué)習(xí)算法,它比較好地符合人們解決問題的心理習(xí)慣,和傳統(tǒng)人工智能以及優(yōu)化算法聯(lián)系緊密,有普遍適的用性,因此獲得了最廣泛的關(guān)注。
聲明:以上方法源于程序系統(tǒng)索引或網(wǎng)民分享提供,僅供您參考使用,不代表本網(wǎng)站的研究觀點,證明有效,請注意甄別內(nèi)容來源的真實性和權(quán)威性。申請刪除>> 糾錯>>