工業技術研究院 資訊與通訊研究所 溫逸倫 沈志聖 何旭淜 王丕華 林港喬
前言
全球無人機巡檢市場正處於快速增長階段,根據產業研調資訊,2025 年市場規模已達 15.6 億美元,較 2024 年的 13.48 億美元增長 15.7%,特別是在大型建物外觀巡檢領域,市場增長更為快速,無人機自動化巡檢已成為全球基礎設施維護和檢查領域的重要技術手段,具有廣闊的市場前景。本文將介紹無人機建物巡檢及無人機倉儲巡檢等兩種無人機智慧巡檢服務,以及深入說明無人機巡檢服務搭配使用的AI辨識分析技術,讓我們藉此一窺無人機自動化巡檢的運作樣貌。
精彩內容
1.無人機建物巡檢 2.無人機倉儲巡檢 3.巡檢AI辨識分析 |
無人機巡檢系統架構
無人機自動化巡檢系統,至少由無人機、地面控制站、巡檢資訊管理平台等三項所組成,系統運作由地面控制站監控無人機飛行路徑及任務;無人機於飛行期間以機載感測器將蒐集的即時影像、數據等資訊儲存於機載SD卡或透過行動網路回傳給地面控制站及巡檢資訊管理平台;巡檢資訊管理平台裝載於自有或第三方伺服器,通常具備巡檢資訊分類管理功能,部分巡檢資訊管理平台具備客製化AI分析模組,可針對巡檢資訊進行自動化分析。此外針對無人機建物巡檢(例如:大型穀倉)系統,巡檢資訊管理平台會另搭載AI 圖像劣化分析模組以分析結構劣化程度;而無人機倉儲巡檢系統因室內缺乏GNSS定位資訊,另需搭配室內導航技術以建構管理無人機飛行路徑,分別說明如下:
圖1為無人機建物巡檢方案架構圖,方案採用模組化架構,具體包含兩大核心模組:「飛行與拍攝」模組及「圖像管理與檢測」模組。其中,「飛行與拍攝」模組可進一步分為地面控制站與無人機兩個子模組,兩者透過標準化通訊協定實現資料互動與指令傳輸,在實際部署中,可根據巡檢現場的任務需求及使用者預算,靈活配置合適的無人機設備與檢測酬載,也可搭配使用市售無人機或客製化無人機,滿足採用多種硬體方案可能性及業主需求。「圖像管理與檢測」模組包含AI劣化檢測功能及巡檢圖像管理平台,支援本地部署與雲端部署兩種模式,前者可以確保所有資料只在限定的範圍內流通與存儲,後者可以提供大量的外部服務需求,滿足不同場景下的使用與商業運作需求;其中,AI劣化檢測模組由多個獨立的 AI 劣化偵測功能單元構成,能依據巡檢場域檢測需求,智慧配置對應的檢測功能模組,實現各類檢測標的之精細分析。

圖1 無人機建物巡檢方案架構圖
另外,無人機倉儲巡檢系統提供一套完整軟硬體解決方案(Total Solution),主要構成包含防撞自主巡檢無人機、地面控制站及AI影像辨識系統。防撞自主巡檢無人機上搭載立體視覺攝影機、IMU與視覺慣導里程定位運算模組,使無人機能在室內倉儲具備自主定位飛行能力。地面控制站可因應倉儲巡檢需求,執行常規弓形巡檢及指點異常檢視任務、並可顯示機載攝影機即時影像與AI辨識結果介面。最後,AI影像辨識系統可部署於後台伺服器或地面控制站端,進行棧板歪斜辨識。
無人機建物巡檢
我國無人機產業在政策支持方面,交通部已鎖定 2025 年兩大無人機應用目標:一是建立偏鄉及離島無人機物資運補機制;二是橋梁∕建物檢測作業將全面導入無人機。此政策施行將為無人機在建物巡檢領域,提供強力的發展路徑和市場機會。無人機建物巡檢是一種高效、安全、經濟的檢查方法,可以輕易到達高空等人員較難到達的地方,提高建物檢測完整性,通過導入AI電腦視覺技術和制訂檢測標準作業程序,可以全面提高巡檢效率與服務質量。
核心技術說明
3D無人機地面站
工研院開發的 「3D 無人機地面站」操控介面系統,與傳統 2D 地面站的核心技術差異在於支援巡檢區域三維模型導入功能,通過空間三維視覺化技術的開發導入,實現地貌變化、建築輪廓結構、及障礙物空間拓樸的直觀化呈現,從根本上解決傳統 2D 地面站在空間維度感知上的資訊缺失問題,提升更直觀高效的環境態勢呈現。
其次,該地面站還進一步提供兩個實用功能:一是模擬勤務運作,通過與無人機模擬環境(SITL [1])介接,可對預設 3D 航線進行模擬試行,在實飛前先看到航勤過程,規避碰撞等航行風險;二是勤務回溯,可基於歷史航勤資料,實現飛行軌跡、感測資料的同步重播,為操作人員提供航線優化的直觀資料參考,讓航線優化變得更容易,進而提升整套系統的運作效率。
巡檢圖像管理平台
巡檢圖像管理平台採用模組化架構設計,有兩大功能特點:
其一為巡檢標的影像完整管理功能,從平台專案建構、子區域精細劃分、多個巡檢時間線等維度等進行索引與分級管理。專案建構維度支援結構化存儲(含專案編號、巡檢任務目錄);子區域維度用以將巡檢區域進一步細分成個別巡檢區塊,便於對特定部位進行長期變化的追蹤;時間線維度依託時序軸標定影像採集時間戳記,形成多維度關聯的影像資料庫。使用者取得登入系統的許可權驗證後,就能快速直覺地點選專案檢索對特定標的專案內容進行瀏覽,查看高解析原圖以及經AI分析後的結果資料。
其二為 AI圖像劣化檢測功能,本功能用以檢測混凝土的劣化情況,包含混凝土剝落、鋼筋外露、和混凝土膨脹等,實現方式是結合mistral-small 3.1與YOLO的演算法,能實現「視覺特徵精準提取」及「語意級劣化理解」的雙重優勢,大幅提升檢測的精度、效率和工程實用性。如圖2所示,左側為檢測結果,在影像上標記出劣化類別、位置與範圍,右上角為該圖整體劣化檢測說明,右下角為專家意見回饋欄,用戶如果對檢測結果有其他想法可以填入,用以進一步優化AI模型,隨著時間與檢測樣本的積累,持續優化AI模型的精準度。

圖2 AI圖像劣化檢測結果畫面
無人機倉儲巡檢
隨著智慧物流的快速發展,倉儲空間正從平面化走向立體化、自動化。對大型物流業者而言,如何在數萬個高達數十公尺的儲位間,進行安全、快速且精準的巡檢,已成為當前重要挑戰。現代化高架倉儲中,貨架高度可達 30 至 40 公尺,儲位數量動輒上萬。過往的巡檢作業仰賴人員搭乘高空叉車逐層檢查,不僅耗時費力,更潛藏高處作業風險。倉儲管理者普遍面臨三項問題:
- 巡檢效率低:傳統人工盤點需花費數天,仍可能遺漏異常。
- 高處作業危險:人員登高檢視歪斜棧板或傾倒貨物,潛藏安全疑慮。
- 資訊更新不即時:異常發現與系統更新之間存在時間落差,難以即時決策。
基於此需求,專案團隊開發結合視覺慣導里程定位、自主導航巡檢與AI辨識技術的倉儲專用無人機,讓室內巡檢作業從「人工盤點」邁向「智慧化、自動化」的新階段,可提升巡檢效率從數天縮短至數小時,甚至可定期自動盤點,大幅節省人力時間。並且可取代人工攀爬檢視棧板作業,降低受傷風險,無人機視覺AI模組亦可補足人力無法到達的視角,自動判斷棧板歪斜程度,即時回報異常位置與影像,大幅縮短問題追蹤時間。
核心技術說明
因室內環境缺乏GNSS定位資訊,無人機自動化倉儲巡檢系統需整合室內定位導航技術,以管理無人機飛行任務,核心技術說明如下。
室內定位技術
室內倉儲環境無法接收GPS訊號,無人機必須依據雙目視覺慣導里程定位(Visual-Inertial Odometry, VIO)資訊進行自主定位。此技術融合立體攝影機(Stereo Camera)與慣性量測單元(Inertial Measurement Unit, IMU)資料,估算無人機在空間中的位姿(Pose)變化,包含:位置(x, y, z)、姿態(roll, pitch, yaw)及速度(Velocity),並在無其他外部定位裝置協助下穩定懸停與導航。
視覺導航與防撞設計
團隊開發貨架結構偵測演算法,可辨識垂直、水平及交界處特徵,讓無人機「看懂」貨架結構,沿著每個儲位的垂直或水平結構飛行,逐格巡檢每個儲位;同時融合深度攝影機資訊,在靠近貨架時自動調整距離與角度,確保拍攝畫面完整、無碰撞風險。
圖3是視覺定位技術與導航防撞設計流程:首先取得深度相機連續影像做特徵點追蹤,再取得IMU的加速度和角速度預積分資料,兩者進行位置與姿勢資訊估算後,得到每張畫面相對於無人機起飛位置的位置與姿勢變化。接著結合貨架結構偵測演算法,偵測垂直、水平及垂直水平交界處等結構,無人機即能以貨架垂直水平交接處為 目標點巡檢所有的儲位,不須事先建圖。

圖3 室內定位技術與視覺導航防撞設計流程
棧板歪斜檢測技術(AI影像辨識)
巡檢過程中,無人機即時回傳彩色與深度影像至巡檢任務控制地面站。AI模組會進行棧板歪斜與位移判斷:利用深度比例尺演算法,計算棧板相對於貨架的角度與距離。若超出距離或角度偏差,系統即回報為「異常儲位」。
圖4是棧板異常辨識技術流程:首先建構辨識模型以找出棧板、條碼、跨梁、鎖扣的位置,結合無人機回傳的深度資訊,經過校正和計算可判斷3種棧板異常狀態,分別是棧板是否平均擺放、棧板是否凸出及棧板是否旋轉角度過大。

圖4 棧板歪斜辨識技術系統流程圖
巡檢任務控制地面站
系統提供「常規弓形巡檢」與「指點異常檢視」兩種任務模式,地面站巡檢任務說明如圖5所示。
- 常規弓形巡檢:無人機依預先規劃的弓型路線自動飛行,完成整排貨架巡檢所有儲位。
- 指點異常檢視:操作者在地面站介面點選異常儲位,即可指派無人機前往該位置進行高處檢查。

圖5 地面站巡檢任務說明
巡檢AI辨識分析
AI解決方案與案例說明
在各種戶外或室內場域執行無人機巡檢任務時,無論是倉儲異常檢測、建物瑕疵劣化檢測、交通工具辨識等各種類型AI辨識應用,案場經常出現諸如強烈反光、遠距離的微小目標、待測物件密集與背景雜訊多變等諸多挑戰。為了在這樣的條件下依然可清楚辨識、準確分析,本團隊打造了一套由物件偵測、語意分割、異常偵測與多模態視覺語言模型(Vision-Language Model, VLM)組成的完整 AI 解決方案,從資料標記、模型訓練到推論與結果一致化都有明確的流程與工具,目前已能支援港區船舶偵測、橋梁設施瑕疵判讀與邊坡災害辨識等多種情境。
實驗顯示,經過訓練的 YOLOv8 在港區船舶影像上,mAP50(在偵測框重疊比例門檻值為0.5時,各類別的精確度平均值) 可達九成七、F1-score 約九成五,面對遠距小目標仍能維持高精度;同時搭配半自動標記流程,標記效率提升逾五成,8K 影像的大規模標註也能在可控時程內完成。針對混凝土瑕疵的辨識「一致化」問題,團隊以 YOLO 進行定位,再由 VLM做語義命名與結果複核,示範集的 Precision 約九成五、Recall 約七成三、F1-score 約八成三,實務操作上可依需求在召回與明確性間調整權衡。
對於需要區分範圍與形狀的情境,如邊坡坍方或道路要素,我們以雙模型並行的語意分割方式進行學習,在訓練與驗證上分別達成約九成五與九成的正確率;至於快速指示畫面變動熱區的異常偵測,則以背景差分結合形態學濾波,產出可視化前景比例,並預留導入神經網路的升級路徑。

圖6 AI船舶辨識範例(台中港)
在「船舶偵測」方面(如圖6所示),我們採用 YOLOv8 的進階設定,搭配多尺度訓練、HSV 色彩擴增、馬賽克與 mixup 等資料增強方法,以提升模型對不同光照與雜訊條件的耐受度。為了能辨識遠距離的微小目標,輸入解析度提高至 1,024×1,024 甚至 2,048×2,048。港區的 8K 影像資料集在九比一的訓練測試切分下,Precision 與 Recall 皆可達九成五,mAP50 落在九成七。由於高解析訓練需要較大的 GPU 記憶體(VRAM),我們在 RTX 3090(24GB)與 A100(80GB)上完成訓練,並透過調整 batch ,避免 OOM(Out Of Memory)。
資料標記落地是專案最花時間的環節之一。為此,我們建立了半自動標記流程:以少量人工標記啟動初版模型,讓模型先行自動標出大量影像,再由人工快速審閱與修補,最終把標註品質提升到可訓練等級。這個流程在港區資料上展現了超過五成的工時節省,並順利完成團隊港區專案合計數以萬計的標註框,讓後續模型的疊代速度顯著加快。
在穀倉倉筒的瑕疵檢測中,存在不同模型之間「看得到之後要說得一樣」的挑戰,我們把 YOLOv8 與 VLM 串成閉環。前者負責找出可能的瑕疵位置,後者則以自然語言與視覺語意對結果進行一致化命名與重複檢核,避免不同批次或不同人員對同一種瑕疵有不同稱呼而導致結果難以比較。簡單說,就是先用 YOLO 把『哪裡有問題』圈出來,再由 VLM 負責用一致的專業語彙幫每個問題貼標籤,避免人員或資料批次不同時命名不一致。這樣的設計,既保留了深度學習對外觀差異的敏感度,也兼顧了人工檢視與報表彙整時對一致性的需求。

圖7 多模型協同辨識 辨識流程圖
當任務需要輸出可量測的面積或邊界時,語意分割發揮關鍵作用。我們以雙模型協同(如圖7所示)的方式處理邊坡坍方、道路、隧道、樹林與岩塊等要素,使用多邊形標註配合去背清理,讓模型能更準確地學到形狀與輪廓。在訓練過程中,模型於訓練集與驗證集分別達到約九成五與九成的正確率,已可在災防監測與工程巡檢中提供穩定的視覺層輸出。
異常偵測則以效率為先。我們用背景差分快速標示畫面變動區域,並以侵蝕、膨脹等形態學運算降低雜訊,最後將前景比例轉成簡潔明瞭的熱區提示。這樣的模組可作為第一層「提早發現」的工具,當現場畫面或設備狀態有異時,立即提醒人員或觸發後續更精細的模型檢查。未來若要面對更複雜的非剛性變化或攝影機輕微未對齊,我們也已規劃以神經網路進一步強化穩健性。
系統部署與導入效益
這套AI解決方案已在多個應用情境中展現價值。以港區船舶管理為例,強反光與遮擋頻仍,但模型仍能維持高精度偵測,協助大量船舶停靠監控、違規取證與交通流量統計;在工程巡檢上,系統先以 YOLO 找到疑似瑕疵,再交由 VLM 統一命名與複核,讓大批影像的瀏覽與彙整更有效率;在災防監測方面,邊坡坍方與道路可通行區的分割結果可直接疊加於地圖或影像上,可作為主責機關快速指揮決策的視覺化依據。
系統部署上,我們同時驗證了兩條可行路線:其一是先進行場域辨識,再套用對應的專屬模型;其二是以單一模型納入多場域資料,追求更高的泛化能力。推論解析度會依任務在 640、1024 與 2048 之間取捨速度與精度;訓練端則已在 RTX 3090 與 A100 上完成驗證,邊緣端可依硬體條件彈性下放。整體效益在於更快發現問題、降低標註與檢核的人力成本,並且能以同一套流程向不同場域擴充,從船舶到瑕疵、再到坍方,累積資料與模型的可重用性。
展望下一步,我們將以更精細的語意分割強化邊界學習,讓模型在複雜背景下仍能穩定辨識;同時評估以擴散式生成模型進行資料增廣,提升跨域泛化能力;在 YOLO 與 VLM 的閉環上,則會持續優化一致化規則與人機協作介面,讓不同情境下的 Precision 與 Recall 調節更直覺,進一步縮短從影像擷取到分析決策的時間。
結語
本文簡要說明無人機建物巡檢與倉儲巡檢場域技術驗證所使用的技術及系統架構,以及技術導入效益。
在建物巡檢方面,傳統人工巡檢的痛點都能以無人機建物巡檢方案改善:一是提升巡檢效能,人員需求大幅減少,巡檢速度提升可達數倍以上,且無人機功能越來越進步,可近距離擷取可見光、熱影像、多光譜等多種影像資訊協助判讀;二是職災風險降低,屋頂、高側壁等區域,人工檢查需要搭設鷹架或升降設備,具人員受傷風險,而無人機可輕易抵達相關區域;三是數據資產得以建立,巡檢過程中所建立的高解析圖像、三維模型、熱影像等資料,隨著時間累積可形成建物的數位檔案,為建物維護與管理提供重要參考,可依時間前後分析歷史資料,甚至可進一步導入預測模型,對建物進行準確且經濟的預測性維護,實現由「被動檢測」朝向「主動預防」轉型。
在倉儲巡檢方面,「無人機室內倉儲巡檢系統」整合了視覺慣導里程定位(VIO)、AI棧板歪斜辨識、地面站即時圖傳控制等技術,讓無人機在無GPS的封閉倉儲環境中完成自主飛行與異常偵測,實現智慧倉儲「自動巡檢、即時分析、安全高效」的全新里程碑。對物流業者而言,導入此系統不僅能降低人力成本與巡檢風險,更能強化倉儲營運效率與安全管理。
無人機應用領域相當廣泛,涵蓋了農工商業、政府公共工程、個人娛樂等等用途,目前常見應用包括物流配送、農業植保、基礎設施巡檢、地理測繪和空拍攝影等。隨著無人機軟硬體技術持續發展進步,搭配AI技術的應用,近年來更逐步往災害應變、嚴苛場域巡檢等應用領域發展,相信不久的將來,無人機將在更多不同應用場域實際商轉,成為政府公部門及民間企業可靠的自動化智慧好幫手。
參考文獻
[1] https://ardupilot.org/dev/docs/sitl-simulator-software-in-the-loop.html