1. 前言:別再複製貼上了!
對於投資者、查帳員或財務分析師來說,「公開資訊觀測站 (MOPS)」是獲取第一手資訊的聖地。然而,每當需要獲取「上市櫃公司已發行股數」等大量彙總資料時,許多人的習慣動作是:手動點擊搜尋、另存 CSV、開啟檔案,然後反覆進行枯燥的複製貼上,試圖拼湊出一份完整的分析表。
這種工作流程不僅低效,更隱藏著「胖手指 (Fat-finger)」的人為錯誤風險。你是否曾經嘗試請強大的 AI 或 ChatGPT 幫你寫一段 VBA 程式碼來自動抓取?結果卻發現,面對複雜的網頁結構,連 AI 都會踢到鐵板。難道除了手動勞力,就沒有更聰明的方法了嗎?
2. 驚人發現:當 AI 失靈時,Excel 內建功能才是真英雄
身為資料分析師,我也曾試圖挑戰用 AI 撰寫 VBA 爬蟲來簡化流程。然而,在實測過程中,AI 生成的程式碼往往無法處理網頁的動態載入機制或 Session 連結,導致出現「網頁中未找到表格」或「抓不到資料」的失敗結果。
這給了我們一個深刻的啟示:在自動化領域,「不寫程式反而比寫程式快」。當我們試圖用代碼對抗複雜網頁時,Excel 內建的「從網頁取得資料 (Get Data from Web)」功能反而展現了更卓越的穩定性與專業性。
「結果都是失敗,最後是用 Excel 匯入 Web 資料來解決這件事情」
與其撰寫難以維護的代碼,不如建立一套穩定、可重複使用的 ETL (擷取、轉換、載入) 流程。
3. 核心突破:掌握「網址」即掌握數據主權
要實現數據自動化,關鍵在於正確的「連結」。你必須先在公開資訊觀測站的「彙總報表」頁面執行搜尋(例如選擇上市或上櫃、設定產業別),取得該查詢結果頁面的專屬網址。
專業操作要點:
- 取得來源: 複製查詢結果頁面的完整 URL。
- 建立連線: 開啟 Excel,點選上方選單的「資料」>「取得資料」>「從 Web」。
- 貼上網址: 貼入連結並點擊確定,讓 Excel 直接對接網頁伺服器。
技術細節:導覽器的耐心抉擇
在「導覽器」視窗中,你會看到許多 Table。根據實測經驗,「資料表 1 (Table 1)」 通常包含我們需要的標題欄位,而「資料表 3 (Table 3)」雖然內容相似但缺乏表頭。
- 專家提醒: 有時「網頁檢視」載入較慢,請不要心急。在左側清單中確認資料正確後,點選 「轉換資料」 進入 Power Query 編輯器,這才是處理數據的核心戰場。
4. 關鍵細節:清洗資料的「除雷」技術
原始網頁資料往往帶有雜質,無法直接用於分析。透過 Power Query,我們可以建立一套「自動化清洗流程」:
- 動態標頭設定: 點選「將第一列作為標頭」,讓 Excel 正確辨識公司代號、名稱等欄位。
- 消除重複的「偽標題」: 網頁報表為了方便閱讀,常會在每幾十列資料後重複出現一次標題列(如「公司代號」)。
- 除雷秘訣: 在「公司代號」欄位的篩選下拉選單中,勾除「公司代號」這個字眼。這樣一來,所有的冗餘標題列會被瞬間濾除,確保你的資料庫是純粹的結構化數據。
這套 ETL 邏輯能確保資料流的純淨,是維持分析報告「資料完整性 (Data Integrity)」的基礎。
5. 易錯陷阱:被忽視的「文字 vs 數字」資料格式
這是許多財務人員最常踩到的坑。從網頁抓取的數字(如已發行股數),在 Power Query 中預設往往是 「ABC (文字)」 格式而非數字。
如果你直接載入 Excel 並嘗試使用
VLOOKUP 或進行加總運算,你會遇到滿滿的 #N/A 錯誤。因為在 Excel 的邏輯中,「1234」(文字) 與 1234 (數字) 是完全不同的兩個實體。「下次我們如果跟你講,如果你要用查表,這邊要特別注意,因為你打數字是找不到的,Vlookup 是找不到的」
專家建議: 請務必觀察 Power Query 欄位左上角的圖示。若顯示為「ABC」,請點擊並更改為「整數」或「十進位數字」。這一步雖然簡單,卻是確保後續財務模型精準度的關鍵。
6. 終極效益:從「手動更新」到「一鍵刷新」
完成設定並點擊「關閉並載入」後,你的 Excel 就進化成了一個自動化的數據引擎。
- 一鍵刷新 (One-click Refresh): 未來當月份或季度資料更新時,你只需點擊「資料」>「全部重新整理」。
- 背景作業: 你可以觀察 Excel 左下角的「正在背景查詢」,此時你可以繼續處理其他工作,Excel 會自動連網、抓取、清洗並回填最新數據。
這不僅徹底解放了雙手,更讓原本需要 10 分鐘的瑣碎任務,縮短到只需 3 秒鐘的等待。
7. 結語:工具的價值在於思維
在 AI 時代,人類的價值不在於寫出多複雜的程式碼,而在於具備診斷問題的能力,並選擇「最穩定、最有效率」的工具來解決問題。當 VBA 或 AI 顯得大材小用且不夠穩定時,Excel 內建的 Power Query 往往才是真正的效率救星。