澳門氣象·天文 – 民間角度·分析氣象

澳門早期氣象紀錄資料庫

Base de Dados dos Registos Meteorológicos Primordiais de Macau (ReMPM)

氣象數據的數值化處理

1️⃣ 何謂數值化處理?

數值化處理是指將紙本文件或圖像格式檔案內的字母、數字轉錄為電腦可讀數值的過程。有些人稱這些數值化數據為「獲救數據」(Oleo S. et al., 2020)

2️⃣ 為何要對一百多年前的觀測數據進行數值化處理?

  • 紙本觀測紀錄可能面臨變質或丟失風險;
  • 利用電腦進行大量統計;
  • 極值分析(如:過去一百年內的單日最高氣溫、單日最大降雨量等),判斷極端天氣的出現頻率,用於防災研究;
  • 長期氣候研究,有助建立氣候模型;
  • 推動公民科學,引起公眾對於此領域的興趣;
  • 保護本澳重要科學遺產。

3️⃣ 如何進行數值化處理?

  • 人工轉錄:
    以鍵盤將數據人手錄入至電腦內
    。此方法十分耗時,以本站為例,輸入一年的氣溫數據一般需要數小時,不過十分適用於歷史檔案的轉錄,因為這些檔案多為手寫,人腦能夠準確識別不同手寫數據。
  • 字符識別:
    使用光學字符識別技術(OCR)或智能字符識別(ICR)自動將圖檔內的字母及數字轉化為電腦可讀數值。此方法可進行大量的數值化處理,不過對於手寫及模糊不清的圖像檔則存在較大誤差率,甚至無法識別。此外,字符識別一般需要長時間的開發及程式碼撰寫,引致開發成本高昂。
  • 必須強調,任何數值化處理均可能出錯,因此後期校驗及質量控制是極其重要。

※ 本頁版面最後修訂日期:2022-07-19 10:35 MST