2008年8月12日星期二

IDEA#155 資料管理原則

簡單說,紙本/實體資料的最大問題在於占用空間及難於搜尋,而電子資料的首要問題在於管理困難,與及儲存媒體容易損壞,一次過損失大量資料的風險很高。

由於紙本資料性質比較簡單,加上在電腦出現以前,已經有很成熟的filing system,所以正在構想所有的資料,盡可能先以紙本方式保存,然後再根據需要轉換為電子方式,方便搜尋。

也就是說,常用的又或者是還沒有決定是否值得保存的資料,先用傳統方法保存,一段時間後,才將真正需要保存的部分數碼化,以控制電子資料的數量,改善資料以高速累積的核心問題。

此外,我構思了以下的原則:

  • 對於文字資料,電腦只作為長期儲存(archive)的工具。要閱讀的資料,定當先列印出來。閱讀並寫下筆記後丟掉源文件。需要的話,可先保存源文件,一年後檢討是否需要電子化作長期保存。電子化後,將不保留紙本文件。
  • 如Word和PowerPoint等的電子工作文件(working file),在還需要修改的時候保存在電腦硬盤上。不用再度修改的工作文件則移動到如記憶卡等的離線媒體中,減少被病毒破壞的機會。
  • 電腦中重要的文字資料(如需要保留的電郵)列印出來保存,然後將電腦中的源文件移除。他日確定這項資料值得長期保存的話,才從新數碼化。
  • 預備一份綜合檔案目錄(Index),紀錄電子及紙本資料的所在地及內容摘要,將電子及非電子檔案作統一管理。
  • 對於要永久保存的電子檔案,以分散方式儲存,以解決之前所述的"單點故障"問題。例如相片會存放於編號#001的記憶卡中,而公司的文件則存放於#002。不常聽但值得保留的音樂檔則保存在#003中,長期保存的電郵則存放於#004中。做法有點像以前用floppy disk保存檔案一樣。由於記憶卡沒有機械裝置,比較不容易損壞。加上每張記憶卡只儲存某類型的檔案,所以能夠減少一次過遺失大量檔案的風險。記憶卡只要集中存放於一個地方便可。
  • 由於不能於電腦硬盤中搜索到記憶卡上的檔案,所以還需要將位於記憶卡上的檔案登錄於綜合檔案目錄中。
  • 讀書筆記等協助思考的資料,以紙本方式保存。定期將筆記本數碼化作為備份,但不會丟掉筆記本。
綜合來說,以上的原則可簡化為三項原則:
  1. 文字資料在還沒有確定價值及還沒有處理前,不以電子方式保存,以減少電子檔案的數量及噪音問題
  2. 檔案實行離線及分散儲存,每個媒體只保存一種類型文件,以解決同一種類的檔案分散於不同媒體,以及大量檔案同時中毒及遺失的問題。
  3. 檔案目錄則實行中央管理
這些想法還是比較初步,還要實際實行一段時間才能確認其效果。格式、版本、和參照問題暫時未有好的解決方法。