オープンデータとして提供されるデータは単位の不揃い、テーブル数値に%が組まれていたり、順番が逆などそのままでは多次元分析作業ができない場合が極めて多い。
またデータソースが異なる部局であると年次も不揃いが多い。従って、そのままの元データをXVIEWやLODには渡せない。PDFや印刷物での提供形態も多く使おうとするには事前作業が膨大であるオープンデータの利活用の障害になっていると認識する。
下表はそのような背景の下で、元データの中から統計的に有意差があるものを選び、上位概念の指標をつくり、それをカプセル化した。今後、分析されたデータから偏差値で正規化したテーブルを作成。相関係数Rのマトリックステーブルを作成LODへエクスポートする計画である。最近LODのメタデータが階層構造を扱えるようになったとのことから、その事例作成を行う。
更新: 2018年9月28日
(中山圭太郎)