A Data Placement and Access Method Considering Transversal and Result Construction Cost for XML Subtree Retrieval

Y. Yoshino,Wenxin Liang,H. Yokota
2008-01-01
Abstract:近年大規模化している XML データでは,検索対象が個別の ノードではなく部分木毎であることが多い.また,複数の RDB に格納された XMLデータを効率よく走査・結果部分木構築を行 うためには,各 DBMS 間での処理の均衡化が必要である.本稿 では,大規模な XML データに特徴的な構造とキーワード検索 を前提に,検索走査と結果部分木構築の処理コストが DBMS 間 で均衡化するような XML 分割配置手法を提案する.XML の各 部分データが同等の意味単位となるように分割した上で,検索対 象となる要素の文字列に着目して分割したデータのクラスタリン グを行う.各クラスタは,含まれる部分データのサイズとノード 数から算出したコストを考慮して各 RDB に配置する.また,分 散配置されたクラスタの位置情報取得のためのインデックス構 造に関しても提案を行う.Wikipediaの XMLデータを,複数の PostgreSQL サーバに提案手法によって分割配置した実験によっ て評価を行う.
What problem does this paper attempt to address?