難易度・正答率・重要度
- 難易度:★★★☆☆(データ基盤の知識)
- 正答率:★★★☆☆(用語の正誤)
- 重要度:★★★★☆(DX・データ活用の基盤)
問題文
意思決定や計画立案のために、データを収集して加工・分析することがますます重要になってきている。以下の文章の空欄 A~ Dに入る語句の組み合わせとして、最も適切なものを下記の解答群から選べ。
意思決定や計画立案のために、組織内で運用される情報システムやデータベースなどからデータを集めて格納しておく場所を A と呼ぶ。この A から、必要なものだけを利用しやすい形式で格納したデータベースを B と呼ぶ。
このような構造化されたデータに加えて、IoT機器やSNSなどからの構造化されていないデータを、そのままの形式で格納しておく C が利用されつつある。膨大なデータを蓄積する必要があるため、比較的安価なパブリッククラウドのオブジェクトストレージに格納される場合が多い。
収集されたデータの品質を高めるためには、データ形式の標準化や D が重要である。
〔解答群〕
ア
A:データウェアハウス B:データマート C:データレイク D:データクレンジング
イ
A:データウェアハウス B:データレイク C:データスワンプ D:データクレンジング
ウ
A:データマート B:データウェアハウス C:データプール D:データマイグレーション
エ
A:データマート B:リレーショナルデータベース C:データレイク D:データマイグレーション
オ
A:データレイク B:データマート C:データプール D:データマイニング
出典: 中小企業診断協会|2021年度 第1次試験問題|経営情報システム(PDF)
解答
- 正解:ア(A:データウェアハウス、B:データマート、C:データレイク、D:データクレンジング)
解説(選択肢ごとの評価)
- ア:〇
データウェアハウス=組織全体のデータ蓄積基盤。データマート=特定部門向けの抽出DB。データレイク=非構造化データもそのまま格納。データクレンジング=データ品質向上のための整備。 - イ:×
データスワンプは管理されず活用困難な状態を指す。適切ではない。 - ウ:×
データマートとウェアハウスの順序が逆。データプールやマイグレーションも文脈不適。 - エ:×
リレーショナルDBは一般的な構造化DB。設問文の意図と異なる。 - オ:×
データマイニングは分析手法。空欄Dは品質向上のための整備であり不適。
学習のポイント
- データウェアハウス: 組織全体のデータ蓄積基盤。
- データマート: 特定部門・用途向けに抽出したデータベース。
- データレイク: 非構造化データも含めてそのまま格納。
- データクレンジング: データの誤りや不整合を修正し品質を高める。