難易度・正答率・重要度
- 難易度:★★☆☆☆(データ形式の分類)
- 正答率:★★★☆☆(定義を知っていれば容易)
- 重要度:★★★☆☆(データ利活用の基礎)
問題文
近年、デジタルデータの多様化に伴い、構造化データに加えて半構造化データならびに非構造化データの利活用の重要性が高まっている。半構造化データの例として、最も適切な組み合わせを下記の解答群から選べ。
なお、ここで半構造化データとは、あらかじめスキーマを定義せず、データにキーやタグなどを付加することで、データ構造を柔軟に定義できるデータをいう。
a
音・画像・動画データ
b
リレーショナルデータベースの表
c
JSON形式のデータ
d
XML形式のデータ
e
YAML形式のデータ
〔解答群〕
ア
aとbとe
イ
aとcとd
ウ
aとcとe
エ
bとdとe
オ
cとdとe
出典: 中小企業診断協会|2023年度 第1次試験問題|経営情報システム(PDF)
解答
- 正解:オ(cとdとe)
解説
- a:×
音・画像・動画は非構造化データ。タグやキーによる構造定義はされていない。 - b:×
リレーショナルデータベースは構造化データ。スキーマ(表定義)が厳密に存在する。 - c:〇
JSONはキーと値のペアで構造を持つが、スキーマは不要。典型的な半構造化データ。 - d:〇
XMLはタグで構造を表現するが、スキーマは任意。柔軟な構造定義が可能。 - e:〇
YAMLは人間に読みやすい形式で、インデントやキーで構造を持つ。スキーマ不要で柔軟。
学習のポイント
- 構造化データ: 表形式・スキーマあり(例:RDB)。
- 半構造化データ: キー・タグで構造を持つがスキーマ不要(例:JSON, XML, YAML)。
- 非構造化データ: 構造を持たない(例:画像、音声、動画、自然言語テキスト)。
- 実務での活用: 半構造化データはWeb APIやログ、設定ファイルなどで広く利用される。