基本情報技術者試験の公開問題を解こう！（令和６年度・科目A）（13）「ビッグデータ分析」

IT系

2025.01.15

基本情報技術者試験の令和6年度の公開問題を解いてみよう。

今回のテーマは、「ビッグデータ分析」である。

問15 　ビッグデータ分析の前段階として、非構造化データを構造化データに加工する処理を記述している事例はどれか。

ア　関係データベースに蓄積された大量の財務データから必要な条件に合致するデータを抽出し、利用者が扱いやすい表計算ソフトウェアデータに加工する。
イ　個人情報を含むビッグデータを更に利活用するために、特定の個人を識別することができないように匿名化加工する。
ウ　住所データ項目の中にある，“ヶ”と“が”の混在や、丁番地の表記不統一を、標準化された表記へ統一するために加工する。
エ　ソーシャルメディアの口コミを機械学習によって単語ごとに分解し、要約を作り、分析可能なデータに加工し，関係データベースに保管する。

正解：エ

ビッグデータとは、簡単に言うと「日々生成される多種多様なデータ群」のことである。

その明確な定義は定まっていないが、例えば交通系ICカードに記録される乗車履歴やGPSから得られる位置情報、メールの内容、SNSの投稿やコメントといったデータが大量に蓄積されたものをビッグデータと呼ぶことができる。
（参考）NTT東日本のWebサイト

非構造化データとは、その名の通り構造定義されていないデータのことを指す。データベース化ができないため、検索や集計、解析に不向きなデータである。eメール、提案書・企画書、見積書・発注書、契約書などのOffice文章、デザインデータ、CADデータ、画像、動画、音声、センサーログなど、日常の業務で生成されるさまざまなデータが含まれる。データ単体で意味を持ち、用途も異なるうえに量が多く、発生する頻度も高いのが特徴である。

構造化データとは、ExcelやCSVファイルに代表される、「列」と「行」の概念をもつデータのことである。文字通り「構造化」されているため検索、集計や比較などが行いやすく、データの解析や分析に最も適したデータ構造である。ERP、CRMなどの業務システムでデータを効率よく管理するRDB（リレーショナル・データベース）でも用いられる。
（参考）TOPPAN BizのWebサイト

なお、ビッグデータの前処理とは、主に非構造化データを構造化データへ加工することである。

ア　誤り。

構造化データから構造化データへ加工する記述である。

イ　誤り。

匿名化加工に関する記述である。

ウ　誤り。

表記統一に関する記述である。

エ　正解。

非構造化データを構造化データに加工する処理を記述している。

（参考）
令和07年基本情報技術者パーフェクトラーニング過去問題集　山本三雄 (著)　技術評論社

月	火	水	木	金	土	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30

関連

コメント