④ データ加工・DB・BI

データサイエンティスト検定リテラシーレベル第147問

問題

分散処理技術であるSparkの処理方式の特徴について正しい記述はどれか。

Aストレージ上の分散処理を基本とし反復処理を高速に実行する

B一般的なRDBMSと比べて構造が変化しにくいデータに適する

CRDDなどの仕組みを用いたメモリ上の分散処理により動作する✓ 正解

DMapReduceアプリケーションを用いたストレージ処理に特化する

正解

C：RDDなどの仕組みを用いたメモリ上の分散処理により動作する

解説

SparkはRDD等の仕組みを用いたメモリ上での分散処理によって動作するため反復的な処理に強い特徴があります。

分野解説：④ データ加工・DB・BI

データを扱うための実務スキルを学ぶ分野です。SQLによるデータ抽出（LIKE演算子や条件指定など）、正規表現によるパターン処理、HadoopのHDFSやSparkといった分散処理技術、NoSQLデータストア、クラウドのオブジェクトストレージ、BIツールによる可視化などが問われます。分析の前段となるデータの取得・加工・蓄積を横断的に扱う分野なので、各技術が「どんなデータをどう処理するのに向くか」を整理しながら学ぶと定着します。

この分野の問題をすべて見る →

本番形式で問題を解いてみよう

クイズモードで挑戦 →

← 第146問第148問 →

データサイエンティスト検定リテラシーレベルについて

DS検定リテラシーレベルの基礎を固める

主催	一般社団法人データサイエンティスト協会
出題形式	CBT（コンピュータ上で受験する方式）。試験時間は公式サイトで要確認
試験時間	試験時間は実施回により変動するため公式サイトで要確認
受験料	受験料は改定されるため公式サイトで要確認
合格基準	合格基準は公式サイトで要確認
難易度	★★★☆☆

試験詳細を見る →

データサイエンティスト検定リテラシーレベル第147問

解説

分野解説：④ データ加工・DB・BI

同じ分野の関連問題

データサイエンティスト検定リテラシーレベルについて

データサイエンティスト検定リテラシーレベルの関連記事

データサイエンティスト検定リテラシーレベルの勉強法・合格のコツ【完全ガイド】

データサイエンティスト検定リテラシーレベルの難易度・合格率は？勉強時間の目安を徹底分析

DS検定★リテラシーレベル統計・機械学習・SQL用語早見チートシート

データサイエンティスト検定リテラシーレベル 第147問

解説

分野解説：④ データ加工・DB・BI

同じ分野の関連問題

データサイエンティスト検定リテラシーレベルについて

データサイエンティスト検定リテラシーレベルの関連記事

データサイエンティスト検定リテラシーレベルの勉強法・合格のコツ【完全ガイド】

データサイエンティスト検定リテラシーレベルの難易度・合格率は？勉強時間の目安を徹底分析

DS検定★リテラシーレベル 統計・機械学習・SQL用語 早見チートシート

データサイエンティスト検定リテラシーレベル第147問

DS検定★リテラシーレベル統計・機械学習・SQL用語早見チートシート