ケンテイラボ

④ データ加工・DB・BI

データサイエンティスト検定リテラシーレベル147

問題

分散処理技術であるSparkの処理方式の特徴について正しい記述はどれか。

Aストレージ上の分散処理を基本とし反復処理を高速に実行する
B一般的なRDBMSと比べて構造が変化しにくいデータに適する
CRDDなどの仕組みを用いたメモリ上の分散処理により動作する✓ 正解
DMapReduceアプリケーションを用いたストレージ処理に特化する

正解

CRDDなどの仕組みを用いたメモリ上の分散処理により動作する

解説

SparkはRDD等の仕組みを用いたメモリ上での分散処理によって動作するため反復的な処理に強い特徴があります。

分野解説:④ データ加工・DB・BI

データを扱うための実務スキルを学ぶ分野です。SQLによるデータ抽出(LIKE演算子や条件指定など)、正規表現によるパターン処理、HadoopのHDFSやSparkといった分散処理技術、NoSQLデータストア、クラウドのオブジェクトストレージ、BIツールによる可視化などが問われます。分析の前段となるデータの取得・加工・蓄積を横断的に扱う分野なので、各技術が「どんなデータをどう処理するのに向くか」を整理しながら学ぶと定着します。

この分野の問題をすべて見る →

本番形式で問題を解いてみよう

クイズモードで挑戦 →
← 第146148問 →

同じ分野の関連問題

146Hadoopの分散ファイルシステムであるHDFSの主な特徴として適切なものはどれか。148NoSQLデータストアの一般的な特徴として不適切な記述はどれか。149クラウド上のオブジェクトストレージを利用する際の注意点として適切なものはどれか。150SQLの抽出条件において特定のパターンに一致するデータを検索する演算子はどれか。

データサイエンティスト検定リテラシーレベルについて

DS検定リテラシーレベルの基礎を固める

主催一般社団法人 データサイエンティスト協会
出題形式CBT(コンピュータ上で受験する方式)。試験時間は公式サイトで要確認
試験時間試験時間は実施回により変動するため公式サイトで要確認
受験料受験料は改定されるため公式サイトで要確認
合格基準合格基準は公式サイトで要確認
難易度★★★☆☆
試験詳細を見る →

データサイエンティスト検定リテラシーレベルの関連記事

データサイエンティスト検定リテラシーレベルの勉強法・合格のコツ【完全ガイド】

データサイエンティスト検定(DS検定★リテラシーレベル)に合格するための勉強法を徹底解説。データサイエンス力・データエンジニアリング力・ビジネス力の3領域と数理・統計の基礎、7分野の学習ポイント、3パターンの学習スケジュール、ケンテイラボでの演習方法までまとめました。

データサイエンティスト検定リテラシーレベルの難易度・合格率は?勉強時間の目安を徹底分析

データサイエンティスト検定(DS検定★リテラシーレベル)の難易度・合格率・勉強時間の目安を徹底解説。数理・統計、データサイエンス力、データエンジニアリング力、ビジネス力を横断する出題の特性、難易度を構成する要素、受験者層の傾向、合格率を上げる5つのコツ、他のデータ・IT系資格との比較までまとめました。

DS検定★リテラシーレベル 統計・機械学習・SQL用語 早見チートシート

データサイエンティスト検定リテラシーレベルで頻出の統計・機械学習・SQL・データ技術の用語を一気に整理。代表値や確率分布、評価指標、機械学習の手法、SQLや分散処理の基礎まで、試験直前に確認したい重要用語をコンパクトにまとめました。

← 問題一覧へ戻る