データサイエンティスト検定リテラシーレベル問題一覧

全300問を分野別に一覧表示しています。各問題タイトルをクリックすると詳しい解説ページが開きます。

① データサイエンス力・基礎統計

50問

データサイエンスの土台となる数学と統計の基礎を学ぶ分野です。ベクトル・行列・微分積分といった数理の基本、確率と確率分布（正規分布・二項分布・ポアソン分布など）、平均・分散・標準偏差・四分位数などの代表値と散らばり、相関と擬似相関、尺度水準、ヒストグラムや散布図といった可視化まで幅広く問われます。出題数が多い最重要の土台分野なので、用語の定義と計算の意味をセットで押さえ、以降の検定・機械学習の理解につなげましょう。

② 検定・推定・評価指標

50問

推測統計と分析評価の考え方を学ぶ分野です。区間推定と信頼区間、仮説検定（帰無仮説・対立仮説・p値・有意水準・第1種／第2種の過誤）、t検定・z検定などの検定手法、回帰分析、そしてAUCやF値・適合率・再現率といったモデルの評価指標が頻出です。あわせて標本誤差やバイアス、データの前処理・可視化の実務も問われます。用語が多く混同しやすいため、検定の流れと各指標が「何を測るか」を整理して覚えるのが得点のコツです。

③ 機械学習・ディープラーニング

45問

機械学習と深層学習の代表的な手法を学ぶ分野です。教師あり・教師なし学習の区別、ランダムフォレストや勾配ブースティングなどのアンサンブル学習、過学習と汎化性能、連合学習・転移学習といった学習パラダイム、そしてニューラルネットワークの基礎までが問われます。手法ごとに「何を得意とし、どんな課題があるか」を対比して押さえることが重要です。用語の丸暗記ではなく、各モデルの仕組みと使いどころを理解すると応用問題にも対応できます。

④ データ加工・DB・BI

30問

データを扱うための実務スキルを学ぶ分野です。SQLによるデータ抽出（LIKE演算子や条件指定など）、正規表現によるパターン処理、HadoopのHDFSやSparkといった分散処理技術、NoSQLデータストア、クラウドのオブジェクトストレージ、BIツールによる可視化などが問われます。分析の前段となるデータの取得・加工・蓄積を横断的に扱う分野なので、各技術が「どんなデータをどう処理するのに向くか」を整理しながら学ぶと定着します。

⑤ データエンジニアリング力

45問

システム開発とAI活用の実装面を学ぶ分野です。ホワイトボックステスト・ブラックボックステスト・境界値分析といったソフトウェアテストの手法、Pythonの機械学習ライブラリ、音声認識のWER（単語誤り率）などのAI精度評価、AIによるコードレビューといった開発現場での実践知識が問われます。データサイエンスを支えるエンジニアリングの土台なので、テスト技法やライブラリの役割を実務のイメージと結びつけて理解するのが効果的です。

⑥ ビジネス力

50問

データ分析を課題解決につなげる思考力を学ぶ分野です。分析の目的設定と論理構成、仮説の立て方と検証、KGI・KPIとの関連付け、依頼を受けたときの初動対応、課題や仮説の言語化など、分析プロジェクトを前に進めるための考え方が問われます。技術力だけでなく「何のために分析するか」を見失わない姿勢が重視されるのが特徴です。ケーススタディ形式の出題も多いため、目的から逆算して仮説とデータを結びつける練習を積みましょう。

⑦ 数理・DS・AIモデルカリキュラム

30問

社会におけるAI・データ活用の全体像を学ぶ分野です。Society 5.0の概念、バリューチェーンや事業活動の各領域でのAI活用例（研究開発・ダイナミックプライシング・チャットボットなど）、生成AIとプロンプトエンジニアリング、AI活用に求められる能力などが問われます。数理・DS・AIを社会実装の視点でとらえる分野なので、技術そのものより「どの場面で何のために使うか」という活用の文脈を押さえることが得点につながります。

← データサイエンティスト検定リテラシーレベルトップへ戻る

データサイエンティスト検定リテラシーレベル 問題一覧