ケンテイラボ

データサイエンティスト検定リテラシーレベル 問題一覧

300問を分野別に一覧表示しています。各問題タイトルをクリックすると詳しい解説ページが開きます。

クイズモードで挑戦 →

① データサイエンス力・基礎統計

50

データサイエンスの土台となる数学と統計の基礎を学ぶ分野です。ベクトル・行列・微分積分といった数理の基本、確率と確率分布(正規分布・二項分布・ポアソン分布など)、平均・分散・標準偏差・四分位数などの代表値と散らばり、相関と擬似相関、尺度水準、ヒストグラムや散布図といった可視化まで幅広く問われます。出題数が多い最重要の土台分野なので、用語の定義と計算の意味をセットで押さえ、以降の検定・機械学習の理解につなげましょう。

1複数の数値の組み合わせをベクトルと呼ぶのに対し、単なる数値のことを何と呼ぶか。2すべての要素が0である行列を何と呼ぶか。3ある正方行列Aに対して、掛けると単位行列となる行列Xのことを何と呼ぶか。4正方行列Aとゼロでない列ベクトルxに対して、Ax=λx を満たすとき、このλを何と呼ぶか。5関数f(x)の微分によって得られる導関数は何を求めるための式か。62変数以上の関数において、特定の変数のみを変化させ、他の変数を定数とみなして微分することを何と呼ぶか。7確率密度関数をある区間で定積分することで得られるものはどれか。82つの集合AとBの少なくともどちらか一方に含まれる要素の集合を何と呼ぶか。92つの集合AとBの両方に含まれる要素の集合を何と呼ぶか。102つの集合のどちらか片方のみに含まれる要素の集合を何と呼ぶか。11複数の異なるものから一定数を選び、順番を考慮して並べる場合の数を求める計算はどれか。12複数の異なるものから一定数を選ぶ際、順番を考慮しない選び方の数を求める計算はどれか。13ある事象Aが起こる条件の下で、別の事象Bが起こる確率を何と呼ぶか。14ある事象において、得られるすべての値とそれが起こる確率の積を足し合わせたものを何と呼ぶか。152つの事象において、積事象の確率がそれぞれの事象の確率の積で表されるとき、2つの事象の関係を何というか。16すべてのデータを足し合わせ、データの個数で割って得られる代表値はどれか。17データを大きさ順に並べたときに、ちょうど中央に位置する値はどれか。18データの中で最も登場回数(頻度)の多い値はどれか。19峰が一つで右に裾を引いた(右に歪んだ)分布における、代表値の一般的な大小関係はどれか。20各データと平均値との差の2乗和の平均として計算される、データのバラツキを表す指標はどれか。21分散の平方根をとった値であり、データのバラツキを表す最も一般的な統計量はどれか。22すべてのデータを小さい順に並べ、同じ件数ずつ4つに分けたときの区切りの値を何と呼ぶか。23調査の対象となるすべてのデータからなる集合を何と呼ぶか。24標本平均を用いて分散を計算する際、過小評価される傾向を修正するためにデータの個数nから1を引いた数で割る分散を何と呼ぶか...25平均を中心に左右対称の釣鐘型をしており、自然界や社会のさまざまな現象でみられる連続型確率分布はどれか。26標準正規分布の平均と分散の組み合わせとして正しいものはどれか。27正規分布に従う確率変数Xから平均を引き、標準偏差で割ることで標準正規分布に従う変数に変換する操作を何と呼ぶか。282つの物事において、一方が変化すれば他方も変化する関係性を何と呼ぶか。292つの物事に直接的な因果関係はないが、共通の要因があるために相関関係があるように見える現象を何と呼ぶか。30長さや質量のように絶対的なゼロ点を持ち、倍率の計算が意味を持つデータの尺度を何と呼ぶか。31温度の摂氏(℃)のように、大小の差には意味があるが絶対的なゼロ点を持たず、倍率の計算に意味がない尺度はどれか。32満足度や等級のように、大小の順序関係のみが意味を持ち、間隔が一定ではないデータの尺度を何と呼ぶか。33性別や血液型のように、内容を区別するためだけに数値が与えられているデータの尺度を何と呼ぶか。34量的データに対して、2つの変数の直線的な線形関係の強さを示す指標はどれか。35相関係数が負の値をとる場合、2つの変数の間にどのような傾向があるといえるか。36「成功と失敗」や「表と裏」のように、2種類の結果しか得られない試行の結果を表す確率分布はどれか。37互いに独立したベルヌーイ試行をn回行ったとき、特定の事象がx回起こる確率を表す確率分布はどれか。38単位時間あたりに平均λ回起こる現象が、x回起こる確率を表し、稀な現象を表現するのに使われる確率分布はどれか。39単位時間あたり平均λ回起こる現象が、次に起こるまでの期間(待ち時間)が従う連続型確率分布はどれか。40二項分布において、ベルヌーイ試行の回数nを無限に増やしていくと、どのような分布に近似できるか。41順序データや非線形な単調関係の強さを測るために、変数を順位に変換してから計算する相関係数はどれか。42一方が増加するときに、もう一方が常に増加(または減少)し続ける関係性を何と呼ぶか。43指数関数 y = a^x に対し、x = log_a(y) のように表される関数を何と呼ぶか。44変数の片方(一般に縦軸)だけを対数目盛りにしたグラフを何と呼ぶか。452つの変数が累乗関数の関係(y = a×x^b)にあるとき、それを直線で表現できるグラフはどれか。46事象Aが起こったという結果を知った上で、それが事象Bを原因とする確率を計算する定理を何と呼ぶか。47データがとる値を複数の区間に分割し、各区間に入るデータの数を棒グラフで示したものを何と呼ぶか。482つの属性を持つデータを掛け合わせ、それぞれのカテゴリに該当する度数や平均を集計した表を何と呼ぶか。492つの量的変数を持つデータについて、各データを点でプロットし、変数の関係性を視覚的に把握する図はどれか。50統計的仮説検定において、最初に「棄却(否定)すること」を目的として設定する仮説を何と呼ぶか。

② 検定・推定・評価指標

50

推測統計と分析評価の考え方を学ぶ分野です。区間推定と信頼区間、仮説検定(帰無仮説・対立仮説・p値・有意水準・第1種/第2種の過誤)、t検定・z検定などの検定手法、回帰分析、そしてAUCやF値・適合率・再現率といったモデルの評価指標が頻出です。あわせて標本誤差やバイアス、データの前処理・可視化の実務も問われます。用語が多く混同しやすいため、検定の流れと各指標が「何を測るか」を整理して覚えるのが得点のコツです。

512つの量的変数を持つデータがあったとき、その関係性を一度に把握するために用いられるグラフとして最も適切なものはどれか。52無作為に集めたデータから母集団の特徴や情報を推測する統計学を何と呼ぶか。53区間推定における信頼区間について、正しい説明はどれか。54統計的仮説検定において、「本来主張したい仮説」を否定するために立てる「棄却されることを目的とした仮説」を何と呼ぶか。55有意水準を5%と設定して統計的仮説検定を行った。計算されたp値が0.03であった場合の正しい判断はどれか。56統計的仮説検定における「第2種の過誤」の説明として最も適切なものはどれか。57コインの表が出る確率について「表が出やすい(確率が0.5より大きい)」という対立仮説を立てて検定を行う場合、どちらの検定...58対応のない2群の平均値の差の検定を行う際、2つの母集団の分散が等しいことを前提とする検定手法はどれか。592群の平均値の差の検定を行う際、母分散が「既知」である場合に用いる検定手法はどれか。60アソシエーション分析において、事象Xが起こったという条件下で事象Yが起こる割合を表す指標はどれか。61アソシエーション分析において、全事象の中で事象Xと事象Yが同時に起こる割合を表す指標はどれか。62アソシエーション分析におけるリフト値が示す意味として最も適切なものはどれか。63処置群と対照群に被験者を割り当てる際、他の要因が結果に与える影響を平均化するために無作為に割り当てる実験手法を何というか...64因果推論における「交絡因子」が満たすべき条件として、誤っているものはどれか。65分析対象者として選ばれた人と選ばれなかった人の間に存在する特性の違いによって生じる系統的な誤差を何というか。66データ集計において、集計仕様の誤りやデータの異常に気付くために有効な手段として推奨されているものはどれか。67分析用データのチェックにおいて、「データの質」に関する確認項目はどれか。68官公庁が提供するオープンデータを分析する際の心構えとして適切なものはどれか。69データ分析を進める上で、最も本質的で常に立ち返るべきものはどれか。70データ分析において比較対象や集計の切り口を設定する際、むやみに総当たりにするのではなく事前に何を立てておくことが重要か。71普段扱っているデータの基本統計量を絶えず観察することのメリットとして不適切なものはどれか。72時間の経過に従って記録されたデータにおいて、細かな変動を除いた全体の傾向を何というか。73時系列データのトレンドを把握するための代表的な手法はどれか。74互いに独立なランダムウォークである2つの時系列データの間に、有意な関係があるような結果が出てしまう現象を何というか。75母集団から無作為に抽出した標本によって得られる推計値と、母集団の真の値との差を何というか。76サンプリングバイアスに関する説明として最も適切なものはどれか。77フィッシャーによる実験計画法の3原則に含まれないものはどれか。78実験計画法において、取り上げる因子の数が多くすべての組み合わせでの試行が難しい場合、実験回数を効果的に削減するために用い...79「外れ値の中で外れている理由が判明しているもの」を指す用語はどれか。80データの標準化において、加工後のデータの平均と分散はそれぞれいくつになるか。81データの最大値を1、最小値を0にするよう変換する加工処理を何というか。82「駅前店」「郊外店」「住宅街店」の3つの水準を持つ名義尺度の変数を重回帰分析の説明変数として扱う場合、作成すべきダミー変...83データのスケールが大きく異なる場合や、分布が歪んでいる場合に分布の形状を整えるために用いられる代表的な変換手法はどれか。841つの変数ごとの基本統計量では外れ値が認められない場合でも、外れ値を発見できる可能性がある可視化手法はどれか。85データ可視化の3つの主な目的として挙げられている組み合わせで正しいものはどれか。86「電力消費量が何に強く関連するか把握する」ことを目的とした可視化で散布図を描く場合、縦軸(目的変数)に設定すべき項目はど...87データ可視化における層化(比較軸の候補出し)の観点として、テキストで挙げられている2つの観点はどれか。88膨大なデータを可視化する際、時間属性を平均化せず同一条件下におけるデータの集合平均を用いる手法を何というか。89箱ひげ図において、第3四分位数から第1四分位数を引いた値(四分位範囲)を2で割ったものを何というか。90分析担当者以外の人にデータを伝える際、「わかりやすさ」と並んで重要とされる可視化の目的はどれか。91グラフの過剰なビジュアル表現(チャートジャンク)を減らす指標となる「データインク比」が近づくべき理想的な値はどれか。92不必要な誇張にあたるグラフ表現として、適切でない(誇張ではない)ものはどれか。93量的変数をそのまま表現する際、色表現よりも効果的に伝わりやすいとされる表現方法はどれか。94複数の散布図をグリッド状に整列し、データセット内の複数の変数の関係性を同時に把握できるグラフを何というか。95単回帰分析の最小二乗法が最小化しようとするものは何か。96重回帰分析において、説明変数の数が増えるだけで1に近づいてしまう性質を持つ指標はどれか。97「購入したか・しないか」といった0/1の2値の発生確率を予測するのに適した回帰モデルはどれか。98ロジスティック回帰分析において、0から1までの確率を表現するために用いられる関数はどれか。99ROC曲線の下側の面積であるAUC(Area Under the Curve)について、モデルの精度が100%のときにと...100混同行列に基づく評価指標のうち、適合率(Precision)と再現率(Recall)の調和平均をとったバランスを重視する...

③ 機械学習・ディープラーニング

45

機械学習と深層学習の代表的な手法を学ぶ分野です。教師あり・教師なし学習の区別、ランダムフォレストや勾配ブースティングなどのアンサンブル学習、過学習と汎化性能、連合学習・転移学習といった学習パラダイム、そしてニューラルネットワークの基礎までが問われます。手法ごとに「何を得意とし、どんな課題があるか」を対比して押さえることが重要です。用語の丸暗記ではなく、各モデルの仕組みと使いどころを理解すると応用問題にも対応できます。

101汎化性能を向上させるために複数のモデルを組み合わせる手法を何と呼ぶか。102データの一部と特徴量をサンプリングしたデータでそれぞれ決定木を学習し、その多数決や平均を予測値とするモデルはどれか。103勾配ブースティングなどの決定木ベースのモデルにおいて、木の深さ(max_depth)を極端に大きな値に設定した場合に発生...104生データを共有せず、各拠点やデバイスで構築したモデルのパラメータのみを集約して一つのモデルに統合する学習手法はどれか。105モデルの予測性能を改善するためのアプローチに関する記述として、最も適切なものはどれか。106深層学習(ディープラーニング)のメリットとして適切なものはどれか。107データサイエンスにおいて、画像、音声、テキストといったデータの種類の違いを指す用語はどれか。108時系列データにおいて、長期間にわたる持続的な上昇や下降の変化傾向を何と呼ぶか。1091年や四半期など、一定の間隔で繰り返される時系列データの変動要因を何と呼ぶか。110教師なし学習に分類される分析手法はどれか。111未知の画像を「猫」か「犬」かに分類するモデルを構築する際、正解ラベル付きデータを用いて学習させる手法はどれか。112階層クラスター分析において、データがどのようにグループ化されていくかを距離に基づいて表した樹形図を何と呼ぶか。113k-means法に関する記述として、最も適切なものはどれか。114ネットワーク分析において、ものや人を表す点(頂点)を何と呼ぶか。115ネットワーク分析において、ノードに接続しているエッジの数を表す用語はどれか。116ユーザーが過去に高く評価したアイテムの属性(ジャンルや監督など)に類似した別のアイテムを推薦するアルゴリズムはどれか。117「ユーザーAがアイテムXを好むなら、アイテムXを好む別のユーザーBが高評価したアイテムYも好むだろう」という仮定に基づく...118自然言語処理の前処理において、単語の語形変化(時制など)を取り除き、表記を統一する処理を何と呼ぶか。119日本語の文章を「意味のある最小の塊」に分割し、それぞれの品詞を判別する処理を何と呼ぶか。120テキストから人名、組織名、地域名などの特定の情報を機械的に抽出するタスクを何と呼ぶか。121画像のデジタル表現において、画像を等間隔の格子状の点(ピクセル)に分割するプロセスを何と呼ぶか。122画像データの前処理において、画像の縦横比を保ったまま特定のサイズに収まるように拡大・縮小する処理はどれか。123画像内の物体が「どの位置にあるか」を四角い枠で囲んで特定し、その物体が何であるかを分類するタスクはどれか。124画像の1ピクセルごとにどのクラスに属するかを予測し、重なり合う同一クラスの物体を個別に区別しないタスクはどれか。125動画データにおいて、1秒間に表示される画像の枚数を表す単位はどれか。126人間の可聴領域に着目し、聞こえない音の情報を削ることでデータ量を圧縮する音声フォーマットはどれか。127大規模言語モデル(LLM)において、事実とは異なる内容や関連性の低い情報をまるで事実であるかのように生成してしまう現象を...128政府や自治体が公開しており、営利目的・非営利目的を問わず無償かつ機械判読可能な形で二次利用できるデータを何と呼ぶか。129システムの高可用性を高めるため、予備のサーバーを常に稼働状態にして本番機と同期させ、障害時に即座に切り替える構成はどれか...130データベースのバックアップにおいて、前回のバックアップ以降に変更された部分のみを保存し、バックアップ時間は短いが復元に手...131ソースコードを一切記述することなく、用意されたパーツを組み合わせてソフトウェアを開発できるツールを何と呼ぶか。132ホストOS上のカーネルを共有しつつプロセスを隔離することで、軽量で高速に仮想環境を構築できる技術の代表例はどれか。133クラウド事業者がインフラ構築からソフトウェアの運用管理までを一体として提供し、ユーザーが環境構築の手間なく利用できるサー...134ソフトウェア開発において、特定のプラットフォーム向けの機能を利用するためのプログラムやAPI、説明書などを一式まとめた開...135Webページからのデータ収集に関して、アクセス時の状況にかかわらず常に同じHTMLファイルが返却されるコンテンツを何と呼...136WebブラウザとWebサーバーの間で通信内容を暗号化し、盗聴や改ざんを防止するために使用される通信プロトコルはどれか。137特定のルールやフォーマット(行と列など)に従って記録され、リレーショナルデータベースなどで管理しやすいデータはどれか。138データベース設計において、エンティティ間の関係性(「1対多」など)を可視化するために用いられる図を何と呼ぶか。139データベースの正規化において、繰り返し項目を排除し、レコード単位でデータを扱えるようにする処理を何と呼ぶか。140データ分析基盤において、行単位での更新処理よりも、特定の列を対象とした大量データの集計や抽出に特化したデータベースのアー...141大規模なデータを複数のコンピュータに分散して並列処理する技術であり、メモリ上で処理を行うことで高速化を実現しているフレー...142一般的なリレーショナルデータベース(RDBMS)とは異なり、固定されたテーブル構造を持たず、大量のデータを分散処理するこ...143動画データを保存・再生する際に、映像や音声のデータを圧縮(エンコード)したり復元(デコード)したりするソフトウェアやアル...144深層学習モデルが学習に用いたデータセットに含まれる情報の偏りによって、特定の職業と性別を強く結びつけてしまうような現象の...145データベースから抽出したデータをExcelで読み込む際の注意点として、最も適切なものはどれか。

④ データ加工・DB・BI

30

データを扱うための実務スキルを学ぶ分野です。SQLによるデータ抽出(LIKE演算子や条件指定など)、正規表現によるパターン処理、HadoopのHDFSやSparkといった分散処理技術、NoSQLデータストア、クラウドのオブジェクトストレージ、BIツールによる可視化などが問われます。分析の前段となるデータの取得・加工・蓄積を横断的に扱う分野なので、各技術が「どんなデータをどう処理するのに向くか」を整理しながら学ぶと定着します。

146Hadoopの分散ファイルシステムであるHDFSの主な特徴として適切なものはどれか。147分散処理技術であるSparkの処理方式の特徴について正しい記述はどれか。148NoSQLデータストアの一般的な特徴として不適切な記述はどれか。149クラウド上のオブジェクトストレージを利用する際の注意点として適切なものはどれか。150SQLの抽出条件において特定のパターンに一致するデータを検索する演算子はどれか。151正規表現において「任意の半角数字以外」を表現する記述はどれか。152正規表現「A[0-9]{2}[^0-9]」が意図する文字列の抽出条件として適切なものはどれか。153SQLを用いた複数条件の並べ替え「ORDER BY 日付 ASC, 商品番号 DESC」の処理結果はどれか。154データAとデータBを結合し両方のデータに共通して存在するレコードのみを抽出する処理はどれか。155データクレンジングを実施する際の方針として最も適切なものはどれか。156マッピング処理においてマスターデータ(対応表)を利用する際の注意点はどれか。157母集団をいくつかの小集団に分けそこから無作為に小集団を選び全数調査するサンプリング手法はどれか。158プログラムで乱数を用いたランダムサンプリングを行う際の特徴として適切な記述はどれか。159データの基本的な特徴を表す基本統計量のうち「平均値からの散らばり具合を表す値」を示すものはどれか。160プログラミング言語における異なるデータ型同士の計算について適切な説明はどれか。161データ処理において変換元データと変換先データで文字コードが合っていない場合に発生する主な問題はどれか。162データ共有のフォーマット形式の一つである「JSON」の主な特徴はどれか。163RDBMSのテーブルにデータを挿入する際に設けられる「一意性制約」の説明として正しいものはどれか。164Web APIにおけるデータ取得方式「REST」の特徴として最も適切な記述はどれか。165ファイル共有サーバーにおけるFTP(File Transfer Protocol)の利用における一般的な留意点はどれか。166セルフBIツールに備わっている機能の一つである「ドリルダウン」の説明として正しいものはどれか。167データの視覚化において複数項目のデータの割合を比較するのに適しているグラフはどれか。168プログラミング言語「R」の主な特徴として適切な説明はどれか。169フローチャート図において判定処理を記載し条件によって処理を分岐させる際に使用される記号の形はどれか。170オブジェクト指向プログラミングにおいてクラス外からデータや処理を参照できないようにする仕組みはどれか。171オブジェクト指向において継承した機能の一部をサブクラスで変更し同じメソッド名で異なる振る舞いを持たせる仕組みはどれか。172データ処理における四則演算の基本的なルールとして適切なものはどれか。173BIツールにおけるセルフBIとエンタープライズBIの違いについて適切な記述はどれか。174SQLのフィルタリング処理において指定した範囲内にあるデータを抽出する演算子はどれか。175プログラミング言語のデータ型において、変数生成時に型宣言が不要な動的型付け言語の代表例はどれか。

⑤ データエンジニアリング力

45

システム開発とAI活用の実装面を学ぶ分野です。ホワイトボックステスト・ブラックボックステスト・境界値分析といったソフトウェアテストの手法、Pythonの機械学習ライブラリ、音声認識のWER(単語誤り率)などのAI精度評価、AIによるコードレビューといった開発現場での実践知識が問われます。データサイエンスを支えるエンジニアリングの土台なので、テスト技法やライブラリの役割を実務のイメージと結びつけて理解するのが効果的です。

176システムの内部構造を意識して行うテストを何と呼ぶか。177プログラムのフローチャートの分岐条件に着目し、分岐条件を網羅するようにテストする手法はどれか。178システムの入出力のみを意識して行うテストにおける「境界値分析」の説明として適切なものはどれか。179Pythonの機械学習ライブラリであり、豊富な外部ライブラリとして活用されるものはどれか。180音声認識APIの精度比較で用いられる「単語誤り率(WER)」の計算式に含まれない要素はどれか。181AIを用いたソースコードのレビュー機能を活用するメリットとして考えにくいものはどれか。182プログラムの実行時間を計測する際、OSが機能を使用している時間を表す指標はどれか。183Jupyter NotebookやRStudioのような、プログラムを段階的に実行して結果を確認できる開発環境を何と呼ぶ...184クラウド上の統合開発環境を利用するメリットとして適切でないものはどれか。185情報セキュリティにおける「機密性(Confidentiality)」を実現するための対策例として適切なものはどれか。186データが不正に改ざんされておらず、正確で完全であることを担保する情報セキュリティの要素はどれか。187情報セキュリティの「可用性(Availability)」を高めるための具体的な対策はどれか。188有用なソフトウェアに偽装してインストールされ、背後で不正侵入の裏口を作成するマルウェアはどれか。189勝手にファイルを暗号化し、復元のための身代金を要求するマルウェアはどれか。190他のプログラムを介在せず、ネットワーク経由で単独で複製して増殖するマルウェアはどれか。191ネットワークレベルでのアクセス権限管理において、利用される技術はどれか。192暗号化技術において、暗号化鍵と復号鍵が同一である方式を何と呼ぶか。193公開鍵暗号方式に関する説明として適切なものはどれか。194不特定の送信先に暗号化した通信を行う際、送信者が自らのデータを暗号化するために使用する鍵はどれか(受信者のみが解読できる...195データ送信者が本人であることを証明する「デジタル署名」を作成する際、送信者が使用する鍵はどれか。196公開鍵認証基盤(PKI)において、送信者と公開鍵の関係性を審査し、登録する組織を何と呼ぶか。197特定の文字列を非可逆な別の数値文字列に変換し、データの改ざん検出に用いられる技術はどれか。198ハッシュ関数に関する説明として適切なものはどれか。199異なるWebサイト間でWebサービスのアクセス権限の認可を行うための標準仕様はどれか。200機械学習で必要な特徴量の加工やパラメータチューニングなどの作業を自動化するサービスを何と呼ぶか。201分散リポジトリ方式を採用しており、ソースコードの変更履歴を柔軟に管理できるバージョン管理ツールはどれか。202機械学習モデルの開発から運用までのライフサイクルを統合し、継続的にモデルを発展させる実践的手法はどれか。203ITシステムの運用管理において、ログやデータをAI技術で分析し、運用を効率化・自動化するソリューションはどれか。204生成AIに対して、同じタスクの入出力のペアを数個与えることでパターンを学習させるプロンプト技法はどれか。205生成AIのAPIで、値を高くすると出力のランダム性が増し、低くするとより決定的になりやすいサンプリング温度のパラメータは...206画像生成AIにおいて、生成してほしくない要素や除外したい特徴を指定する手法を何と呼ぶか。207大規模言語モデル(LLM)を利用してコードを生成する際の注意点として適切なものはどれか。208大規模言語モデル(LLM)を用いてテスト用のダミーデータを生成する利点として適切なものはどれか。209MLOpsの運用フェーズにおいて、機械学習モデルの予測性能が劣化した場合に検討すべき対応はどれか。210ソフトウェア開発でソースファイルを蓄積し、更新履歴を追跡管理するための機能として正しいものはどれか。211AIOpsの活用事例において、ログ分析の結果からシステム設定を変更し最高のパフォーマンスを出せるようにする取り組みを何と...212生成AIに複雑なタスクを解決させる際、思考過程の複数のステップを順番に示してから実行させるプロンプト技法はどれか。213画像生成AIにおいて、入力テキストに特定の記号を追加してプロンプトの影響を強め、指定した色や形を際立たせる手法はどれか。214OAuthの仕組みにおいて、利用者が認証成功後に認可サーバから取得し、リソースサーバに渡すものはどれか。215セキュリティの3要素(CIA)の要件実現を求めている、情報セキュリティマネジメントシステム(ISMS)の標準規格はどれか...216マルウェアの侵入を防ぐために、データサイエンティストを含む一般ユーザーに求められる行動として適切なものはどれか。217AutoMLが内部で行う処理として通常含まれないものはどれか。218クラウドサービスにおける従量課金制の環境下で、効率の良いプログラムを書く主な利点はどれか。219ハッシュ関数の性質として正しいものはどれか。220大規模言語モデルで生成したダミーデータをビジネス分析に利用する際のリスクとして適切なものはどれか。

⑥ ビジネス力

50

データ分析を課題解決につなげる思考力を学ぶ分野です。分析の目的設定と論理構成、仮説の立て方と検証、KGI・KPIとの関連付け、依頼を受けたときの初動対応、課題や仮説の言語化など、分析プロジェクトを前に進めるための考え方が問われます。技術力だけでなく「何のために分析するか」を見失わない姿勢が重視されるのが特徴です。ケーススタディ形式の出題も多いため、目的から逆算して仮説とデータを結びつける練習を積みましょう。

221データ分析を行う際、目的と論理構成、データの関係性について適切なものはどれか。222「売上を上げたい」という目的を達成するための仮説として不適切なものはどれか。223「平均客単価を上げることはできるか」という仮説を検証するためのデータとして最も適切なものはどれか。224プロジェクト活動中、KGIやKPIと関連付けて分析を行うことを何と呼ぶか。225「顧客データがあるから何か分析してほしい」と依頼された場合の初動として適切な対応はどれか。226分析プロジェクトにおける課題や仮説の言語化に関する説明として、適切なものはどれか。227問いに対する主張と根拠を論理的に構成し、筋道を立てて説明できる能力を何と呼ぶか。228データ分析において、現場に出向いて業務担当者にヒアリングするなどの活動から得られる情報を何というか。229現場担当者から「最近40代男性向けに販促した」という情報を得た。このような分析の前提となる条件を何と呼ぶか。230データサイエンティストが新しい技術に対して探究心を持つ理由として不適切なものはどれか。231データサイエンスにおける不正行為「FFP」に該当しないものはどれか。232存在しないデータを作成し、分析結果として報告する行為はどれに該当するか。233深層学習技術を用いて、実在しない人物の画像や音声を本物のように生成する技術を何と呼ぶか。234AIの公平性を保つための対策として不適切なものはどれか。235EU一般データ保護規則の略称として適切なものはどれか。236個人情報を他の情報と照合しない限り、特定の個人を識別できないように加工して得られる個人に関する情報を何と呼ぶか。237論理的思考の基本である「MECE」が意味する状態として適切なものはどれか。238来店手段を「公共交通機関」「電車」「バス」「徒歩」に分類した。この分類のMECEの観点からの問題点はどれか。239与えられた分析課題に対し、初動で行うべきこととして不適切なものはどれか。240データ集計結果のグラフから「日中の時間帯に数値が上昇している」と読み取ることを何というか。241グラフから読み取った事実に対し、「人が出入りすることで数値が変化した」と推察することを何というか。242一般的な論文の構成において、「先行事例・研究」の項目で言及すべき内容として適切なものはどれか。243レポート作成時、外部から取得した二次データを用いる際の対応として不適切なものはどれか。244論理的な構成を作るための「空・雨・傘」のフレームワークにおいて、「雨」が意味するものはどれか。245「WHYの並び立て」と呼ばれるピラミッド構造の特徴として適切なものはどれか。246関係者への報告時に論拠不足を指摘された際、データサイエンティストがとるべき行動として不適切なものはどれか。247生成AIサービスを業務で活用する際のデータサイエンティストの役割として不適切なものはどれか。248事業の収益モデルにおいて、「重要業績評価指標」を表す略語はどれか。249KGIとKPIの関係性について適切な説明はどれか。250分析対象の事業領域を理解する上で把握すべき項目として不適切なものはどれか。251調達部門などの課題を整理する際、品質・価格・納期の3要素を表すフレームワークはどれか。252自社の競争優位性を探る「5フォース分析」の5つの要因に含まれないものはどれか。253分析プロジェクトのスコープを定義する際に把握すべき要素として不適切なものはどれか。254仮説検証に必要なデータを入手する際の検討事項として不適切なものはどれか。255分析アプローチの設計において、仮説を立てた後に行う手順として適切なものはどれか。256大規模言語モデルが事実と異なる内容をさも正しいかのように生成する現象を何というか。257ハルシネーションが発生する原因として考えにくいものはどれか。258ハルシネーションに対処するためのアクションとして不適切なものはどれか。259オリンピックの国別メダル獲得数を比較する際、実数ではなく人口比やGDP比で比較する理由として適切なものはどれか。260統計情報やグラフを見る際の「エビデンスベースト」な姿勢として適切なものはどれか。261メディアのグラフにおいて、データの差異を誇張するために使われやすい不適切な手法はどれか。262データ分析の結果が当初のビジネス仮説と異なった場合の対応として適切なものはどれか。263仮説と異なる結果が出た際、ステークホルダーに受け入れてもらうための行動として不適切なものはどれか。264物流データの時系列グラフに極端な落ち込みが見られた際、「災害による影響ではないか」と考えることを何というか。265分析モデルを業務システムに実装した後、想定した成果が出ているかを継続的に評価・改善する活動を何というか。266二者間で営業や技術に関する情報を開示する際、情報の漏洩を防ぐために締結する契約はどれか。267業務委託契約のうち、受託者が「仕事の完成」を約束し、それと引き換えに報酬が支払われる契約形態はどれか。268組織内でAIやデータを活用する際のガイドラインに関する姿勢として不適切なものはどれか。269分析作業において、スケジュールを遵守するための行動として不適切なものはどれか。270プロジェクトで遅延や障害を発見した際の対応として最も適切なものはどれか。

⑦ 数理・DS・AIモデルカリキュラム

30

社会におけるAI・データ活用の全体像を学ぶ分野です。Society 5.0の概念、バリューチェーンや事業活動の各領域でのAI活用例(研究開発・ダイナミックプライシング・チャットボットなど)、生成AIとプロンプトエンジニアリング、AI活用に求められる能力などが問われます。数理・DS・AIを社会実装の視点でとらえる分野なので、技術そのものより「どの場面で何のために使うか」という活用の文脈を押さえることが得点につながります。

271Society 5.0の説明として最も適切なものはどれか。272Society 5.0が提唱される前の「Society 4.0」は何を指すか。273Society 5.0の仕組みにおいて新たな価値が生み出されるプロセスとして適切なものはどれか。274バリューチェーンにおける「研究開発」領域でのAI活用例として最も適切なものはどれか。275需要と供給に応じて価格を変動させる「ダイナミックプライシング」は事業活動のどの領域の取り組みか。276コールセンターの問い合わせ対応をチャットボットで自動化する取り組みは事業活動のどの領域に該当するか。277生成AIへ適切な指示や命令を行う技術を指す用語はどれか。278生成AIを活用する上で求められる能力として最も関連が薄いものはどれか。279データを比較する際に同じ性質を持っているもの同士を比較することを指す言葉はどれか。280スーパーマーケットの売上データを前年と比較する際の適切な比較対象の設定方法はどれか。281統計情報を読み解く際の留意点として適切なものはどれか。282データを適切に説明するスキルとして誤っているものはどれか。283小規模なデータを集計や加工する際に主に利用されるツールはどれか。284「異なる性質のものを比較してしまうこと」を例えた表現はどれか。285データサイエンスにおける「ELSI」が意味する3つの課題とはどれか。286「人間中心のAI社会原則」で示されている3つの基本理念に含まれないものはどれか。287「人間中心のAI社会原則」における「プライバシー確保の原則」の説明として適切なものはどれか。288生成AIが事実と異なる内容をさも正しいかのように生成してしまう現象を何というか。289生成AIのハルシネーションに対する適切な対応策はどれか。290生成AIの学習データが偏っている場合に発生しやすい問題はどれか。291情報セキュリティの3要素として正しい組み合わせはどれか。292データ駆動型社会における個人のデータ保護に関する国際的な規則はどれか。293AIが社会に受け入れられるために「人間中心のAI社会原則」が求めていることとして不適切なものはどれか。294バリューチェーンの「製造」領域におけるデータ活用例として適切なものはどれか。295バリューチェーンの「物流」領域におけるデータ活用例として適切なものはどれか。296生成AIを悪用するリスクとして該当しないものはどれか。297データを正しく読み解くための「母集団と標本」に関する概念として関連が薄いものはどれか。298社会におけるデータ・AIの利活用においてデータの「メタ化」が含まれる学修項目はどれか。299「人間中心のAI社会原則」における「公平性、説明責任及び透明性の原則」が防ごうとしている事態はどれか。300Society 5.0においてIoTが果たす役割として適切なものはどれか。
データサイエンティスト検定リテラシーレベルトップへ戻る