Search test library by skills or roles
⌘ K

About the test:

データサイエンス評価テストは、統計、確率、線形および非線形回帰モデル、およびデータを分析してPython/ Rを活用してデータから洞察を抽出する能力における候補者の習熟度を評価します。

Covered skills:

  • 機械学習技術
  • RまたはPythonを使用した分析
  • データ操作
  • 回帰分析
  • 予測モデリング
  • データの視覚化
  • 探索的データ分析
  • 統計
  • データクレンジング

9 reasons why
9 reasons why

Adaface Data Science Test is the most accurate way to shortlist データサイエンティストs



Reason #1

Tests for on-the-job skills

The Data Science Assessment Test helps recruiters and hiring managers identify qualified candidates from a pool of resumes, and helps in taking objective hiring decisions. It reduces the administrative overhead of interviewing too many candidates and saves time by filtering out unqualified candidates at the first step of the hiring process.

The test screens for the following skills that hiring managers look for in candidates:

  • データ分析に確率の概念と原則を適用する能力
  • 統計データを分析および解釈する能力
  • 機械学習アルゴリズムとテクニックを実装する能力
  • データを視覚化して効果的に提示する能力
  • RまたはPythonを使用してデータ分析と探索を実行する能力
  • データを効率的に操作して変換する機能
  • 回帰分析で統計的概念を理解して適用する能力
  • 分析のためにデータをクリーニングして前処理する能力
  • さまざまなデータシナリオの予測モデルを開発する機能
Reason #2

No trick questions

no trick questions

Traditional assessment tools use trick questions and puzzles for the screening, which creates a lot of frustration among candidates about having to go through irrelevant screening assessments.

View sample questions

The main reason we started Adaface is that traditional pre-employment assessment platforms are not a fair way for companies to evaluate candidates. At Adaface, our mission is to help companies find great candidates by assessing on-the-job skills required for a role.

Why we started Adaface
Reason #3

Non-googleable questions

We have a very high focus on the quality of questions that test for on-the-job skills. Every question is non-googleable and we have a very high bar for the level of subject matter experts we onboard to create these questions. We have crawlers to check if any of the questions are leaked online. If/ when a question gets leaked, we get an alert. We change the question for you & let you know.

How we design questions

これらは、10,000以上の質問のライブラリからのわずかなサンプルです。これに関する実際の質問 データサイエンス評価テスト グーグルできません.

🧐 Question

Medium

Amazon electronics product feedback
Solve
Amazon's electronics store division has over the last few months focused on getting customer feedback on their products, and marking them as safe/ unsafe. Their data science team has used decision trees for this. 
The training set has these features: product ID, data, summary of feedback, detailed feedback and a binary safe/unsafe tag. During training, the data science team dropped any feedback records with missing features. The test set has a few records with missing "detailed feedback" field. What would you recommend?
A: Remove the test samples with missing detailed feedback text fields
B: Generate synthetic data to fill in missing fields
C: Use an algorithm that handles missing data better than decision trees
D: Fill in the missing detailed feedback text field with the summary of feedback field.

Easy

Fraud detection model
Logistic Regression
Solve
Your friend T-Rex is working on a logistic regression model for a bank, for a fraud detection usecase. The accuracy of the model is 98%. T-Rex's manager's concern is that 85% of fraud cases are not being recognized by the model. Which of the following will surely help the model recognize more than 15% of fraud cases?

Medium

Rox's decision tree classifier
Decision Tree Classifier
Solve
Your data science intern Rox was asked to create a decision tree classifier with 12 input variables. The tree used 7 of the 12 variables, and was 5 levels deep. Few nodes of the tree contain 3 data points. The area under the curve (AUC) is 0.86. As Rox's mentor, what is your interpretation?
A. The AUC is high, and the small nodes are all very pure- the model looks accurate.
B. The tree might be overfitting- try fitting shallower trees and using an ensemble method.
C. The AUC is high, so overall the model is accurate. It might not be well-calibrated, because the small nodes will give poor estimates of probability.
D. The tree did not split on all the input variables. We need a larger data set to get a more accurate model.

Easy

Gradient descent optimization
Gradient Descent
Solve
You are working on a regression problem using a simple neural network. You want to optimize the model's weights using gradient descent with different learning rate schedules. Consider the following pseudo code for training the neural network:
 image
Which of the following learning rate schedules would most likely result in the fastest convergence without overshooting the optimal weights?

A: Constant learning rate of 0.01
B: Exponential decay with initial learning rate of 0.1 and decay rate of 0.99
C: Exponential decay with initial learning rate of 0.01 and decay rate of 0.99
D: Step decay with initial learning rate of 0.1 and decay rate of 0.5 every 100 epochs
E: Step decay with initial learning rate of 0.01 and decay rate of 0.5 every 100 epochs
F: Constant learning rate of 0.1

Medium

Less complex decision tree model
Model Complexity
Overfitting
Solve
You are given a dataset to solve a classification problem using a decision tree algorithm. You are concerned about overfitting and decide to implement pruning to control the model's complexity. Consider the following pseudo code for creating the decision tree model:
 image
Which of the following combinations of parameters would result in a less complex decision tree model, reducing the risk of overfitting?

A: max_depth=5, min_samples_split=2, min_samples_leaf=1
B: max_depth=None, min_samples_split=5, min_samples_leaf=5
C: max_depth=3, min_samples_split=2, min_samples_leaf=1
D: max_depth=None, min_samples_split=2, min_samples_leaf=1
E: max_depth=3, min_samples_split=10, min_samples_leaf=10
F; max_depth=5, min_samples_split=5, min_samples_leaf=5

Easy

n-gram generator
Solve
Our newest machine learning developer want to write a function to calculate the n-gram of any text. An N-gram means a sequence of N words. So for example, "black cats" is a 2-gram, "saw black cats" is a 3-gram etc. The 2-gram of the sentence "the big bad wolf fell down" would be [["the", "big"], ["big", "bad"], ["bad", "wolf"], ["wolf", "fell"], ["fell", "down"]]. Can you help them select the correct function for the same?
 image

Easy

Recommendation System Selection
Recommender Systems
Collaborative Filtering
Content-Based Filtering
Solve
You are tasked with building a recommendation system for a newly launched e-commerce website. Given that the website is new, there is not much user interaction data available. Also, the items in the catalog have rich descriptions. Based on these requirements, which type of recommendation system approach would be the most suitable for this task?

Easy

Sensitivity and Specificity
Confusion Matrix
Model Evaluation
Solve
You have trained a supervised learning model to classify customer reviews as either "positive" or "negative" based on a dataset with 10,000 samples and 35 features, including the review text, reviewer's name, and rating. The dataset is split into a 7,000-sample training set and a 3,000-sample test set.

After training the model, you evaluate its performance using a confusion matrix on the test set, which shows the following results:
 image
Based on the confusion matrix, what are the sensitivity and specificity of the model?

Medium

Green or red balls
Solve
A bag contains 5 red balls, 6 yellow balls and 3 green balls. If two balls are picked at random, what is the probability that both are red or both are green in colour?

Hard

Square points and Circle
Solve
What is the probability that two uniformly random points in the square are such that center of the square lies in the circle formed by taking the points as diameter

Easy

Frequency distribution
Solve
Convert the following into an ordinary frequency distribution:

- 5 users gave less than 3 rating
- 12 users gave less than 6 rating
- 25 users gave less than 9 ratings
- 33 users get less than 12 ratings
 image
🧐 Question🔧 Skill

Medium

Amazon electronics product feedback

2 mins

Data Science
Solve

Easy

Fraud detection model
Logistic Regression

2 mins

Data Science
Solve

Medium

Rox's decision tree classifier
Decision Tree Classifier

2 mins

Data Science
Solve

Easy

Gradient descent optimization
Gradient Descent

2 mins

Machine Learning
Solve

Medium

Less complex decision tree model
Model Complexity
Overfitting

2 mins

Machine Learning
Solve

Easy

n-gram generator

2 mins

Machine Learning
Solve

Easy

Recommendation System Selection
Recommender Systems
Collaborative Filtering
Content-Based Filtering

2 mins

Machine Learning
Solve

Easy

Sensitivity and Specificity
Confusion Matrix
Model Evaluation

2 mins

Machine Learning
Solve

Medium

Green or red balls

2 mins

Probability
Solve

Hard

Square points and Circle

3 mins

Probability
Solve

Easy

Frequency distribution

3 mins

Statistics
Solve
🧐 Question🔧 Skill💪 Difficulty⌛ Time
Amazon electronics product feedback
Data Science
Medium2 mins
Solve
Fraud detection model
Logistic Regression
Data Science
Easy2 mins
Solve
Rox's decision tree classifier
Decision Tree Classifier
Data Science
Medium2 mins
Solve
Gradient descent optimization
Gradient Descent
Machine Learning
Easy2 mins
Solve
Less complex decision tree model
Model Complexity
Overfitting
Machine Learning
Medium2 mins
Solve
n-gram generator
Machine Learning
Easy2 mins
Solve
Recommendation System Selection
Recommender Systems
Collaborative Filtering
Content-Based Filtering
Machine Learning
Easy2 mins
Solve
Sensitivity and Specificity
Confusion Matrix
Model Evaluation
Machine Learning
Easy2 mins
Solve
Green or red balls
Probability
Medium2 mins
Solve
Square points and Circle
Probability
Hard3 mins
Solve
Frequency distribution
Statistics
Easy3 mins
Solve
Reason #4

1200+ customers in 75 countries

customers in 75 countries
Brandon

Adaface を使用することで、最初の選考プロセスを 75% 以上最適化することができ、採用担当マネージャーと人材獲得チームの両方にとって貴重な時間を同様に解放することができました。


Brandon Lee, 人々の責任者, Love, Bonito

Reason #5

Designed for elimination, not selection

The most important thing while implementing the pre-employment データサイエンス評価テスト in your hiring process is that it is an elimination tool, not a selection tool. In other words: you want to use the test to eliminate the candidates who do poorly on the test, not to select the candidates who come out at the top. While they are super valuable, pre-employment tests do not paint the entire picture of a candidate’s abilities, knowledge, and motivations. Multiple easy questions are more predictive of a candidate's ability than fewer hard questions. Harder questions are often "trick" based questions, which do not provide any meaningful signal about the candidate's skillset.

Science behind Adaface tests
Reason #6

1 click candidate invites

Email invites: You can send candidates an email invite to the データサイエンス評価テスト from your dashboard by entering their email address.

Public link: You can create a public link for each test that you can share with candidates.

API or integrations: You can invite candidates directly from your ATS by using our pre-built integrations with popular ATS systems or building a custom integration with your in-house ATS.

invite candidates
Reason #7

Detailed scorecards & benchmarks

サンプルスコアカードを表示します
Reason #8

High completion rate

Adaface tests are conversational, low-stress, and take just 25-40 mins to complete.

This is why Adaface has the highest test-completion rate (86%), which is more than 2x better than traditional assessments.

test completion rate
Reason #9

Advanced Proctoring


Learn more

About the Data Science Online Test

Why you should use Pre-employment Data Science Assessment Test?

The データサイエンス評価テスト makes use of scenario-based questions to test for on-the-job skills as opposed to theoretical knowledge, ensuring that candidates who do well on this screening test have the relavant skills. The questions are designed to covered following on-the-job aspects:

  • データサイエンスにおける確率理論とその応用の強力な理解を示します。
  • 統計的概念と手法を適用して、データを分析および解釈します。
  • 機械学習アルゴリズムとモデルを利用して、実際の問題を解決します。
  • 視覚的に魅力的なデータの視覚化を作成して、洞察を効果的に伝えます。
  • データ分析と操作にRまたはPythonプログラミング言語を使用します。
  • 洞察を得てパターンを特定するために、包括的な探索的データ分析を実施します。
  • データをクリーニングおよび前処理するためのデータ操作手法の習熟度を示します。
  • 回帰分析を適用して、予測モデルを開発し、正確な予測を行います。
  • データの品質と整合性を確保するために、データクレンジングの高度なスキルを持っています。
  • データ駆動型の決定を下すための予測モデリング手法を活用します。

Once the test is sent to a candidate, the candidate receives a link in email to take the test. For each candidate, you will receive a detailed report with skills breakdown and benchmarks to shortlist the top candidates from your pool.

What topics are covered in the Data Science Assessment Test?

  • 機械学習技術:

    機械学習技術は、明示的にプログラムされることなくデータから自動的に学習および改善できるモデルをトレーニングするために使用されるアルゴリズムと方法を指します。このスキルは、データサイエンスの基本的なコンポーネントであるため、テストで測定する必要があり、データサイエンティストが予測モデルを開発し、データ駆動型の決定を下すことができます。

  • データ視覚化:

    データ視覚化には、洞察とパターンを効果的に伝えるために、データの視覚的表現を作成することが含まれます。データ科学者が意味のある理解しやすい方法で複雑なデータを提示し、より良い意思決定とコミュニケーションを促進することが不可欠であるため、このスキルはテストで測定する必要があります。

  • RまたはPython:</h4 > <p> RまたはPythonを使用した分析とは、RやPythonなどのプログラミング言語を使用して、データ分析、統計モデリング、および機械学習タスクを実行することを指します。このスキルは、データサイエンスプロジェクトにプログラミングスキルを適用する候補者の能力、データの取り扱いと分析アルゴリズムの実装に熟練する能力を評価するため、テストで測定する必要があります。</p> <h4>探索的データ分析:</h4> < P>探索的データ分析では、データを調べて変換して、その主な特性、パターン、および関係を理解し​​ます。このスキルは、生データから意味のある洞察を抽出し、潜在的な問題を特定し、さらなる分析のために仮説を生成する候補者の能力を示すため、テストで測定する必要があります。</p> <h4>データ操作:

    データ操作とは、データを変換、再フォーマット、またはクレンジングするプロセスを指し、分析に適したものにします。このスキルは、データの取り扱いと準備における候補者の習熟度を評価するため、テストで測定する必要があります。これは、分析またはモデリングタスクを実行する前にデータサイエンスワークフローの重要なステップです。

  • 統計:

    統計には、データの収集、分析、解釈、プレゼンテーション、および構成が含まれます。このスキルは、候補者の統計的概念と技術の理解と適用をテストするため、テストで測定する必要があります。これらは、堅牢で有効なデータ分析を実施するために不可欠です。

  • 回帰分析:

    回帰分析は、従属変数と1つ以上の独立変数の関係をモデル化するために使用される統計的手法です。このスキルは、回帰分析を実行する候補者の能力を評価しているため、テストで測定する必要があります。これは、予測モデリングに広く使用され、関心のある結果に対する変数の影響を理解しています。

  • Full list of covered topics

    The actual topics of the questions in the final test will depend on your job description and requirements. However, here's a list of topics you can expect the questions for データサイエンス評価テスト to be based on.

    確率分布
    仮説テスト
    中心極限定理
    信頼区間
    線形回帰
    ロジスティック回帰
    決定木
    ランダムフォレスト
    ベクターマシンをサポートします
    k-nearest Neighbors
    素朴なベイズ
    k-meansクラスタリング
    階層クラスタリング
    主成分分析
    データ視覚化手法
    データ視覚化ライブラリ(例:matplotlib、ggplot)
    データ探索手法
    探索的データ分析
    RまたはPythonによるデータ操作
    データクリーニング手法
    不足しているデータ代入
    外れ値の検出
    機能エンジニアリング
    相関分析
    ANOVA
    時系列分析
    A/Bテスト
    モデルの評価と検証
    相互検証技術
    機能選択方法
    次元削減技術
    アンサンブル学習
    過剰適合と装着
    正規化手法
    バイアス分散トレードオフ
    データの前処理
    正規化
    標準化
    ワンホットエンコーディング
    データスケーリング
    再サンプリング方法
    データ分割手法
    モデル評価メトリック
    R-squared
    平均二乗エラー
    正確さ
    精度とリコール
    F1スコア
    ROC曲線分析
    ハイパーパラメーターチューニング
    グリッド検索
    相互検証ハイパーパラメーターチューニング
    モデルの展開
    API統合
    モデルの解釈と説明
    解釈可能な機械学習モデル
    Shapley値

What roles can I use the Data Science Assessment Test for?

  • データサイエンティスト
  • データアナリスト
  • 機械学習エンジニア
  • データエンジニア
  • ビジネスアナリスト
  • 統計アナリスト
  • AIエンジニア
  • 人工知能の役割

How is the Data Science Assessment Test customized for senior candidates?

For intermediate/ experienced candidates, we customize the assessment questions to include advanced topics and increase the difficulty level of the questions. This might include adding questions on topics like

  • 分類およびセグメンテーション分析のためにクラスタリングアルゴリズムを利用します。
  • 時系列分析を適用して、将来の傾向とパターンを予測します。
  • 自然言語処理アルゴリズムと手法の知識を示します。
  • 機能の選択と抽出技術を利用して、モデルのパフォーマンスを向上させます。
  • データの視覚化と分析に次元削減方法を使用します。
  • モデルの精度とパフォーマンスを改善するために、アンサンブル学習技術を適用します。
  • MATPLOTLIBやGGPLOTなどのライブラリを使用して、データの視覚化に強いスキルを持っています。
  • 統計テストと仮説検査を利用して、データ駆動型の決定を下します。
  • データセットの欠損値を処理するために、データの代入技術を使用します。
  • 相互検証技術を適用して、モデルのパフォーマンスを評価し、過剰適合を防ぎます。
  • さまざまな手法を使用して、不均衡なデータセットの処理に関する専門知識を実証します。
Singapore government logo

採用担当者は、パネル面接中に尋ねる専門的な質問を通じて、どの候補者がより良いスコアを持っているかを判断し、スコアが低い候補者と区別できると感じました。彼らです 非常に満足 Adaface のスクリーニングで最終候補者リストに選ばれた候補者の質を重視します。


85%
スクリーニング時間の短縮

Data Science Hiring Test よくある質問

データ サイエンスのオンライン テストにはどのような種類の問題が含まれますか?

データ サイエンス テストでは、候補者の次の能力に焦点を当てたシナリオ ベースの質問で、候補者の実務スキル レベルを評価します。

  • データをクリーンアップして異常を探す
  • トレーニング/テストデータと K-Fold 相互検証を使用して、堅牢なモデルを構築します
  • 線形回帰、多項式回帰、多変量回帰を使用して予測を行う
  • K-Means クラスタリング、サポート ベクター マシン (SVM)、KNN、デシジョン ツリー、ナイーブ ベイズ、および PCA を使用してデータを分類する
  • 混同行列を読む
  • バイアス/分散のトレードオフと過剰適合を理解する
  • 後方消去法、前方選択法、双方向消去法を使用して統計モデルを作成する
  • 独立変数を変換し、モデリング目的で新しい独立変数を導出する
  • 多重共線性をチェックする
  • モデルの劣化を理解して防止する

テストは上級データ サイエンティスト向けにどのようにカスタマイズされますか?

上記のトピックに加えて、上級データ サイエンティスト向けのテストには、次のような高度なトピックに関する質問も含まれています。

  • 大規模な非構造化データセットから洞察を生成するための高度なデータ操作
  • 特徴量エンジニアリング
  • ハイパーパラメータ調整
  • 強化学習
  • 次元削減
  • 高度な統計分析

データ サイエンス テストでは、データ サイエンスの適性や特定のテクノロジーを評価しますか?

このテストのすぐに使えるバージョンは、確率、統計、機械学習といったデータ サイエンスの適性に焦点を当てています。特定のテクノロジーをテストしたい場合は、このテストのカスタム バージョンをリクエストできます。

複数のスキルを1つのカスタム評価に組み合わせることはできますか?

そのとおり。カスタム評価は、職務内容に基づいて設定され、指定したすべての必須スキルに関する質問が含まれます。

アンチチートまたは監督の機能はありますか?

次のアンチチート機能があります。

  • グーグル不可能な質問
  • IP監督
  • Webの提案
  • ウェブカメラの監督
  • 盗作の検出
  • 安全なブラウザ

[プロクチャリング機能](https://www.adaface.com/proctoring)の詳細をご覧ください。

テストスコアを解釈するにはどうすればよいですか?

留意すべき主なことは、評価が選択ツールではなく排除ツールであることです。スキル評価が最適化され、技術的にその役割の資格がない候補者を排除するのに役立ちます。これは、役割の最良の候補者を見つけるのに役立つために最適化されていません。したがって、評価を使用する理想的な方法は、しきい値スコア(通常は55%、ベンチマークを支援します)を決定し、インタビューの次のラウンドのしきい値を超えてスコアを上回るすべての候補者を招待することです。

このテストを使用できますか?

各ADAFACE評価は、職務記述書/理想的な候補者のペルソナにカスタマイズされます(当社の主題の専門家は、10000以上の質問のライブラリからあなたの評価に適切な質問を選択します)。この評価は、あらゆる経験レベルでカスタマイズできます。

すべての候補者は同じ質問を受け取りますか?

私は候補者です。練習テストを試すことはできますか?

いいえ。残念ながら、現時点では練習テストをサポートしていません。ただし、[サンプルの質問](https://www.adaface.com/questions)を使用するには、練習できます。

このテストを使用するコストはいくらですか?

無料トライアルを受けることはできますか?

私はちょうど有料プランに移りました。カスタム評価をリクエストするにはどうすればよいですか?

customers across world
Join 1200+ companies in 75+ countries.
今日、最も候補者のフレンドリーなスキル評価ツールをお試しください。
g2 badges
Ready to use the Adaface データサイエンス評価テスト?
Ready to use the Adaface データサイエンス評価テスト?
私たちとしゃべる
ada
Ada
● Online
Previous
Score: NA
Next
✖️