Search test library by skills or roles
⌘ K

About the test:

Le test d'évaluation des sciences des données évalue la maîtrise d'un candidat en matière de statistiques, de probabilité, de modèles de régression linéaire et non linéaire et de leur capacité à analyser les données et à tirer parti de Python / R pour extraire les informations des données.

Covered skills:

  • Techniques d'apprentissage automatique
  • Analytique avec r ou python
  • Manipulation de données
  • Analyse de régression
  • Modélisation prédictive
  • Visualisation de données
  • L'analyse exploratoire des données
  • Statistiques
  • Nettoyage des données

9 reasons why
9 reasons why

Adaface Data Science Test is the most accurate way to shortlist Data scientifiques



Reason #1

Tests for on-the-job skills

The Data Science Assessment Test helps recruiters and hiring managers identify qualified candidates from a pool of resumes, and helps in taking objective hiring decisions. It reduces the administrative overhead of interviewing too many candidates and saves time by filtering out unqualified candidates at the first step of the hiring process.

The test screens for the following skills that hiring managers look for in candidates:

  • Capacité à appliquer des concepts de probabilité et des principes dans l'analyse des données
  • Capacité à analyser et à interpréter les données statistiques
  • Capacité à mettre en œuvre des algorithmes et techniques d'apprentissage automatique
  • Capacité à visualiser et à présenter efficacement les données
  • Capacité à effectuer l'analyse et l'exploration des données à l'aide de R ou Python
  • Capacité à manipuler et à transformer efficacement les données
  • Capacité à comprendre et à appliquer des concepts statistiques dans l'analyse de régression
  • Capacité à nettoyer et à prétraiter les données pour l'analyse
  • Capacité à développer des modèles prédictifs pour divers scénarios de données
Reason #2

No trick questions

no trick questions

Traditional assessment tools use trick questions and puzzles for the screening, which creates a lot of frustration among candidates about having to go through irrelevant screening assessments.

View sample questions

The main reason we started Adaface is that traditional pre-employment assessment platforms are not a fair way for companies to evaluate candidates. At Adaface, our mission is to help companies find great candidates by assessing on-the-job skills required for a role.

Why we started Adaface
Reason #3

Non-googleable questions

We have a very high focus on the quality of questions that test for on-the-job skills. Every question is non-googleable and we have a very high bar for the level of subject matter experts we onboard to create these questions. We have crawlers to check if any of the questions are leaked online. If/ when a question gets leaked, we get an alert. We change the question for you & let you know.

How we design questions

Ce ne sont qu'un petit échantillon de notre bibliothèque de plus de 10 000 questions. Les questions réelles à ce sujet Test d'évaluation des sciences des données ne sera pas googleable.

🧐 Question

Medium

Amazon electronics product feedback
Solve
Amazon's electronics store division has over the last few months focused on getting customer feedback on their products, and marking them as safe/ unsafe. Their data science team has used decision trees for this. 
The training set has these features: product ID, data, summary of feedback, detailed feedback and a binary safe/unsafe tag. During training, the data science team dropped any feedback records with missing features. The test set has a few records with missing "detailed feedback" field. What would you recommend?
A: Remove the test samples with missing detailed feedback text fields
B: Generate synthetic data to fill in missing fields
C: Use an algorithm that handles missing data better than decision trees
D: Fill in the missing detailed feedback text field with the summary of feedback field.

Easy

Fraud detection model
Logistic Regression
Solve
Your friend T-Rex is working on a logistic regression model for a bank, for a fraud detection usecase. The accuracy of the model is 98%. T-Rex's manager's concern is that 85% of fraud cases are not being recognized by the model. Which of the following will surely help the model recognize more than 15% of fraud cases?

Medium

Rox's decision tree classifier
Decision Tree Classifier
Solve
Your data science intern Rox was asked to create a decision tree classifier with 12 input variables. The tree used 7 of the 12 variables, and was 5 levels deep. Few nodes of the tree contain 3 data points. The area under the curve (AUC) is 0.86. As Rox's mentor, what is your interpretation?
A. The AUC is high, and the small nodes are all very pure- the model looks accurate.
B. The tree might be overfitting- try fitting shallower trees and using an ensemble method.
C. The AUC is high, so overall the model is accurate. It might not be well-calibrated, because the small nodes will give poor estimates of probability.
D. The tree did not split on all the input variables. We need a larger data set to get a more accurate model.

Easy

Gradient descent optimization
Gradient Descent
Solve
You are working on a regression problem using a simple neural network. You want to optimize the model's weights using gradient descent with different learning rate schedules. Consider the following pseudo code for training the neural network:
 image
Which of the following learning rate schedules would most likely result in the fastest convergence without overshooting the optimal weights?

A: Constant learning rate of 0.01
B: Exponential decay with initial learning rate of 0.1 and decay rate of 0.99
C: Exponential decay with initial learning rate of 0.01 and decay rate of 0.99
D: Step decay with initial learning rate of 0.1 and decay rate of 0.5 every 100 epochs
E: Step decay with initial learning rate of 0.01 and decay rate of 0.5 every 100 epochs
F: Constant learning rate of 0.1

Medium

Less complex decision tree model
Model Complexity
Overfitting
Solve
You are given a dataset to solve a classification problem using a decision tree algorithm. You are concerned about overfitting and decide to implement pruning to control the model's complexity. Consider the following pseudo code for creating the decision tree model:
 image
Which of the following combinations of parameters would result in a less complex decision tree model, reducing the risk of overfitting?

A: max_depth=5, min_samples_split=2, min_samples_leaf=1
B: max_depth=None, min_samples_split=5, min_samples_leaf=5
C: max_depth=3, min_samples_split=2, min_samples_leaf=1
D: max_depth=None, min_samples_split=2, min_samples_leaf=1
E: max_depth=3, min_samples_split=10, min_samples_leaf=10
F; max_depth=5, min_samples_split=5, min_samples_leaf=5

Easy

n-gram generator
Solve
Our newest machine learning developer want to write a function to calculate the n-gram of any text. An N-gram means a sequence of N words. So for example, "black cats" is a 2-gram, "saw black cats" is a 3-gram etc. The 2-gram of the sentence "the big bad wolf fell down" would be [["the", "big"], ["big", "bad"], ["bad", "wolf"], ["wolf", "fell"], ["fell", "down"]]. Can you help them select the correct function for the same?
 image

Easy

Recommendation System Selection
Recommender Systems
Collaborative Filtering
Content-Based Filtering
Solve
You are tasked with building a recommendation system for a newly launched e-commerce website. Given that the website is new, there is not much user interaction data available. Also, the items in the catalog have rich descriptions. Based on these requirements, which type of recommendation system approach would be the most suitable for this task?

Easy

Sensitivity and Specificity
Confusion Matrix
Model Evaluation
Solve
You have trained a supervised learning model to classify customer reviews as either "positive" or "negative" based on a dataset with 10,000 samples and 35 features, including the review text, reviewer's name, and rating. The dataset is split into a 7,000-sample training set and a 3,000-sample test set.

After training the model, you evaluate its performance using a confusion matrix on the test set, which shows the following results:
 image
Based on the confusion matrix, what are the sensitivity and specificity of the model?

Medium

Green or red balls
Solve
A bag contains 5 red balls, 6 yellow balls and 3 green balls. If two balls are picked at random, what is the probability that both are red or both are green in colour?

Hard

Square points and Circle
Solve
What is the probability that two uniformly random points in the square are such that center of the square lies in the circle formed by taking the points as diameter

Easy

Frequency distribution
Solve
Convert the following into an ordinary frequency distribution:

- 5 users gave less than 3 rating
- 12 users gave less than 6 rating
- 25 users gave less than 9 ratings
- 33 users get less than 12 ratings
 image
🧐 Question🔧 Skill

Medium

Amazon electronics product feedback

2 mins

Data Science
Solve

Easy

Fraud detection model
Logistic Regression

2 mins

Data Science
Solve

Medium

Rox's decision tree classifier
Decision Tree Classifier

2 mins

Data Science
Solve

Easy

Gradient descent optimization
Gradient Descent

2 mins

Machine Learning
Solve

Medium

Less complex decision tree model
Model Complexity
Overfitting

2 mins

Machine Learning
Solve

Easy

n-gram generator

2 mins

Machine Learning
Solve

Easy

Recommendation System Selection
Recommender Systems
Collaborative Filtering
Content-Based Filtering

2 mins

Machine Learning
Solve

Easy

Sensitivity and Specificity
Confusion Matrix
Model Evaluation

2 mins

Machine Learning
Solve

Medium

Green or red balls

2 mins

Probability
Solve

Hard

Square points and Circle

3 mins

Probability
Solve

Easy

Frequency distribution

3 mins

Statistics
Solve
🧐 Question🔧 Skill💪 Difficulty⌛ Time
Amazon electronics product feedback
Data Science
Medium2 mins
Solve
Fraud detection model
Logistic Regression
Data Science
Easy2 mins
Solve
Rox's decision tree classifier
Decision Tree Classifier
Data Science
Medium2 mins
Solve
Gradient descent optimization
Gradient Descent
Machine Learning
Easy2 mins
Solve
Less complex decision tree model
Model Complexity
Overfitting
Machine Learning
Medium2 mins
Solve
n-gram generator
Machine Learning
Easy2 mins
Solve
Recommendation System Selection
Recommender Systems
Collaborative Filtering
Content-Based Filtering
Machine Learning
Easy2 mins
Solve
Sensitivity and Specificity
Confusion Matrix
Model Evaluation
Machine Learning
Easy2 mins
Solve
Green or red balls
Probability
Medium2 mins
Solve
Square points and Circle
Probability
Hard3 mins
Solve
Frequency distribution
Statistics
Easy3 mins
Solve
Reason #4

1200+ customers in 75 countries

customers in 75 countries
Brandon

Avec Adaface, nous avons pu optimiser notre processus de sélection initiale de plus de 75 %, libérant ainsi un temps précieux tant pour les responsables du recrutement que pour notre équipe d'acquisition de talents !


Brandon Lee, Chef du personnel, Love, Bonito

Reason #5

Designed for elimination, not selection

The most important thing while implementing the pre-employment Test d'évaluation des sciences des données in your hiring process is that it is an elimination tool, not a selection tool. In other words: you want to use the test to eliminate the candidates who do poorly on the test, not to select the candidates who come out at the top. While they are super valuable, pre-employment tests do not paint the entire picture of a candidate’s abilities, knowledge, and motivations. Multiple easy questions are more predictive of a candidate's ability than fewer hard questions. Harder questions are often "trick" based questions, which do not provide any meaningful signal about the candidate's skillset.

Science behind Adaface tests
Reason #6

1 click candidate invites

Email invites: You can send candidates an email invite to the Test d'évaluation des sciences des données from your dashboard by entering their email address.

Public link: You can create a public link for each test that you can share with candidates.

API or integrations: You can invite candidates directly from your ATS by using our pre-built integrations with popular ATS systems or building a custom integration with your in-house ATS.

invite candidates
Reason #7

Detailed scorecards & benchmarks

Voir l'échantillon
Reason #8

High completion rate

Adaface tests are conversational, low-stress, and take just 25-40 mins to complete.

This is why Adaface has the highest test-completion rate (86%), which is more than 2x better than traditional assessments.

test completion rate
Reason #9

Advanced Proctoring


Learn more

About the Data Science Online Test

Why you should use Pre-employment Data Science Assessment Test?

The Test d'évaluation des sciences des données makes use of scenario-based questions to test for on-the-job skills as opposed to theoretical knowledge, ensuring that candidates who do well on this screening test have the relavant skills. The questions are designed to covered following on-the-job aspects:

  • Démontrer une forte compréhension de la théorie des probabilités et de ses applications en science des données.
  • Appliquez des concepts et des techniques statistiques pour analyser et interpréter les données.
  • Utilisez des algorithmes et des modèles d'apprentissage automatique pour résoudre des problèmes réels.
  • Créez des visualisations de données visuellement attrayantes pour communiquer efficacement les informations.
  • Utilisez des langages de programmation R ou Python pour l'analyse des données et la manipulation.
  • Effectuer une analyse complète des données exploratoires pour obtenir des informations et identifier les modèles.
  • Démontrer la maîtrise des techniques de manipulation des données pour nettoyer et prétraiter les données.
  • Appliquer une analyse de régression pour développer des modèles prédictifs et faire des prédictions précises.
  • Posséder des compétences avancées dans le nettoyage des données pour assurer la qualité et l'intégrité des données.
  • Tirez parti des techniques de modélisation prédictive pour prendre des décisions basées sur les données.

Once the test is sent to a candidate, the candidate receives a link in email to take the test. For each candidate, you will receive a detailed report with skills breakdown and benchmarks to shortlist the top candidates from your pool.

What topics are covered in the Data Science Assessment Test?

  • Techniques d'apprentissage automatique:

    Les techniques d'apprentissage automatique se réfèrent aux algorithmes et méthodes utilisés pour former des modèles qui peuvent apprendre automatiquement et s'améliorer à partir des données sans être explicitement programmée. Cette compétence doit être mesurée dans le test car elle est une composante fondamentale de la science des données, permettant aux scientifiques des données de développer des modèles prédictifs et de prendre des décisions basées sur les données.

  • Visualisation des données:

    Data La visualisation consiste à créer des représentations visuelles des données pour communiquer efficacement les informations et les modèles. Cette compétence doit être mesurée dans le test car il est essentiel pour les scientifiques des données de présenter des données complexes de manière significative et compréhensible, facilitant une meilleure prise de décision et communication.

  • Analytique avec R ou Python: </H4 > <p> Les analyses avec R ou Python se réfèrent à l'utilisation de langages de programmation tels que R ou Python pour effectuer l'analyse des données, la modélisation statistique et les tâches d'apprentissage automatique. Cette compétence doit être mesurée dans le test car elle évalue la capacité d'un candidat à appliquer des compétences en programmation dans les projets de science des données, démontrant leur compétence dans la gestion des données et la mise en œuvre d'algorithmes d'analyse. </p> <h4> Analyse exploratoire des données: </h4> < P> L'analyse des données exploratoires consiste à examiner et à transformer des données pour comprendre ses principales caractéristiques, modèles et relations. Cette compétence doit être mesurée dans le test car elle présente la capacité d'un candidat à extraire des informations significatives des données brutes, à identifier les problèmes potentiels et à générer des hypothèses pour une analyse plus approfondie. </p> <h4> Manipulation des données:

    La manipulation des données fait référence au processus de transformation, de reformatage ou de nettoyage des données pour la rendre adaptée à l'analyse. Cette compétence doit être mesurée dans le test car elle évalue la compétence d'un candidat dans la gestion et la préparation des données, ce qui est une étape cruciale dans le flux de travail de la science des données avant d'effectuer des tâches d'analyse ou de modélisation.

  • Statistiques:

    Les statistiques impliquent la collecte, l'analyse, l'interprétation, la présentation et l'organisation des données. Cette compétence doit être mesurée dans le test car elle teste la compréhension et l'application d'un candidat des concepts et techniques statistiques, qui sont essentiels pour effectuer une analyse des données robuste et valide.

  • Analyse de régression:

    L'analyse de régression est une technique statistique utilisée pour modéliser la relation entre une variable dépendante et une ou plusieurs variables indépendantes. Cette compétence doit être mesurée dans le test car elle évalue la capacité d'un candidat à effectuer une analyse de régression, qui est largement utilisée dans la modélisation prédictive et la compréhension de l'impact des variables sur un résultat d'intérêt.

  • Full list of covered topics

    The actual topics of the questions in the final test will depend on your job description and requirements. However, here's a list of topics you can expect the questions for Test d'évaluation des sciences des données to be based on.

    Distributions de probabilité
    Tests d'hypothèses
    Théorème de la limite centrale
    Intervalles de confiance
    Régression linéaire
    Régression logistique
    Arbres de décision
    Forêts aléatoires
    Machines vectorielles de support
    Voisins les plus chers
    Bayes naïf
    Clustering k-means
    Classification hiérarchique
    Analyse des composants principaux
    Techniques de visualisation des données
    Bibliothèques de visualisation des données (par exemple, Matplotlib, GGPLOT)
    Techniques d'exploration des données
    L'analyse exploratoire des données
    Manipulation de données avec r ou python
    Techniques de nettoyage des données
    Imputation des données manquantes
    Détection des valeurs aberrantes
    Ingénierie de caractéristiques
    Analyse de corrélation
    Anova
    Analyse des séries chronologiques
    Test A / B
    Évaluation et validation du modèle
    Techniques de validation croisée
    Méthodes de sélection des fonctionnalités
    Techniques de réduction de la dimensionnalité
    Apprentissage d'ensemble
    Sur-ajustement et sous-ajustement
    Techniques de régularisation
    Compromis de vanisation de biais
    Prétraitement des données
    Normalisation
    Standardisation
    Codage à un hot
    Échelle de données
    Méthodes de rééchantillonnage
    Techniques de division des données
    Métriques d'évaluation du modèle
    R carré
    Erreur carrée moyenne
    Précision
    Précision et rappel
    Score F1
    Analyse de la courbe ROC
    Réglage hyperparamètre
    Recherche de grille
    Réglage hyperparamètre de validation croisée
    Déploiement de modèle
    Intégration API
    Interprétation et explication du modèle
    Modèles d'apprentissage machine interprétable
    Valeurs de Shapley

What roles can I use the Data Science Assessment Test for?

  • Data scientifique
  • Analyste de données
  • Ingénieur d'apprentissage automatique
  • Ingénieur de données
  • Analyste d'affaires
  • Analyste statistique
  • Ingénieur d'IA
  • Rôles de l'intelligence artificielle

How is the Data Science Assessment Test customized for senior candidates?

For intermediate/ experienced candidates, we customize the assessment questions to include advanced topics and increase the difficulty level of the questions. This might include adding questions on topics like

  • Utilisez des algorithmes de clustering pour la classification et l'analyse de segmentation.
  • Appliquer une analyse des séries chronologiques pour prévoir les tendances et les modèles futurs.
  • Démontrer la connaissance des algorithmes et techniques de traitement du langage naturel.
  • Utilisez des techniques de sélection et d'extraction des fonctionnalités pour améliorer les performances du modèle.
  • Utilisez des méthodes de réduction de la dimensionnalité pour la visualisation et l'analyse des données.
  • Appliquez des techniques d'apprentissage d'ensemble pour améliorer la précision et les performances du modèle.
  • Posséder de fortes compétences dans la visualisation des données à l'aide de bibliothèques telles que Matplotlib et GGPLOT.
  • Utilisez des tests statistiques et des tests d'hypothèse pour prendre des décisions basées sur les données.
  • Utilisez des techniques d'imputation de données pour gérer les valeurs manquantes dans les ensembles de données.
  • Appliquez des techniques de validation croisée pour évaluer les performances du modèle et prévenir le sur-ajustement.
  • Démontrez une expertise dans la gestion des ensembles de données déséquilibrés à l'aide de diverses techniques.
Singapore government logo

Les responsables du recrutement ont estimé que grâce aux questions techniques qu'ils ont posées lors des entretiens avec le panel, ils étaient en mesure de déterminer quels candidats avaient obtenu de meilleurs scores et de se différencier de ceux qui avaient obtenu de moins bons résultats. Ils sont très satisfait avec la qualité des candidats présélectionnés lors de la sélection Adaface.


85%
réduction du temps de dépistage

Data Science Hiring Test FAQ

Quel type de questions le test en ligne Data Science contient-il ?

Le test de science des données évalue le niveau de compétence sur le terrain des candidats avec des questions basées sur des scénarios axées sur la capacité du candidat à :

  • Nettoyer les données et rechercher les anomalies
  • Utiliser les données d'entraînement/test et la validation croisée K-Fold pour créer des modèles robustes
  • Faire des prédictions en utilisant la régression linéaire, la régression polynomiale et la régression multivariée
  • Classer les données à l'aide du clustering K-Means, des machines à vecteurs de support (SVM), de KNN, des arbres de décision, de Naive Bayes et de PCA.
  • Lire une matrice de confusion
  • Comprendre le compromis biais/variance et le surapprentissage
  • Utiliser les méthodes d'élimination en amont, de sélection en avant et d'élimination bidirectionnelle pour créer des modèles statistiques
  • Transformer les variables indépendantes et dériver de nouvelles variables indépendantes à des fins de modélisation
  • Vérifier la multicolinéarité
  • Comprendre et prévenir la détérioration du modèle

Comment le test sera-t-il personnalisé pour les data scientists seniors ?

En plus des sujets mentionnés ci-dessus, les tests destinés aux data scientists seniors comprennent également des questions sur des sujets avancés tels que :

  • Manipulation avancée des données pour générer des informations à partir de grands ensembles de données non structurés
  • Ingénierie des fonctionnalités
  • Réglage des hyperparamètres
  • Apprentissage par renforcement
  • Réduction de la dimensionnalité
  • Analyse statistique avancée

Le test de science des données évalue-t-il les aptitudes en science des données ou des technologies spécifiques ?

La version prête à l'emploi de ce test se concentre sur les aptitudes en science des données : probabilités, statistiques et apprentissage automatique. Si vous souhaitez tester des technologies spécifiques, vous pouvez demander une version personnalisée de ce test.

Puis-je combiner plusieurs compétences en une seule évaluation personnalisée?

Oui absolument. Les évaluations personnalisées sont configurées en fonction de votre description de poste et comprendront des questions sur toutes les compétences indispensables que vous spécifiez.

Avez-vous en place des fonctionnalités anti-chétion ou de proctorisation?

Nous avons les fonctionnalités anti-modification suivantes en place:

  • Questions non googléables
  • IP Proctoring
  • Proctoring Web
  • Proctoring webcam
  • Détection du plagiat
  • navigateur sécurisé

En savoir plus sur les fonctionnalités de Proctoring.

Comment interpréter les résultats des tests?

La principale chose à garder à l'esprit est qu'une évaluation est un outil d'élimination, pas un outil de sélection. Une évaluation des compétences est optimisée pour vous aider à éliminer les candidats qui ne sont pas techniquement qualifiés pour le rôle, il n'est pas optimisé pour vous aider à trouver le meilleur candidat pour le rôle. Ainsi, la façon idéale d'utiliser une évaluation consiste à décider d'un score de seuil (généralement 55%, nous vous aidons à bencher) et à inviter tous les candidats qui marquent au-dessus du seuil pour les prochains cycles d'entrevue.

Pour quel niveau d'expérience puis-je utiliser ce test?

Chaque évaluation ADAFACE est personnalisée à votre description de poste / Persona de candidats idéaux (nos experts en la matière choisiront les bonnes questions pour votre évaluation de notre bibliothèque de 10000+ questions). Cette évaluation peut être personnalisée pour tout niveau d'expérience.

Chaque candidat reçoit-il les mêmes questions?

Oui, cela vous permet de comparer les candidats. Les options pour les questions du MCQ et l'ordre des questions sont randomisées. Nous avons Anti-Cheating / Proctoring en place. Dans notre plan d'entreprise, nous avons également la possibilité de créer plusieurs versions de la même évaluation avec des questions de niveaux de difficulté similaires.

Je suis candidat. Puis-je essayer un test de pratique?

Non. Malheureusement, nous ne soutenons pas les tests de pratique pour le moment. Cependant, vous pouvez utiliser nos exemples de questions pour la pratique.

Quel est le coût de l'utilisation de ce test?

Vous pouvez consulter nos plans de prix.

Puis-je obtenir un essai gratuit?

Oui, vous pouvez vous inscrire gratuitement et prévisualiser ce test.

Je viens de déménager dans un plan payant. Comment puis-je demander une évaluation personnalisée?

Voici un guide rapide sur Comment demander une évaluation personnalisée sur Adaface.

customers across world
Join 1200+ companies in 75+ countries.
Essayez l'outil d'évaluation des compétences le plus candidat aujourd'hui.
g2 badges
Ready to use the Adaface Test d'évaluation des sciences des données?
Ready to use the Adaface Test d'évaluation des sciences des données?
Discute avec nous
ada
Ada
● Online
Previous
Score: NA
Next
✖️