60 preguntas comunes de la entrevista de trabajo de Machine Learning

Vota este post

Según Indeed.com, el ingeniero de aprendizaje automático se está convirtiendo en uno de los trabajos más solicitados del mundo debido a la creciente demanda y los altos salarios. Ofrece un potencial casi infinito, ya que existe una gran necesidad de talento y la demanda de solicitantes de empleo calificados ya está superando a la de los científicos de datos.

Gartner predice que con la expansión de productos y servicios relacionados con el aprendizaje automático, la industria se expandirá de $1400 millones en 2017 a $8800 millones en 2020, creando 2,3 millones de nuevos puestos de trabajo.

Con las listas de trabajos de Machine Learning en aumento en áreas como el procesamiento del lenguaje natural y el aprendizaje profundo, hay un lugar para cualquier persona, independientemente de la especialidad que le interese.

Este artículo es un repositorio de 60 preguntas frecuentes durante las entrevistas de aprendizaje automático. Viene en un formato de pregunta/respuesta. Hemos dado las respuestas más cortas posibles para que las memorices fácilmente. ¡Empecemos!

1. ¿Cuáles son las diferentes técnicas en el aprendizaje automático?

  • Aprendizaje supervisado
  • Aprendizaje sin supervisión
  • Aprendizaje semisupervisado
  • Aprendizaje reforzado
  • Transducción
  • Aprendiendo a aprender

2. ¿Cuáles son los diversos enfoques del aprendizaje automático?

  • concepto vs. Clasificación Aprendizaje
  • Simbólico vs. Aprendizaje Estadístico
  • inductivo vs. Aprendizaje Analítico

3. ¿Cuál es la diferencia entre el aprendizaje automático supervisado y no supervisado?

Supervisado: Aprendizaje de datos etiquetados utilizando modelos de clasificación y regresión.
Sin supervisión: Aprendiendo de datos no etiquetados utilizando modelos de análisis factoriales y de conglomerados.

4. Explicar las funciones del Aprendizaje Supervisado.

  • Clasificaciones
  • Reconocimiento de voz
  • Regresión
  • Predecir series de tiempo
  • Anotar cadenas

5. ¿Cuáles son los algoritmos utilizados para el aprendizaje supervisado?

  • Regresión lineal
  • Regresión logística
  • Árbol de decisión
  • Bosque aleatorio
  • KNN
  • bayesiana ingenua

6. ¿Cuáles son los dos métodos utilizados para la calibración en el aprendizaje supervisado?

  • Calibración de plataforma
  • Regresión isotónica

7. Explicar las funciones del aprendizaje no supervisado

  • Buscar grupos de datos
  • Encuentre representaciones de baja dimensión de los datos
  • Encuentre direcciones interesantes en los datos
  • Coordenadas y correlaciones interesantes
  • Encuentre observaciones novedosas/limpieza de bases de datos.

8. ¿Cuáles son los algoritmos utilizados para el aprendizaje no supervisado?

  • K-medias
  • Agrupación jerárquica
  • Agrupación de t-SNE
  • Agrupación de DBSCAN
  • Análisis de componentes principales (PCA)
  • Detección de anomalías

9. ¿Cuál es el enfoque estándar para el aprendizaje supervisado?

Divida el conjunto de ejemplos en el conjunto de entrenamiento y la prueba.

10. Explique la diferencia entre K-Vecinos más cercanos y K-Means Clustering

K-Nearest Neighbors es un algoritmo de aprendizaje automático supervisado, que clasifica los puntos en datos etiquetados, en función de la distancia del punto a los puntos más cercanos. El agrupamiento de K-Means es un algoritmo de aprendizaje automático no supervisado, que clasifica puntos dentro de datos no etiquetados en grupos en función de la media de las distancias entre diferentes puntos.

11. ¿Cuáles son los cinco algoritmos populares en Machine Learning?

  • Árboles de decisión
  • Redes neuronales (propagación hacia atrás)
  • Redes probabilísticas
  • Vecino más cercano
  • Máquinas de vectores de soporte

12. ¿Cuáles son las tres etapas de la construcción de un modelo?

  • Construcción del modelo
  • Pruebas de modelos
  • Aplicando el modelo

13. ¿Cuál es la diferencia entre clasificación y regresión?

La clasificación se utiliza para clasificar los datos en algunas categorías específicas y producir resultados discretos. La regresión se utiliza para tratar con datos continuos en un momento determinado.

14. Explique ‘Conjunto de entrenamiento’ y ‘Conjunto de prueba’.

El conjunto de entrenamiento representa el conjunto de datos utilizado para entrenar el modelo. El conjunto de prueba representa el conjunto de datos utilizado para probar el modelo entrenado.

15. ¿Qué son los modelos paramétricos?

Los modelos paramétricos son aquellos con un número finito de parámetros, mientras que los modelos no paramétricos son aquellos con un número ilimitado de parámetros.

16. ¿Por qué ocurre el sobreajuste?

El sobreajuste ocurre debido a la complejidad de los parámetros en un modelo. El modelo describe el error aleatorio o el ruido en lugar de la relación subyacente.

17. ¿Cómo evitar el sobreajuste?

  • Mantenga el modelo simple.
  • Elija menos variables y parámetros para reducir el ruido.
  • Utilice técnicas de validación cruzada como la validación cruzada de pliegues en K para mantener el sobreajuste bajo control.
  • Siga técnicas de regularización como LASSO.

18. ¿Cuál es el método más utilizado para evitar el sobreajuste?

19. ¿Cuáles son las ventajas y desventajas de los árboles de decisión?

Los árboles de decisión son fáciles de interpretar y hay relativamente pocos parámetros para ajustar. Son propensos a sobreajustarse.

20. ¿Cuál es la diferencia entre el descenso de gradiente estocástico (SGD) y el descenso de gradiente (GD)?

El descenso de gradiente estándar es un método para evaluar todas las muestras de entrenamiento para cada conjunto de parámetros para minimizar una función de pérdida y realizar ajustes, mientras que, en el descenso de gradiente estocástico, solo evalúa una muestra de entrenamiento para el conjunto de parámetros.

21. ¿Qué es clasificador?

Un clasificador utiliza algunos datos de entrenamiento para comprender cómo las variables de entrada dadas se relacionan con la clase.

22. ¿Cuál es la principal ventaja de Navie Bayes?

A diferencia de los modelos discriminativos como la regresión logística, un clasificador ingenuo de Bayes converge más rápido, por lo que necesita menos datos de entrenamiento.

23. ¿Qué es el aprendizaje de Ensemble?

El aprendizaje por conjuntos significa combinar muchos modelos básicos, como clasificadores y regresores, para obtener mejores resultados. Se utiliza al construir clasificadores de componentes precisos e independientes.

24. Explique la reducción de dimensiones.

La reducción de dimensiones es el proceso de reducir el tamaño de la matriz de funciones (como el número de columnas, ya sea combinando columnas o eliminando variables adicionales), para obtener un mejor conjunto de funciones.

25. ¿Cuáles son los mejores algoritmos de reducción de dimensionalidad?

  • Relación de valores faltantes
  • Filtro de baja varianza
  • Filtro de alta correlación
  • Bosque aleatorio
  • Eliminación de características hacia atrás
  • Selección de funciones de reenvío
  • Análisis factorial
  • Análisis de componentes principales
  • Análisis de componentes independientes
  • Incrustación de vecinos estocásticos distribuidos en t (t-SNE)
  • UMAP

26. ¿Qué es el aprendizaje conjunto?

El aprendizaje conjunto es un proceso de generación y combinación estratégica de múltiples modelos, como clasificadores o expertos, para resolver un programa computacional particular.

27. ¿Por qué se utiliza el aprendizaje conjunto?

Mejorar la clasificación, predicción y aproximación de funciones de un modelo.

28. ¿Cuándo utilizar el aprendizaje conjunto?

Para construir clasificadores de componentes que sean más precisos e independientes entre sí.

29. ¿Cuáles son los dos paradigmas de los métodos de conjunto?

  • Métodos de conjunto secuencial
  • Métodos de conjuntos paralelos

30. ¿Cuál es el principio general de un método de conjunto?

Combine las predicciones de varios modelos y mejore la robustez sobre un solo modelo.

31. ¿Qué son las técnicas de conjunto?

Básico: votación máxima, promedio, promedios ponderados
Avanzado: apilamiento, mezcla, embolsado, impulso

32. ¿Qué es embolsar y aumentar?

El embolsado es un método en conjunto para mejorar los esquemas de estimación o clasificación inestables. El impulso es un método utilizado secuencialmente para reducir el sesgo del modelo combinado. El impulso y el embolsado reducen los errores al reducir el término de varianza.

33. ¿Cuáles son los mejores algoritmos de embolsado?

  • Metaestimador de embolsado
  • Bosque aleatorio

34. ¿Cuáles son los mejores algoritmos de impulso?

  • adaboost
  • Algoritmo de aumento de gradiente (GBM)
  • Aumento de gradiente extremo (XBM)
  • Luz GBM
  • Catboost

35. ¿Qué haría si su modelo tuviera un sesgo bajo y una varianza alta?

Use algoritmos de embolsado como el regresor de bosque aleatorio.

36. ¿Cuál es la diferencia entre un bosque aleatorio y un algoritmo de aumento de gradiente?

Random Forest utiliza técnicas de embolsado para reducir la varianza, mientras que el aumento de gradiente utiliza técnicas de aumento para reducir el sesgo y la varianza.

37. ¿Cuáles son las áreas en las que más se utiliza el reconocimiento de patrones?

  • Visión por computador
  • Reconocimiento de voz
  • Procesamiento de datos
  • Estadísticas
  • Recuperación informal
  • Bioinformática

38. ¿Qué es la programación genética?

La programación genética es una técnica para probar varios modelos y seleccionar el mejor en función de los mejores resultados.

39. ¿Qué es la programación lógica inductiva (ILP)?

ILP es un subcampo en el aprendizaje automático que utiliza programación lógica para representar conocimientos básicos y ejemplos.

40. ¿Cuál es la diferencia entre la heurística para el aprendizaje de reglas y la heurística para los árboles de decisión?

Las heurísticas de los árboles de decisión evalúan la calidad promedio de una serie de conjuntos inconexos. Los aprendices de reglas solo evalúan la calidad del conjunto de instancias que se cubren con la regla candidata.

41. ¿Qué es el perceptrón?

Perceptron es un algoritmo para la clasificación supervisada de la entrada en una de varias posibles salidas no binarias.

42. Explique los dos componentes del programa de lógica bayesiana.

Un componente lógico, que consta de un conjunto de cláusulas bayesianas, que captura la estructura cualitativa del dominio.
Un componente cuantitativo que codifica la información cuantitativa sobre el dominio.

43. ¿Qué es la red bayesiana?

La red bayesiana representa el modelo gráfico de la relación de probabilidad entre un conjunto de variables.

44. ¿Por qué los algoritmos de aprendizaje basados ​​en instancias se conocen como algoritmos de aprendizaje Lazy?

Retrasan el proceso de inducción o generalización hasta que se realiza la clasificación.

45. ¿Cuáles son los dos métodos de clasificación que puede manejar SVM (Support Vector Machine)?

  • Combinar clasificadores binarios
  • Modificar binario para incorporar aprendizaje multiclase

46. ​​¿Qué es un algoritmo de aprendizaje incremental?

El aprendizaje incremental es la capacidad de un algoritmo para aprender de nuevos datos disponibles después de que un conjunto de datos disponible haya generado un clasificador.

47. ¿Para qué se utilizan PCA, KPCA e ICA?

PCA (Análisis de componentes principales), KPCA (Análisis de componentes principales basado en kernel) e ICA (Análisis de componentes independientes) son técnicas de extracción utilizadas para
reducción de dimensionalidad.

48. ¿Qué es la reducción de dimensiones?

Es el proceso de reducir el número de variables aleatorias bajo consideración.

49. ¿Qué son las máquinas de vectores de soporte?

Las máquinas de vectores de soporte son algoritmos de aprendizaje supervisado que se utilizan para la clasificación y el análisis de regresión.

50. ¿Cuáles son los componentes de las técnicas de evaluación relacional?

  • Adquisición de datos
  • Adquisición de la verdad del terreno
  • Técnica de validación cruzada
  • Tipo de consulta
  • Métrica de puntuación
  • Prueba de significación

51. ¿Cuáles son los diferentes métodos en el aprendizaje supervisado secuencial?

  • Métodos de ventana deslizante
  • Ventanas correderas recurrentes
  • Modelos ocultos de Markow
  • Máxima entropía Modelos de Markow
  • Campos aleatorios condicionales
  • Graficar redes de transformadores

52. ¿Qué es el Aprendizaje PAC?

El aprendizaje PAC (probablemente aproximadamente correcto) es un marco de aprendizaje introducido para analizar los algoritmos de aprendizaje y su eficiencia estadística.

53. ¿Cuáles son las diferentes categorías en el proceso de aprendizaje secuencial?

  • Predicción de secuencia
  • Generación de secuencias
  • Reconocimiento de secuencias
  • decisión secuencial

54. ¿Qué es el aprendizaje secuencial?

El aprendizaje secuencial es un método de enseñanza y aprendizaje de una manera lógica.

55. ¿Cuáles son las tres técnicas de preprocesamiento de datos para manejar valores atípicos?

  • Winsorizar
  • Transformar para reducir el sesgo
  • Elimine los valores atípicos si está seguro de que son anomalías o errores de medición.

56. ¿Cuáles son las tres formas de reducir la dimensionalidad?

  • Eliminación de características colineales.
  • Realización de PCA, ICA u otras formas de reducción de dimensionalidad algorítmica.
  • Combinación de características con ingeniería de características.

57. ¿Cuáles son las ventajas y desventajas de las redes neuronales?

Las redes neuronales son increíblemente flexibles para aprender patrones de conjuntos de datos no estructurados, como imágenes, audio y video. Pero requieren una gran cantidad de datos de entrenamiento para converger y es difícil elegir la arquitectura adecuada.

58. ¿Cuáles son las mejores técnicas para el sistema de recomendación?

  • Filtrado basado en contenido
  • Filtración colaborativa

59. ¿Cuáles son los diferentes tipos de algoritmos de series de tiempo?

  • Enfoque ingenuo
  • promedio simple
  • Media móvil
  • Suavizado exponencial simple
  • Método de tendencia lineal de Holt Método
  • Método estacional de invierno de Holt Método
  • ARIMA (Autoregresivo y media móvil)

60. ¿Cuáles son las diferentes aplicaciones del aprendizaje automático?

  • Bioinformática
  • Interfaces cerebro-máquina
  • Red de computadoras
  • Visión por computador
  • Detección de fraude con tarjetas de crédito
  • Análisis del mercado financiero
  • Reconocimiento de escritura a mano
  • Recuperación de información
  • Seguro
  • Detección de fraude en Internet
  • Diagnostico medico
  • Mejoramiento
  • Sistemas de recomendación
  • Los motores de búsqueda
  • Análisis de los sentimientos
  • Minería de secuencias
  • Reconocimiento de voz
  • Pronóstico de series de tiempo
  • Análisis del comportamiento del usuario