
Las empresas de tecnología multinacionales como Google, Facebook y Amazon utilizaron el aprendizaje automático en secreto antes de que el aprendizaje automático fuera aceptable a nivel mundial.
Google se encargó de la ubicación de los anuncios con la ayuda del aprendizaje automático, mientras que Facebook mostró fuentes de publicaciones de aprendizaje automático según su conveniencia. Amazon mostró recomendaciones de sitios web de comercio electrónico que afectaron los clics de los usuarios. Por ejemplo, si el usuario compró recientemente un zapato, Amazon usó esta información para mostrar recomendaciones de otros zapatos de la misma forma y estructura para una mayor exploración.
Aunque el aprendizaje automático ha sufrido modificaciones desde hace muy poco, ahora también es el centro de un tema esencial para la discusión: ¿Es el aprendizaje automático el fin de la privacidad para la raza humana? ¿Qué más puede hacer el aprendizaje automático excepto conducir autos y comunicarse automáticamente? ¿Es dañino el aprendizaje automático? Este artículo proporcionará una visión rápida de varios conceptos erróneos a lo largo del tiempo.
El aprendizaje automático simplemente resume los datos.
De hecho, el objetivo principal del aprendizaje automático es predecir el futuro. Conocer las películas que viste en el pasado es solo una forma de ver cuáles quieres ver a continuación. Su historial de crédito es una guía para pagar sus cuentas a tiempo. Los algoritmos de aprendizaje, como los robots científicos, formulan hipótesis y las refinan, y las creen solo cuando sus predicciones se hacen realidad. Los algoritmos de aprendizaje aún no son tan inteligentes como los científicos, pero son millones de veces más rápidos.
Los algoritmos de aprendizaje solo revelan correlaciones entre pares de eventos.
Esta es la impresión que recibe de la mayoría de los medios de comunicación. Un aumento en las búsquedas de Google de «gripe» es una señal temprana en un caso famoso de que se propaga. Eso está muy bien, pero la mayoría de los algoritmos de aprendizaje descubren formas de conocimiento mucho más ricas, como la regla Si un lunar tiene forma y color irregulares.
El aprendizaje automático solo puede descubrir correlaciones, no causas.
De hecho, uno de los tipos más populares de aprendizaje automático implica la prueba y la observación de diferentes acciones: la esencia del descubrimiento causal. Un sitio de comercio electrónico, por ejemplo, puede probar varios métodos para presentar un producto y seleccionar el que conduce a la mayoría de las compras. Probablemente participaste sin saberlo en miles de estos experimentos. E incluso en situaciones en las que los experimentos están fuera de discusión, y todo lo que las computadoras pueden hacer es mirar información pasada, se pueden descubrir relaciones causales.
Los eventos invisibles, como Black Swans, no se pueden predecir en el aprendizaje automático.
Si algo nunca sucedió antes, se espera que sea 0. El aprendizaje automático, por otro lado, es el arte de predecir con precisión eventos raros. Si A es una de las causas de B y B es una de las razones de C, A puede conducir a C, aunque nunca antes ocurra. Los filtros de correo no deseado marcan los correos electrónicos no deseados correctamente todos los días. De hecho, los cisnes de Schwarze fueron ampliamente anticipados, al igual que la crisis inmobiliaria de 2008 no fue utilizada por la mayoría de los bancos en ese momento por modelos de riesgo defectuosos.
Cuantos más datos tenga, es probable que haya patrones alucinantes.
Cuantos más informes telefónicos revise la NSA, más probable es que señale a un hombre inocente como un terrorista potencial, ya que accidentalmente se ajustó a una regla de detección de terroristas. Los profesionales del aprendizaje automático pueden aumentar el riesgo de alucinaciones extrayendo más atributos de las mismas entidades, pero mantenerlo al mínimo es excelente. Por otro lado, extraer más objetos con el mismo conjunto de atributos reduce el riesgo, ya que respaldan las reglas. Y hay algunos algoritmos de aprendizaje que pueden ayudar a encontrar patrones de múltiples entidades y hacerlos aún más sólidos. Cualquiera que grabe en video el Ayuntamiento de Nueva York puede ser impensable, y puede que no haya ninguna otra persona comprando grandes cantidades de nitrato de amonio.
El aprendizaje automático ignora el conocimiento preexistente.
El enfoque de «pizarra en blanco» de los algoritmos de aprendizaje que conocen ha sido permeado por expertos que miran con recelo. El conocimiento real es el resultado de un largo proceso de razonamiento y experimentación que no se puede imitar utilizando un algoritmo de base de datos genérico. Sin embargo, no todos los algoritmos de aprendizaje comienzan en una pizarra blanca; algunos datos de usuario para refinar el conocimiento preexistente, que es muy elaborado si está encriptado en una forma de computadora.
Aprender modelos de computadora es incomprensible para las personas.
Esto es motivo de preocupación, por supuesto. ¿Cómo podemos confiar en sus recomendaciones si un algoritmo de aprendizaje es una caja negra? Algunos tipos de modelos son difíciles de entender, como las redes neuronales profundas que son responsables de algunos de los éxitos más notables en el aprendizaje automático (como reconocer gatos en videos de YouTube). Pero otras son bastante comprensibles, como la regla que vimos antes para diagnosticar el cáncer de piel.
Los modelos que son más simples son más precisos.
A veces se equipara esta creencia con la navaja de Occam, pero la navaja solo dice que es preferible tener explicaciones más directas, no por qué. Debido a que son más fáciles de entender, recordar y razonar, son superiores. A veces, la hipótesis coherente con los datos más simple es menos precisa que una más complicada para la predicción. Algunos de los algoritmos de aprendizaje más poderosos generan modelos que parecen ser elaborados de forma gratuita, a veces incluso se les agregan después de que se ajustan perfectamente a los datos, pero así es como superan a los menos poderosos.
Es posible tomar los patrones que las computadoras descubren al pie de la letra.
Si un algoritmo de aprendizaje produce la regla para el diagnóstico de cáncer de piel que hemos visto anteriormente y la regla es muy precisa (en el sentido de que casi todos los lunares que coinciden son tumores), eso no significa necesariamente que deba creer él. Un ligero cambio en los datos podría llevar a que el algoritmo indujera una regla muy diferente pero igualmente precisa. Solo se puede confiar en que las reglas que se inducen de manera confiable a pesar de las variaciones aleatorias en los datos significan lo que dicen, en lugar de ser solo herramientas predictivas útiles.
El aprendizaje automático producirá una inteligencia sobrehumana en un futuro próximo.
A partir de las noticias diarias, es fácil tener la impresión de que las computadoras están a punto de ver, hablar y razonar tan bien como nosotros, después de lo cual nos dejarán en el polvo rápidamente. Ciertamente, hemos recorrido un largo camino en los primeros 50 años de la inteligencia artificial, y la razón principal de sus logros recientes es el aprendizaje automático, pero hay mucho más por hacer. Las computadoras pueden hacer muchas tareas pequeñas muy bien, pero todavía no hay sentido común y nadie sabe cómo enseñarlo.