{"id":137775,"date":"2022-01-06T15:27:36","date_gmt":"2022-01-06T14:27:36","guid":{"rendered":"https:\/\/multi.liora.io\/?p=137775"},"modified":"2026-02-25T15:22:06","modified_gmt":"2026-02-25T14:22:06","slug":"que-es-el-transfer-learning","status":"publish","type":"post","link":"https:\/\/liora.io\/es\/que-es-el-transfer-learning","title":{"rendered":"\u00bfQu\u00e9 es el Transfer Learning?"},"content":{"rendered":"\n<p><strong>Este art\u00edculo es el 5\u00b0 y \u00faltimo de nuestra serie sobre deep learning, y presenta en detalle la definici\u00f3n y el funcionamiento del Transfer Learning. Si quieres regresar a los art\u00edculos anteriores, aqu\u00ed est\u00e1 la lista :<\/strong><\/p>\n\n\n\n<p><strong>Indice :<\/strong><\/p>\n\n\n\n<ol class=\"wp-block-list\">\n<li><a href=\"\/#definitiontransferlearning\">Definici\u00f3n de Transfer Learning<\/a><\/li>\n\n\n\n<li><a href=\"\/#strategiestechniques\">\u00bfSobre cu\u00e1les estrategias se apoyan las t\u00e9cnicas de Transfer Learning?<\/a><\/li>\n\n\n\n<li><a href=\"\/#resolutiondeprobleme\">\u00bfC\u00f3mo se aplica concretamente el Transfer Learning para la resoluci\u00f3n de problemas de Deep Learning?<\/a><\/li>\n\n\n\n<li><a href=\"\/#pointscles\">Puntos claves para recordar<\/a><\/li>\n<\/ol>\n\n\n\n<p>Andrew Ng, cient\u00edfico a cargo de Baidu y profesor de Stanford, ha anunciado en su popular tutorial NIPS 2016 que el Transfer Learning ser\u00e1 el pr\u00f3ximo motor de \u00e9xito comercial de Machine Learning. No es el \u00fanico que ha promocionado el potencial del Transfer Learning. En este art\u00edculo, te contaremos todo sobre este concepto del que todos hablan. Liora te ayudar\u00e1 a responder a <strong>tres preguntas fundamentales <\/strong>:<\/p>\n\n\n\n<ul class=\"wp-block-list\">\n<li>\u00bfQu\u00e9 es el Transfer Learning?<\/li>\n\n\n\n<li>\u00bfSobre cu\u00e1les estrategias se apoyan las t\u00e9cnicas de Transfer Learning?<\/li>\n\n\n\n<li>\u00bfC\u00f3mo se aplican concretamente para la resoluci\u00f3n de problemas de Deep Learning?<\/li>\n<\/ul>\n\n\n\n<h3 class=\"wp-block-heading\" id=\"h-definicion-de-transfer-learning\">Definici\u00f3n de Transfer Learning<\/h3>\n\n\n\n<p>Comencemos por definir este t\u00e9rmino tan utilizado en Data Science.<\/p>\n\n\n\n<blockquote class=\"wp-block-quote is-layout-flow wp-block-quote-is-layout-flow\">\n<p><em>\u201cEl Transfer Learning, o aprendizaje transferido en espa\u00f1ol, se refiere al conjunto de m\u00e9todos que permiten transferir conocimientos adquiridos gracias a la resoluci\u00f3n de problemas para resolver otros problemas.\u201d<\/em><\/p>\n<\/blockquote>\n\n\n\n<p>El Transfer Learning ha tenido un gran \u00e9xito con el crecimiento del Deep Learning. Frecuentemente, los modelos utilizados en este campo necesitan grandes <strong>tiempos de c\u00e1lculo y muchos recursos<\/strong>. Sin embargo, utilizando como punto de partida modelos pre-entrenados, el Transfer Learning permite desarrollar r\u00e1pidamente modelos eficaces y resolver problemas complejos de Computer Vision o Natural Language Processing, <a href=\"https:\/\/liora.io\/es\/nlp-natural-language-processing-introduccion\">NLP<\/a>.<\/p>\n\n\n\n<figure class=\"wp-block-image\"><img decoding=\"async\" src=\"https:\/\/liora.io\/app\/uploads\/sites\/7\/2020\/07\/Capture-d\u2019e\u0301cran-2020-07-21-a\u0300-08.45.28-1024x316.png\" alt=\"transfer learning\" \/><figcaption class=\"wp-element-caption\">Figura 1 \u2013 Enfoque tradicional vs. enfoque de Transfer Learning<\/figcaption><\/figure>\n\n\n\n<p>Como vemos, el Transfer Learning se inspira en el proceso natural de aprendizaje.<\/p>\n\n\n\n<blockquote class=\"wp-block-quote is-layout-flow wp-block-quote-is-layout-flow\">\n<p><em>Tomemos el ejemplo de alguien que toca la guitarra y quiere aprender a tocar el piano. Esta persona puede capitalizar sus conocimientos sobre m\u00fasica para aprender a tocar un nuevo instrumento. De la misma manera, un modelo de reconocimiento de autom\u00f3viles puede ser adaptado para reconocer camiones.<\/em><\/p>\n<\/blockquote>\n\n\n\n<h2 class=\"wp-block-heading\" id=\"h-sobre-cuales-estrategias-se-apoyan-las-tecnicas-de-transfer-learning\">\u00bfSobre cu\u00e1les estrategias se apoyan las t\u00e9cnicas de Transfer Learning?<\/h2>\n\n\n\n<p>El Transfer Learning se basa en una idea simple, la de re explotar los conocimientos adquiridos por otras configuraciones (fuentes), para resolver un problema en particular (objetivos). En este contexto, podemos distinguir diferentes abordajes seg\u00fan lo que se quiere transferir, y cuando y como se realiza la transferencia. En t\u00e9rminos generales, podemos distinguir <b>3 tipos de Transfer Learning :<\/b><\/p>\n\n\n\n<h3 class=\"wp-block-heading\" id=\"h-1-aprendizaje-por-transferencia-inductiva-o-inductive-transfer-learning\">1. Aprendizaje por transferencia inductiva o \u201cinductive transfer learning\u201d<\/h3>\n\n\n\n<p>En este enfoque, el campo de la fuente y el objetivo es el mismo (mismos datos), pero las tareas de fuente y objetivo son diferentes aunque parecidas. La idea consiste entonces en usar los modelos existentes para reducir de manera ventajosa el campo de aplicaci\u00f3n de los modelos posibles (sesgo del modelo), como lo ilustra la figura siguiente:<\/p>\n\n\n\n<figure class=\"wp-block-image aligncenter\" style=\"margin-top:var(--wp--preset--spacing--columns);margin-bottom:var(--wp--preset--spacing--columns)\"><img decoding=\"async\" src=\"https:\/\/liora.io\/app\/uploads\/sites\/7\/2020\/07\/Capture-d\u2019e\u0301cran-2020-07-21-a\u0300-08.45.33.png\" alt=\"Inductive Transfer Learning\" \/><figcaption class=\"wp-element-caption\">Figura 2: ilustraci\u00f3n del aprendizaje por transferencia inductiva o \u201cInductive Transfer Learning\u201d<\/figcaption><\/figure>\n\n\n\n<p>Por ejemplo, es posible utilizar un modelo entrenado para la detecci\u00f3n de animales en im\u00e1genes para construir un modelo capaz de identificar perros.<\/p>\n\n\n\n<h3 class=\"wp-block-heading\" id=\"h-2-aprendizaje-por-transferencia-no-supervisada-o-unsupervised-transfer-learning\">2. <strong>Aprendizaje por transferencia no supervisada, o \u201cUnsupervised Transfer Learning\u201d<\/strong><\/h3>\n\n\n\n<p>Como en el caso del aprendizaje por transferencia inductiva, los campos de la fuente y el objetivo son similares, aunque las tareas son diferentes. Sin embargo, los datos en ambos campos no est\u00e1n etiquetados.<\/p>\n\n\n\n<p>Generalmente es m\u00e1s f\u00e1cil obtener grandes cantidades de datos no etiquetados, a partir de bases de datos y fuentes en la web por ejemplo, que datos etiquetados. Es por esto que la idea de <strong>usar el aprendizaje no supervisado combinado con el Transfer Learning ha generado mucho inter\u00e9s.<\/strong><\/p>\n\n\n\n<p>Por ejemplo, el Self-taught clustering es un m\u00e9todo que permite realizar el clustering de peque\u00f1as colecciones de datos objetivo no etiquetados, con la ayuda de una gran cantidad de datos fuente no etiquetados. Este m\u00e9todo ha demostrado ser m\u00e1s efectivo que los m\u00e9todos de punta tradicionalmente utilizados, en los que los datos objetivo no son etiquetados de forma pertinente.<\/p>\n\n\n\n<h3 class=\"wp-block-heading\" id=\"h-3-aprendizaje-por-transferencia-transductiva-o-transductive-transfer-learning\">3. Aprendizaje por transferencia transductiva o \u201cTransductive Transfer Learning\u201d:<\/h3>\n\n\n\n<p>En este m\u00e9todo, las tareas fuente y objetivo son similares pero sus campos correspondientes son diferentes en t\u00e9rminos de datos o de distribuciones de probabilidad marginales.<\/p>\n\n\n\n<p>Por ejemplo, los modelos de NLP, como los que se utiliza para el etiquetado morfosint\u00e1ctico de palabras, Part-Of-Speech Tagger (POS Tagger) en ingl\u00e9s, son generalmente entrenados y testeados con datos de actualidad como los del Wall Street Journal. Pueden ser adaptados a datos extra\u00eddos de redes sociales, cuyo contenido es diferente pero se asemeja al de los peri\u00f3dicos.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\" id=\"h-como-se-aplica-concretamente-el-transfer-learning-para-la-resolucion-de-problemas-de-deep-learning\">\u00bfC\u00f3mo se aplica concretamente el Transfer Learning para la resoluci\u00f3n de problemas de Deep Learning?<\/h2>\n\n\n\n<p>Ahora que hemos definido el Transfer Learning, podemos enfocarnos en problemas de Deep Learning, que est\u00e1 teniendo un gran \u00e9xito \u00faltimamente.<\/p>\n\n\n\n<blockquote class=\"wp-block-quote is-layout-flow wp-block-quote-is-layout-flow\">\n<p><em>La utilizaci\u00f3n de m\u00e9todos de Transfer Learning en Deep Learning consiste principalmente en explotar redes neuronales pre-entrenadas.<\/em><\/p>\n<\/blockquote>\n\n\n\n<p>Generalmente, estos modelos corresponden a algoritmos de alto rendimiento que han sido desarrollados y entrenados sobre grandes bases de datos y que son hoy de libre acceso.<\/p>\n\n\n\n<p>En este contexto, se pueden distinguir 2 tipos de estrategias :<\/p>\n\n\n\n<h3 class=\"wp-block-heading\" id=\"h-1-utilizacion-de-modelos-pre-entrenados-como-extractores-de-features\">1. Utilizaci\u00f3n de modelos pre-entrenados como extractores de features :<\/h3>\n\n\n\n<p>La arquitectura de estos modelos de Deep Learning se presenta frecuentemente bajo la forma de un compilado de capas de neuronas. Estas capas adquieren diferentes caracter\u00edsticas en funci\u00f3n del nivel en el que se sit\u00faan. La \u00faltima capa (generalmente una capa enteramente conectada, en el caso del aprendizaje supervisado), es utilizada para obtener el resultado final. La siguiente figura ilustra la arquitectura de un modelo de Deep Learning utilizado para la detecci\u00f3n de gatos y perros. Mientras m\u00e1s profunda se sit\u00faa la capa, m\u00e1s permite extraer features espec\u00edficas.<\/p>\n\n\n\n<figure class=\"wp-block-image aligncenter\"><img decoding=\"async\" src=\"https:\/\/liora.io\/app\/uploads\/sites\/7\/2020\/07\/Capture-d\u2019e\u0301cran-2020-07-21-a\u0300-08.45.40-1024x406.png\" alt=\"transfer learning\" \/><figcaption class=\"wp-element-caption\">Figura 3: ejemplo de un modelo de redes neuronales para la clasificaci\u00f3n de im\u00e1genes.<\/figcaption><\/figure>\n\n\n\n<blockquote class=\"wp-block-quote is-layout-flow wp-block-quote-is-layout-flow\">\n<p><em>La idea es reutilizar una red pre-entrenada sin capa final. Esta nueva red funciona como un extractor de features fijas para realizar otras tareas.<\/em><\/p>\n<\/blockquote>\n\n\n\n<p>Para ilustrar esta estrategia, tomemos el caso en el que se desea<strong> c<\/strong><b>rear un modelo capaz de identificar la especie de una flor a partir de su imagen<\/b>. Para esto, ser\u00e1 posible utilizar las primeras capas de un modelo de red neuronal convolutivo <a href=\"https:\/\/en.wikipedia.org\/wiki\/AlexNet\">AlexNet<\/a>, que fue inicialmente entrenado sobre la base de im\u00e1genes <a href=\"https:\/\/en.wikipedia.org\/wiki\/ImageNet#ImageNet_Challenge\">ImageNet<\/a> para clasificar im\u00e1genes.<\/p>\n\n\n\n<p>La idea parece simple, lo que nos lleva a preguntarnos sobre el rendimiento de este m\u00e9todo. En la pr\u00e1ctica, funciona muy bien, como lo demuestra la siguiente figura.<\/p>\n\n\n\n<figure class=\"wp-block-image aligncenter\" style=\"margin-top:var(--wp--preset--spacing--columns);margin-bottom:var(--wp--preset--spacing--columns)\"><img decoding=\"async\" src=\"https:\/\/liora.io\/app\/uploads\/sites\/7\/2020\/07\/Capture-d\u2019e\u0301cran-2020-07-21-a\u0300-08.45.46.png\" alt=\"transfer learning\" \/><figcaption class=\"wp-element-caption\">Figura 4: Desempe\u00f1o de modelos Deep Learning espec\u00edficamente entrenados sobre la tarea (verde) en comparaci\u00f3n con modelos pre-entrenados (rojo, rosa).<\/figcaption><\/figure>\n\n\n\n<h3 class=\"wp-block-heading\" id=\"h-2-ajustes-de-modelos-pre-entrenados\">2. Ajustes de modelos pre-entrenados<\/h3>\n\n\n\n<p>Se trata de una<b> t\u00e9cnica m\u00e1s compleja,<\/b> en la que no solamente la \u00faltima capa es reemplazada para realizar la clasificaci\u00f3n o regresi\u00f3n, sino que tambi\u00e9n otras capas son re-entrenadas de manera selectiva. Las <b>redes neuronales profundas son arquitecturas altamente configurables <\/b>con diversos hiper-par\u00e1metros. Adem\u00e1s, mientras que las primeras capas captaron caracter\u00edsticas generales, las \u00faltimas capas se concentran principalmente en la tarea espec\u00edfica a cumplir, como lo muestra la siguiente figura :<\/p>\n\n\n\n<figure class=\"wp-block-image aligncenter\"><img decoding=\"async\" src=\"https:\/\/liora.io\/app\/uploads\/sites\/7\/2020\/07\/Capture-d\u2019e\u0301cran-2020-07-21-a\u0300-08.45.52-1024x540.png\" alt=\"mod\u00e8le de r\u00e9seau de neurone\" \/><figcaption class=\"wp-element-caption\">Figura 5 &#8211; Ejemplo de modelo de red de neuronas utilizado para reconocimiento facial.<\/figcaption><\/figure>\n\n\n\n<blockquote class=\"wp-block-quote is-layout-flow wp-block-quote-is-layout-flow\">\n<p><em>La idea es congelar, es decir fijar el peso de ciertas capas durante el entrenamiento y afinar el resto para responder al problema.<\/em><\/p>\n<\/blockquote>\n\n\n\n<p>Esta estrategia permite reutilizar los conocimientos en t\u00e9rminos de arquitectura global de la red y explotar sus estados como punto de partida para el entrenamiento. <b>Permite obtener mejores resultados en un tiempo de entrenamiento m\u00e1s corto.<\/b><\/p>\n\n\n\n<p>La siguiente figura recapitula los principales m\u00e9todos de Transfer Learning utilizados com\u00fanmente en Deep Learning.<\/p>\n\n\n\n<figure class=\"wp-block-image aligncenter\" style=\"margin-top:var(--wp--preset--spacing--columns);margin-bottom:var(--wp--preset--spacing--columns)\"><img decoding=\"async\" src=\"https:\/\/liora.io\/app\/uploads\/sites\/7\/2020\/07\/Capture-d\u2019e\u0301cran-2020-07-21-a\u0300-08.45.58-1024x642.png\" alt=\"transfer learning\" \/><figcaption class=\"wp-element-caption\">Figura 6: estrategia de Transfer Learning en Deep Learning<\/figcaption><\/figure>\n\n\n\n<p>Una de las <b>exigencias fundamentales<\/b> del aprendizaje por transferencia es la <b>presencia de modelos<\/b> que funcionen bien para las tareas fuente. Por suerte, existen varias arquitecturas de Deep Learning de punta que son hoy de libre acceso. Estas se extienden sobre diferentes campos como la visi\u00f3n por computadora o Computer Vision, y el Tratamiento Natural del Lenguaje o NLP, dos campos muy populares en Deep Learning.<\/p>\n\n\n\n<p>Entre los modelos m\u00e1s utilizados est\u00e1n:<\/p>\n\n\n\n<ul class=\"wp-block-list\">\n<li>Computer Vision : <a href=\"https:\/\/www.kaggle.com\/keras\/vgg16\/home\">VGG-16<\/a>, <a href=\"https:\/\/www.kaggle.com\/keras\/vgg19\/home\">VGG-19<\/a>, <a href=\"https:\/\/www.kaggle.com\/keras\/resnet50\">ResNet-50<\/a><\/li>\n\n\n\n<li>NLP : <a href=\"https:\/\/en.wikipedia.org\/wiki\/Word2vec\">Word2Vec<\/a>, <a href=\"https:\/\/nlp.stanford.edu\/projects\/glove\/\">GloVe<\/a><\/li>\n<\/ul>\n\n\n\n<h2 class=\"wp-block-heading\" id=\"h-puntos-claves-para-recordar\">Puntos claves para recordar :<\/h2>\n\n\n\n<p>El Transfer Learning corresponde a la capacidad de utilizar conocimientos existentes, desarrollados para la resoluci\u00f3n de problemas de datos, para resolver nuevos problemas. Hemos visto varios m\u00e9todos de Transfer Learning.<\/p>\n\n\n\n<p>Para poder elegir la mejor estrategia, es importante considerar las tres preguntas siguientes:<\/p>\n\n\n\n<ol class=\"wp-block-list\">\n<li>\u00bfQu\u00e9 queremos transferir? Es la primera pregunta a hacerse y la m\u00e1s importante. Busca definir qu\u00e9 parte de los conocimientos se quiere transferir de la fuente al objetivo, para responder al problema de la tarea objetivo.<\/li>\n\n\n\n<li>\u00bfCu\u00e1ndo queremos transferir? Pueden existir escenarios donde la aplicaci\u00f3n de m\u00e9todos de Transfer Learning lleven a una degradaci\u00f3n de los resultados. En realidad, estos resultados dependen de la similitud entre los campos y las tareas del objetivo y la fuente.<\/li>\n\n\n\n<li>\u00bfC\u00f3mo vamos a realizar la transferencia? Una vez que hemos respondido a la pregunta qu\u00e9 y cu\u00e1ndo, podemos identificar la t\u00e9cnica de Transfer Learning m\u00e1s adaptada al problema que queremos resolver.<\/li>\n<\/ol>\n\n\n\n<p>\u00a1Felicidades! \u00a1Has terminado nuestra serie <a href=\"https:\/\/liora.io\/es\/deep-learning-definicion\">Deep Learning<\/a>! Ahora ya sabes lo esencial sobre sus aplicaciones m\u00e1s exitosas, el funcionamiento de las redes neuronales, el CNN y ahora tambi\u00e9n el Transfer Learning! \u00bfQuieres aprender a\u00fan m\u00e1s sobre el Deep Learning? Descubre (y comienza ahora) una de nuestras formaciones especializadas<\/p>\n\n\n\n<div class=\"wp-block-buttons is-layout-flex wp-block-buttons-is-layout-flex is-content-justification-center\">\n<div class=\"wp-block-button\"><a class=\"wp-block-button__link wp-element-button\" href=\"https:\/\/liora.io\/es\/nuestros-cursos-de-data\">Descubrir las formaciones en data science<\/a><\/div>\n<\/div>\n\n\n\n<script type=\"application\/ld+json\">\n{\n  \"@context\": \"https:\/\/schema.org\",\n  \"@type\": \"FAQPage\",\n  \"mainEntity\": [\n    {\n      \"@type\": \"Question\",\n      \"name\": \"\u00bfSobre cu\u00e1les estrategias se apoyan las t\u00e9cnicas de Transfer Learning?\",\n      \"acceptedAnswer\": {\n        \"@type\": \"Answer\",\n        \"text\": \"Tres tipos principales: 1) Aprendizaje por transferencia inductiva (mismo campo, tareas diferentes pero similares \u2013 ej. modelo detecci\u00f3n animales adaptado para identificar perros). 2) Aprendizaje por transferencia no supervisada (campo similar, tareas diferentes, datos no etiquetados \u2013 ej. Self-taught clustering con datos fuente no etiquetados). 3) Aprendizaje por transferencia transductiva (tareas similares, campos diferentes en datos\/distribuciones \u2013 ej. POS Tagger adaptado de Wall Street Journal a redes sociales).\"\n      }\n    },\n    {\n      \"@type\": \"Question\",\n      \"name\": \"\u00bfC\u00f3mo se aplica concretamente el Transfer Learning para la resoluci\u00f3n de problemas de Deep Learning?\",\n      \"acceptedAnswer\": {\n        \"@type\": \"Answer\",\n        \"text\": \"Dos estrategias principales: 1) Utilizaci\u00f3n de modelos pre-entrenados como extractores de features (reutilizar red sin capa final como extractor fijo \u2013 ej. usar capas iniciales de AlexNet entrenado en ImageNet para identificar especies de flores). 2) Ajustes de modelos pre-entrenados (reemplazar \u00faltima capa y re-entrenar selectivamente otras capas \u2013 congelar ciertas capas fijando pesos, afinar el resto para el problema espec\u00edfico, obteniendo mejores resultados en menor tiempo).\"\n      }\n    }\n  ]\n}\n<\/script>\n","protected":false},"excerpt":{"rendered":"<p>Este art\u00edculo es el 5\u00b0 y \u00faltimo de nuestra serie sobre deep learning, y presenta en detalle la definici\u00f3n y el funcionamiento del Transfer Learning. Si quieres regresar a los art\u00edculos anteriores, aqu\u00ed est\u00e1 la lista : Indice : Andrew Ng, cient\u00edfico a cargo de Baidu y profesor de Stanford, ha anunciado en su popular [&hellip;]<\/p>\n","protected":false},"author":82,"featured_media":23761,"comment_status":"open","ping_status":"closed","sticky":false,"template":"","format":"standard","meta":{"_acf_changed":false,"editor_notices":[],"footnotes":""},"categories":[2440],"class_list":["post-137775","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-data-ia"],"acf":[],"_links":{"self":[{"href":"https:\/\/liora.io\/es\/wp-json\/wp\/v2\/posts\/137775","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/liora.io\/es\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/liora.io\/es\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/liora.io\/es\/wp-json\/wp\/v2\/users\/82"}],"replies":[{"embeddable":true,"href":"https:\/\/liora.io\/es\/wp-json\/wp\/v2\/comments?post=137775"}],"version-history":[{"count":3,"href":"https:\/\/liora.io\/es\/wp-json\/wp\/v2\/posts\/137775\/revisions"}],"predecessor-version":[{"id":184242,"href":"https:\/\/liora.io\/es\/wp-json\/wp\/v2\/posts\/137775\/revisions\/184242"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/liora.io\/es\/wp-json\/wp\/v2\/media\/23761"}],"wp:attachment":[{"href":"https:\/\/liora.io\/es\/wp-json\/wp\/v2\/media?parent=137775"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/liora.io\/es\/wp-json\/wp\/v2\/categories?post=137775"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}