{"id":140693,"date":"2022-01-25T16:23:41","date_gmt":"2022-01-25T15:23:41","guid":{"rendered":"https:\/\/multi.liora.io\/?p=140693"},"modified":"2026-02-24T16:29:05","modified_gmt":"2026-02-24T15:29:05","slug":"random-forest-bosque-aleatorio-definicion-y-funcionamiento","status":"publish","type":"post","link":"https:\/\/liora.io\/es\/random-forest-bosque-aleatorio-definicion-y-funcionamiento","title":{"rendered":"Random Forest: Bosque aleatorio. Definici\u00f3n y funcionamiento"},"content":{"rendered":"\n<p><strong>Un random forest (o bosque aleatorio en espa\u00f1ol) es una t\u00e9cnica de Machine Learning muy popular entre los Data Scientist y con raz\u00f3n : presenta muchas ventajas en comparaci\u00f3n con otros algoritmos de datos.<\/strong><\/p>\n\n\n\n<p>Es una t\u00e9cnica f\u00e1cil de interpretar, estable, que por lo general presenta buenas coincidencias y que se puede utilizar en tareas de regresi\u00f3n o de clasificaci\u00f3n. Cubre, por tanto, gran parte de los problemas de <b>Machine Learning<\/b>. En random forest primero encontramos la palabra \u201cforest\u201d (bosque, en espa\u00f1ol). Se entiende que ese algoritmo se basa en \u00e1rboles que se suelen llamar <b>\u00e1rboles de decisi\u00f3n<\/b>.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\" id=\"h-un-ejemplo-de-arbol-de-decision\">Un ejemplo de \u00e1rbol de decisi\u00f3n<\/h2>\n\n\n\n<p>Como su nombre indica, un \u00e1rbol de decisi\u00f3n ayuda a <a href=\"https:\/\/liora.io\/es\/formacion-data-scientist\">Data Scientist<\/a> a <b>tomar una decisi\u00f3n<\/b> gracias a una <b>serie de preguntas<\/b> (tambi\u00e9n llamadas tests) cuya respuesta (s\u00ed o no) <b>llevar\u00e1 a la decisi\u00f3n final<\/b>. Tomemos un <b>ejemplo de clasificaci\u00f3n binaria<\/b>: queremos saber si una seta es comestible en funci\u00f3n de los siguientes <b>criterios (o <i>features<\/i><\/b>, <b>en ingl\u00e9s)<\/b>: color, tama\u00f1o de la seta, forma del sombrero, olor, tama\u00f1o del pie, presencia de manchas, etc.<\/p>\n\n\n\n<figure class=\"wp-block-image aligncenter\"><img decoding=\"async\" src=\"https:\/\/liora.io\/app\/uploads\/sites\/7\/2020\/09\/unnamed-3.png\" alt=\"arbre de d\u00e9cision\" \/><figcaption class=\"wp-element-caption\">Exemple d&#8217;arbre de d\u00e9cision<\/figcaption><\/figure>\n\n\n\n<blockquote class=\"wp-block-quote is-layout-flow wp-block-quote-is-layout-flow\">\n<p><i>En el \u00e1rbol, cada <\/i><b><i>pregunta corresponde a un nudo<\/i><\/b><i>, es decir, <\/i><b><i>un lugar en el que una rama se bifurca en dos<\/i><\/b><i>. En funci\u00f3n de la respuesta a cada pregunta, vamos a dirigirnos hacia tal o tal rama del \u00e1rbol para <\/i><b><i>llegar a una hoja<\/i><\/b><i> (o extremidad) que contenga la respuesta a nuestra pregunta.<\/i><\/p>\n<\/blockquote>\n\n\n\n<p>Tal vez te preguntar\u00e1s c\u00f3mo se elige el orden de las preguntas: <b>\u00bfpor qu\u00e9 empezar por una u otra?<\/b><\/p>\n\n\n\n<p>En cada nudo, el algoritmo se pregunta <b>qu\u00e9 pregunta deber\u00eda hacer<\/b>, es decir si hay que interesarse m\u00e1s bien por el olor, la forma del sombrero o el tama\u00f1o de la seta. Por tanto, calcular\u00e1 para cada <i>feature <\/i>la <b>ganancia de informaci\u00f3n<\/b> que se obtendr\u00eda si eligi\u00e9semos ese <i>feature<\/i>. Queremos maximizar la ganancia de informaci\u00f3n, por eso el \u00e1rbol elige la pregunta y de ese modo el <b><i>feature<\/i><\/b><b> maximiza la ganancia<\/b>.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\" id=\"h-el-bosque-como-la-combinacion-de-arboles\">El bosque como la combinaci\u00f3n de \u00e1rboles<\/h2>\n\n\n\n<p><i>Random forest<\/i> es lo que se llama un m\u00e9todo de conjunto (o ensemble method, en ingl\u00e9s), es decir que \u201cpone junto\u201d o combina resultados para obtener un superresultado final. Pero, \u00bflos resultados de qu\u00e9? Simplemente de los diferentes \u00e1rboles de decisi\u00f3n que la componen.<\/p>\n\n\n\n<p>Los <b><i>random forest<\/i><\/b> pueden constar <b>de varias decenas, incluso centenas de \u00e1rboles, el n\u00famero de \u00e1rboles es un par\u00e1metro que por lo general, se ajusta mediante validaci\u00f3n cruzada<\/b> (o cross-validation, en ingl\u00e9s). Para abreviar, la validaci\u00f3n cruzada es una t\u00e9cnica de evaluaci\u00f3n de un algoritmo de <b>Machine Learning<\/b> que consiste en entrenar y probar el modelo en fragmentos de la <b>serie de datos<\/b> de partida.<\/p>\n\n\n\n<blockquote class=\"wp-block-quote is-layout-flow wp-block-quote-is-layout-flow\">\n<p><b><i>Cada \u00e1rbol se entrena en un subconjunto <\/i><\/b><i>de la<\/i><b><i> serie de datos<\/i><\/b><i> y da un resultado (s\u00ed o no, en el caso de nuestro ejemplo de las setas). Posteriormente, <\/i><b><i>se combinan los resultados de todos los \u00e1rboles<\/i><\/b><i> de decisi\u00f3n para dar una respuesta final. <\/i><b><i>Cada \u00e1rbol \u201cvota\u201d<\/i><\/b><i> (s\u00ed o no) y la <\/i><b><i>respuesta final es la que tenga la mayor\u00eda de votos<\/i><\/b><i>.<\/i><\/p>\n<\/blockquote>\n\n\n\n<p>Es lo que se llama un <b>m\u00e9todo de <\/b><b><i>bagging<\/i><\/b>:<\/p>\n\n\n\n<ul class=\"wp-block-list\">\n<li><b>Dividimos<\/b> nuestra <b>serie de datos<\/b> en <b>varios subconjuntos compuestos aleatoriamente de muestras<\/b>, de ah\u00ed el \u201crandom\u201d de <i>random forest<\/i>.<\/li>\n\n\n\n<li>Se <b>entrena un modelo en cada subconjunto<\/b>: habr\u00e1 tantos modelos como subconjuntos.<\/li>\n\n\n\n<li>Se <b>combinan todos los resultados de los modelos<\/b> (con un sistema de voto, por ejemplo) lo que nos da un resultado final.<\/li>\n<\/ul>\n\n\n\n<p>De ese modo, se construye un <b>modelo robusto<\/b> a partir de varios modelos que no tienen por qu\u00e9 ser tan robustos. Para resumir, este algoritmo es muy popular por su capacidad de combinar los resultados de sus \u00e1rboles para obtener un resultado final m\u00e1s fiable. Su eficacia ha permitido que se utilice en muchos \u00e1mbitos como por ejemplo, el marketing telef\u00f3nico para predecir el comportamiento de los clientes o incluso, las finanzas para la gesti\u00f3n de riesgos.<\/p>\n\n\n\n<p>\u00bfQuieres empezar un curso de Machine Learning? Descubre nuestros cursos especializados de <a href=\"https:\/\/liora.io\/es\/formacion-data-analyst\">Data Analyst<\/a>, <a href=\"https:\/\/liora.io\/es\/formacion-data-scientist\">Data Scientist<\/a> o <a href=\"https:\/\/liora.io\/es\/formacion-data-engineer\">Data Engineer<\/a>.<\/p>\n\n\n\n<div class=\"wp-block-buttons is-layout-flex wp-block-buttons-is-layout-flex is-content-justification-center\">\n<div class=\"wp-block-button\"><a class=\"wp-block-button__link wp-element-button\" href=\"https:\/\/liora.io\/es\/cita\">Concertar cita en l\u00ednea<\/a><\/div>\n<\/div>\n\n\n\n<script type=\"application\/ld+json\">\n{\n  \"@context\": \"https:\/\/schema.org\",\n  \"@type\": \"FAQPage\",\n  \"mainEntity\": [\n    {\n      \"@type\": \"Question\",\n      \"name\": \"Un ejemplo de \u00e1rbol de decisi\u00f3n\",\n      \"acceptedAnswer\": {\n        \"@type\": \"Answer\",\n        \"text\": \"Un \u00e1rbol de decisi\u00f3n ayuda a tomar decisiones mediante preguntas (tests) cuya respuesta (s\u00ed\/no) lleva a la decisi\u00f3n final. Ejemplo: clasificar setas comestibles seg\u00fan color, tama\u00f1o, forma, olor, manchas. Cada pregunta es un nudo (bifurcaci\u00f3n). El algoritmo maximiza la ganancia de informaci\u00f3n en cada nudo, eligiendo qu\u00e9 feature (caracter\u00edstica) usar para la pregunta.\"\n      }\n    },\n    {\n      \"@type\": \"Question\",\n      \"name\": \"El bosque como la combinaci\u00f3n de \u00e1rboles\",\n      \"acceptedAnswer\": {\n        \"@type\": \"Answer\",\n        \"text\": \"Random Forest es un m\u00e9todo de conjunto (ensemble) que combina m\u00faltiples \u00e1rboles de decisi\u00f3n (decenas\/centenas). El n\u00famero de \u00e1rboles se ajusta por validaci\u00f3n cruzada. M\u00e9todo de bagging: dividir datos en subconjuntos aleatorios, entrenar un \u00e1rbol en cada uno, combinar resultados por votaci\u00f3n (respuesta final = mayor\u00eda de votos). As\u00ed se construye un modelo robusto a partir de modelos individuales menos robustos. Usos: marketing telef\u00f3nico (predecir comportamiento clientes), finanzas (gesti\u00f3n de riesgos).\"\n      }\n    }\n  ]\n}\n<\/script>\n","protected":false},"excerpt":{"rendered":"<p>Un random forest (o bosque aleatorio en espa\u00f1ol) es una t\u00e9cnica de Machine Learning muy popular entre los Data Scientist y con raz\u00f3n : presenta muchas ventajas en comparaci\u00f3n con otros algoritmos de datos. Es una t\u00e9cnica f\u00e1cil de interpretar, estable, que por lo general presenta buenas coincidencias y que se puede utilizar en tareas [&hellip;]<\/p>\n","protected":false},"author":88,"featured_media":184031,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"_acf_changed":false,"editor_notices":[],"footnotes":""},"categories":[2440],"class_list":["post-140693","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-data-ia"],"acf":[],"_links":{"self":[{"href":"https:\/\/liora.io\/es\/wp-json\/wp\/v2\/posts\/140693","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/liora.io\/es\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/liora.io\/es\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/liora.io\/es\/wp-json\/wp\/v2\/users\/88"}],"replies":[{"embeddable":true,"href":"https:\/\/liora.io\/es\/wp-json\/wp\/v2\/comments?post=140693"}],"version-history":[{"count":3,"href":"https:\/\/liora.io\/es\/wp-json\/wp\/v2\/posts\/140693\/revisions"}],"predecessor-version":[{"id":184034,"href":"https:\/\/liora.io\/es\/wp-json\/wp\/v2\/posts\/140693\/revisions\/184034"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/liora.io\/es\/wp-json\/wp\/v2\/media\/184031"}],"wp:attachment":[{"href":"https:\/\/liora.io\/es\/wp-json\/wp\/v2\/media?parent=140693"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/liora.io\/es\/wp-json\/wp\/v2\/categories?post=140693"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}