{"id":130905,"date":"2026-01-28T11:26:58","date_gmt":"2026-01-28T10:26:58","guid":{"rendered":"https:\/\/multi.liora.io\/?p=130905"},"modified":"2026-02-06T09:43:27","modified_gmt":"2026-02-06T08:43:27","slug":"hola-daniel-que-es-la-normalizacion-de-datos","status":"publish","type":"post","link":"https:\/\/liora.io\/es\/hola-daniel-que-es-la-normalizacion-de-datos","title":{"rendered":"Hola, Daniel, \u00bfqu\u00e9 es la normalizaci\u00f3n de datos?"},"content":{"rendered":"Daniel es el soporte t\u00e9cnico de los cursos de Liora. Es el experto en todos los temas de Data Science y acompa\u00f1a a los alumnos durante su formaci\u00f3n. Hoy, logramos quitarle unos minutos de su precioso tiempo para que pueda responder nuestras preguntas sobre la estandarizaci\u00f3n de datos.\n\n<img decoding=\"async\" width=\"800\" height=\"439\" src=\"https:\/\/liora.io\/app\/uploads\/sites\/7\/2020\/12\/illu_hellodaniel_blog-46-1024x562.png\" alt=\"Normalisation des donn\u00e9es\" loading=\"lazy\" srcset=\"https:\/\/liora.io\/app\/uploads\/sites\/7\/2020\/12\/illu_hellodaniel_blog-46-1024x562.png 1024w, https:\/\/liora.io\/app\/uploads\/sites\/7\/2020\/12\/illu_hellodaniel_blog-46-300x165.png 300w, https:\/\/liora.io\/app\/uploads\/sites\/7\/2020\/12\/illu_hellodaniel_blog-46-768x422.png 768w, https:\/\/liora.io\/app\/uploads\/sites\/7\/2020\/12\/illu_hellodaniel_blog-46-1536x843.png 1536w, https:\/\/liora.io\/app\/uploads\/sites\/7\/2020\/12\/illu_hellodaniel_blog-46-2048x1124.png 2048w\" sizes=\"(max-width: 800px) 100vw, 800px\">\n\nYo : Hola, Daniel, s\u00e9 que te han debido de hacer esta pregunta muchas veces, pero veo que se habla constantemente de la estandarizaci\u00f3n de datos, \u00bfpuedes ayudarme a entender el concepto en pocas palabras?\n\n\n<div class=\"wp-block-buttons is-layout-flex wp-block-buttons-is-layout-flex is-content-justification-center\"><div class=\"wp-block-button \"><a class=\"wp-block-button__link wp-element-button \" href=\"https:\/\/liora.io\/es\/formacion-data-scientist\">Aprender a estandarizar datos<\/a><\/div><\/div>\n\n<h2 class=\"wp-block-heading\" id=\"h-y-matematicamente-como-es\">Y matem\u00e1ticamente \u00bfc\u00f3mo es?<\/h2>\nSi cogemos una variable num\u00e9rica con n observaciones que se puede escribir :\n\n<img decoding=\"async\" width=\"485\" height=\"85\" src=\"https:\/\/liora.io\/app\/uploads\/sites\/7\/2020\/12\/cap3.png\" alt=\"Normalisation des donn\u00e9es\" loading=\"lazy\" srcset=\"https:\/\/liora.io\/app\/uploads\/sites\/7\/2020\/12\/cap3.png 485w, https:\/\/liora.io\/app\/uploads\/sites\/7\/2020\/12\/cap3-300x53.png 300w\" sizes=\"(max-width: 485px) 100vw, 485px\">\n\nComo tenemos un n\u00famero finito de valores reales, podemos extraer varias informaciones estad\u00edsticas como el <strong>m\u00ednimo<\/strong>, el <strong>m\u00e1ximo<\/strong>, la media y la <strong>desviaci\u00f3n tipo<\/strong>.\n\nEl proceso de normalizaci\u00f3n solo necesita el m\u00ednimo y el m\u00e1ximo.\n<blockquote>La idea es la siguiente, llevamos todos los valores de la variable entre 0 y 1, y mantenemos las distancias entre los valores.<\/blockquote>\nSe hace muy f\u00e1cil, hay que aplicar la siguiente f\u00f3rmula :\n\n<strong>Daniel <\/strong>: Pues efectivamente, la estandarizaci\u00f3n, tal como la entendemos en el sector, es un concepto clave en el preprocesamiento de datos cuando tenemos que trabajar en un proyecto de Machine Learning.\n\nEn realidad, cuando hablamos de estandarizaci\u00f3n, hay dos procesos principales impl\u00edcitos: la normalizaci\u00f3n y la normalizaci\u00f3n est\u00e1ndar, m\u00e1s com\u00fanmente conocida como estandarizaci\u00f3n. Por lo general, estos dos procesos tienen la misma finalidad: redimensionar las variables num\u00e9ricas para que sean comparables en una escala com\u00fan.\n\n<img decoding=\"async\" width=\"429\" height=\"109\" src=\"https:\/\/liora.io\/app\/uploads\/sites\/7\/2020\/12\/cap1.png\" alt=\"Normalisation des donn\u00e9es\" loading=\"lazy\" srcset=\"https:\/\/liora.io\/app\/uploads\/sites\/7\/2020\/12\/cap1.png 429w, https:\/\/liora.io\/app\/uploads\/sites\/7\/2020\/12\/cap1-300x76.png 300w\" sizes=\"(max-width: 429px) 100vw, 429px\">\n<blockquote>En cuanto a la <strong>estandarizaci\u00f3n<\/strong>, la transformaci\u00f3n es m\u00e1s sutil que llevar el conjunto de valores entre 0 y 1. Su finalidad es llevar la <strong>media \u03bc a 0<\/strong> y la <strong>desviaci\u00f3n est\u00e1ndar \u03c3 a 1<\/strong>.<\/blockquote>\nUna vez m\u00e1s, el proceso no es nada complicamos si tenemos disponible la media \u03bc y la desviaci\u00f3n est\u00e1ndar \u03c3 de una variable determinada X = x<sub>1<\/sub> x<sub>2<\/sub> x<sub>n<\/sub> entonces la variable estandarizada se escribir\u00e1:\n<img decoding=\"async\" width=\"434\" height=\"122\" src=\"https:\/\/liora.io\/app\/uploads\/sites\/7\/2020\/12\/Capture-de\u0301cran-2020-12-30-a\u0300-16.18.58.png\" alt=\"Normalisation des donn\u00e9es\" loading=\"lazy\" srcset=\"https:\/\/liora.io\/app\/uploads\/sites\/7\/2020\/12\/Capture-de\u0301cran-2020-12-30-a\u0300-16.18.58.png 434w, https:\/\/liora.io\/app\/uploads\/sites\/7\/2020\/12\/Capture-de\u0301cran-2020-12-30-a\u0300-16.18.58-300x84.png 300w\" sizes=\"(max-width: 434px) 100vw, 434px\">\n<h2 class=\"wp-block-heading\" id=\"h-todo-esto-es-genial-pero-en-el-sector-de-los-data-para-que-sirve\">Todo esto es genial, pero en el sector de los data, \u00bfpara qu\u00e9 sirve?<\/h2>\nEn Data, a menudo tenemos que trabajar con datos digitales, y estos datos rara vez se <strong>pueden comparar en su estado bruto<\/strong>.\n<blockquote>\nTrabajar con datos de escala variable puede suponer un problema para su an\u00e1lisis, ya que una variable num\u00e9rica con un rango de valores incluido entre 0 y 10 000 ser\u00e1 m\u00e1s pesada en el an\u00e1lisis que una variable cuyos valores est\u00e9n entre 0 y 1, lo que causar\u00eda en consecuencia un problema de sesgo<\/blockquote>\nSin embargo, hay que tener cuidado de no considerar la estandarizaci\u00f3n como un paso obligatorio en el procesamiento de nuestros datos, \u00a1constituye una p\u00e9rdida inmediata de informaci\u00f3n y puede ser perjudicial en ciertos casos!\n\n<div class=\"wp-block-buttons is-layout-flex wp-block-buttons-is-layout-flex is-content-justification-center\"><div class=\"wp-block-button \"><a class=\"wp-block-button__link wp-element-button \" href=\"\/formation\/data-ia\/\">M\u00e1s informaci\u00f3n sobre los cursos de Data<\/a><\/div><\/div>\n\n<h2 class=\"wp-block-heading\" id=\"h-ahora-lo-entiendo-mejor-pero-hay-una-pregunta-que-sigue-sin-respuesta-como-se-estandarizan-concretamente-los-datos\">Ahora lo entiendo mejor, pero hay una pregunta que sigue sin respuesta, \u00bfc\u00f3mo se estandarizan concretamente los datos?<\/h2>\nEn <a href=\"https:\/\/liora.io\/es\/python-o-r-que-elegir\">Python<\/a> es muy sencillo, muchas bibliotecas lo permiten. Solo mencionar\u00e9 Scikit-learn porque es la m\u00e1s utilizada en <a href=\"https:\/\/liora.io\/es\/formacion-data-scientist\">Data Science<\/a>. Esta biblioteca proporciona funciones que realizan las normalizaciones deseadas en unas pocas l\u00edneas de c\u00f3digo muy simples.\n\nSin embargo, es importante poner los casos de uso en contexto, porque en la pr\u00e1ctica no basta con aplicar una normalizaci\u00f3n sin m\u00e1s a todos los datos que nos llegan cuando ya hemos normalizado nuestros datos de entrenamiento.\n\n\u00bfPor qu\u00e9? Por la sencilla raz\u00f3n de que no es posible aplicar esta misma transformaci\u00f3n a una muestra de prueba o a nuevos datos.\n\nPor supuesto, es posible centrar y reducir cualquier muestra de la misma manera, pero con una media y una desviaci\u00f3n tipo que ser\u00e1n diferentes a las usadas en el conjunto de entrenamiento.\n\nLos resultados obtenidos no ser\u00edan una representaci\u00f3n justa del rendimiento del modelo en su conjunto, ya que se aplica a datos nuevos.\n\nEntonces, en vez de aplicar directamente la funci\u00f3n de normalizaci\u00f3n, es mejor usar una funci\u00f3n de Scikit-Learn llamada Transformer <a href=\"https:\/\/liora.io\/es\/api-que-es-y-para-que-sirve\">API<\/a>, que permite ajustar (fit) un paso de preprocesamiento utilizando los datos de entrenamiento.\n\nDe ese modo, cuando la normalizaci\u00f3n, por ejemplo, se aplica a otras muestras, utilizar\u00e1 las mismas medias y desviaciones tipo ya guardadas.\n\nPara crear ese paso de preprocesamiento \u201cajustado\u201d, basta con usar la funci\u00f3n StandardScaler y luego ajustarla usando los datos de entrenamiento. Finalmente, para aplicarlo a una tabla de datos despu\u00e9s, solo habr\u00e1 que aplicarle scaler.transform().\n\nSer\u00eda igual para una normalizaci\u00f3n MinMax :\n\n\u00a1Genial, gracias Daniel!\n<h2 class=\"wp-block-heading\" id=\"h-si-queremos-formarnos-en-data-science-con-tus-consejos-como-lo-hacemos\">Si queremos formarnos en Data Science con tus consejos, \u00bfc\u00f3mo lo hacemos?<\/h2>\nEs muy f\u00e1cil, solo tienes que empezar uno de <a href=\"https:\/\/liora.io\/es\/nuestros-cursos-de-data\"> nuestros cursos en Data Science <\/a> ?. Si quieres descubrir la contribuci\u00f3n de Daniel a lo largo de uno de nuestros cursos, descubre la entrevista a dos de nuestros antiguos alumnos:\n\n\n<div class=\"wp-block-buttons is-layout-flex wp-block-buttons-is-layout-flex is-content-justification-center\"><div class=\"wp-block-button \"><a class=\"wp-block-button__link wp-element-button \" href=\"https:\/\/liora.io\/es\/nuestros-cursos-de-data\">Descubrir las pr\u00f3ximas fechas<\/a><\/div><\/div>\n","protected":false},"excerpt":{"rendered":"<p>Daniel es el soporte t\u00e9cnico de los cursos de Liora. Es el experto en todos los temas de Data Science y acompa\u00f1a a los alumnos durante su formaci\u00f3n. Hoy, logramos quitarle unos minutos de su precioso tiempo para que pueda responder nuestras preguntas sobre la estandarizaci\u00f3n de datos.<\/p>\n","protected":false},"author":85,"featured_media":30548,"comment_status":"open","ping_status":"open","sticky":false,"template":"elementor_theme","format":"standard","meta":{"_acf_changed":false,"editor_notices":[],"footnotes":""},"categories":[2440],"class_list":["post-130905","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-data-ia"],"acf":[],"_links":{"self":[{"href":"https:\/\/liora.io\/es\/wp-json\/wp\/v2\/posts\/130905","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/liora.io\/es\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/liora.io\/es\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/liora.io\/es\/wp-json\/wp\/v2\/users\/85"}],"replies":[{"embeddable":true,"href":"https:\/\/liora.io\/es\/wp-json\/wp\/v2\/comments?post=130905"}],"version-history":[{"count":3,"href":"https:\/\/liora.io\/es\/wp-json\/wp\/v2\/posts\/130905\/revisions"}],"predecessor-version":[{"id":183169,"href":"https:\/\/liora.io\/es\/wp-json\/wp\/v2\/posts\/130905\/revisions\/183169"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/liora.io\/es\/wp-json\/wp\/v2\/media\/30548"}],"wp:attachment":[{"href":"https:\/\/liora.io\/es\/wp-json\/wp\/v2\/media?parent=130905"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/liora.io\/es\/wp-json\/wp\/v2\/categories?post=130905"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}