{"id":154701,"date":"2022-04-07T14:25:06","date_gmt":"2022-04-07T13:25:06","guid":{"rendered":"https:\/\/multi.liora.io\/?p=154701"},"modified":"2026-02-09T15:42:07","modified_gmt":"2026-02-09T14:42:07","slug":"azure-data-factory-que-es-y-para-que-sirve","status":"publish","type":"post","link":"https:\/\/liora.io\/es\/azure-data-factory-que-es-y-para-que-sirve","title":{"rendered":"Azure Data Factory: \u00bfqu\u00e9 es y para qu\u00e9 sirve?"},"content":{"rendered":"<p><strong><b>En la era del Big Data, los datos brutos suelen estar desorganizados y almacenados en sistemas a veces dispares. Cuando estos datos est\u00e1n aislados, las empresas y los equipos de datos no pueden sacar el m\u00e1ximo partido de ellos ni tomar decisiones. La soluci\u00f3n Microsoft Azure Data Factory tiene como objetivo superar estas dificultades y permitir que estos datos en bruto -de diferentes fuentes- se conviertan en datos utilizables para el negocio.<\/b><\/strong><\/p>\t\t\n\t\t\t<h3> \u00bfQu\u00e9 es Azure Data Factory?<\/h3>\t\t\n\t\t<p><a href=\"https:\/\/azure.microsoft.com\/fr-fr\/services\/data-factory\/\"><strong>Azure Data Factory<\/strong><\/a> es un servicio dise\u00f1ado por Microsoft para permitir a los desarrolladores integrar diferentes fuentes de datos. Es una plataforma similar a <b>SSIS<\/b> que permite gestionar los datos que se tienen en f\u00edsico y en la nube.&nbsp;&nbsp;<\/p><p>Los <b>datos procedentes de las redes sociales<\/b> u otros sitios web son <b>principalmente textos<\/b>: comentarios sobre las publicaciones, rese\u00f1as sobre un producto, quejas en foros comunitarios, etc.<\/p><blockquote><p><i>Definici\u00f3n de SSIS: SSIS &#8211; SQL server integration services &#8211; es un componente del software Microsoft SQL Database que permite realizar migraciones de datos.<br><\/i><\/p><\/blockquote><p>Este servicio permite acceder a los datos in situ como en una base de datos SQL, pero tambi\u00e9n a los datos en la nube como en Azure SQL Database.<\/p><p>Azure Data Factory es una soluci\u00f3n perfecta cuando se trata de construir tuber\u00edas h\u00edbridas de <b>extracci\u00f3n-transformaci\u00f3n-carga<\/b> (ETL) o de <b>extracci\u00f3n-carga-transformaci\u00f3n<\/b> (ELT) y de integraci\u00f3n de datos.<\/p><blockquote><p><i>Un r\u00e1pido recordatorio: ETL es un tipo de proceso de integraci\u00f3n de datos que se refiere a tres pasos distintos pero interconectados (extracci\u00f3n, transformaci\u00f3n y carga). Se utiliza para sintetizar datos de m\u00faltiples fuentes una y otra vez para construir un almac\u00e9n de datos, un centro de datos o un lago de datos.<br><\/i><\/p><\/blockquote><p>Data Factory se ha convertido en una herramienta indispensable en la computaci\u00f3n en nube. En casi todos los proyectos, tendr\u00e1 que realizar actividades de movimiento de datos a trav\u00e9s de diferentes redes (locales y en la nube) y servicios (desde y hacia diferentes almacenamientos de Azure).<\/p><p>Data Factory es una herramienta especialmente \u00fatil para las organizaciones que est\u00e1n dando sus primeros pasos en la nube y que, por tanto, intentan conectar los datos locales con la nube. Para ello, Azure Data Factory cuenta con un <b>motor de ejecuci\u00f3n de integraci\u00f3n<\/b>, un servicio de pasarela que puede instalarse in situs y que garantiza una transferencia de datos \u00f3ptima y segura desde y hacia la nube.&nbsp;<\/p>\t\t\n\t\t\t<h3>\u00bfC\u00f3mo funciona Azure Data Factory?<\/h3>\t\t\n\t\t\t<h4>Conectar y recolecci\u00f3n de  datos<\/h4>\t\t\n\t\t<p>El primer paso es conectar y recopilar datos de diferentes fuentes, ya sean locales, en la nube, estructurados o no estructurados. Azure Data Factory permite conectar todas las diferentes fuentes de datos y servicios de procesamiento de datos. Luego se trata de trasladar los datos a una ubicaci\u00f3n centralizada. En el caso cl\u00e1sico, las empresas tienen que construir toda la infraestructura de datos para moverlos. Con Data Factory este paso es muy f\u00e1cil y r\u00e1pido.&nbsp;<\/p>\t\t\n\t\t\t<h4>Transformaci\u00f3n de datos<\/h4>\t\t\n\t\t<p>Una vez que los datos se encuentran en un almac\u00e9n de datos centralizado en la nube, Azure Data Factory permite a los equipos de datos procesar y transformar los datos recogidos utilizando los flujos de datos de mapeo de Azure Data Factory. Las fuentes de datos permiten a los ingenieros de datos construir y mantener gr\u00e1ficos de transformaci\u00f3n de datos que se ejecutan en Spark sin necesidad de entender los clusters de Spark o la programaci\u00f3n de Spark. Sin embargo, Azure Data Factory tambi\u00e9n le permite codificar todas estas transformaciones a mano si lo desea, y puede ejecutar sus transformaciones en servicios de computaci\u00f3n como HDInsight Hadoop, <strong><a href=\"https:\/\/liora.io\/es\/apache-spark-que-es\">Spark<\/a><\/strong>, Data Lake Analytics y Machine Learning.&nbsp;<\/p>\t\t\n\t\t\t<h4>Publicaci\u00f3n y control de datos <\/h4>\t\t\n\t\t<p>A continuaci\u00f3n, Azure Data Factory le permite <b>publicar sus datos<\/b>.&nbsp; Data Factory le ofrece soporte completo para pipelines CI\/CD \u2013 continuous integration\/continuous delivery -con Azure Devops, por ejemplo. Con esto, puede crear y desarrollar sus procesos ETL. As\u00ed, una vez transformados todos los datos en bruto, puede cargarlos en otras herramientas de an\u00e1lisis de Azure para que su personal pueda visualizarlos, tomar decisiones, supervisar los flujos de datos mediante una interfaz gr\u00e1fica y tomar decisiones. Por lo tanto, una vez creados los pipelines&nbsp; de datos, podr\u00e1 aprovechar el valor empresarial de sus datos. En esta fase, puede supervisar los pipelines y tener acceso a los \u00edndices de rendimiento o a sus tasas de \u00e9xito.&nbsp;<\/p>\t\t\n\t\t\t\n<div class=\"wp-block-buttons is-layout-flex wp-block-buttons-is-layout-flex is-content-justification-center\"><div class=\"wp-block-button \"><a class=\"wp-block-button__link wp-element-button \" href=\"https:\/\/liora.io\/es\/formacion-data-engineer\">Descubre nuestras formaciones Azure<\/a><\/div><\/div>\n\n\t\t\t<h3>Azure Data Factory vs  herramientas ETL tradicionales<\/h3>\t\t\n\t\t<p>Azure Data Factory es una de las mejores opciones a la hora de construir pipelines ETL (o ELT) en la nube e h\u00edbridos. Hay algunas caracter\u00edsticas que diferencian a Azure Data Factory de otras herramientas.<\/p><ul><li style=\"font-weight: 400;\" aria-level=\"1\">La capacidad de ejecutar paquetes SSIS.<\/li><\/ul><ul><li style=\"font-weight: 400;\" aria-level=\"1\">Adaptaci\u00f3n autom\u00e1tica seg\u00fan la carga de trabajo dada. De hecho, Azure Data Factory va un paso m\u00e1s all\u00e1 al asegurar a sus clientes que el precio de Data Factory se basa en el uso. El n\u00famero de actividades (pasos de procesamiento de datos) al mes y el uso del tiempo de ejecuci\u00f3n de la integraci\u00f3n se cobra por horas, en funci\u00f3n de la m\u00e1quina y del n\u00famero de nodos utilizados.<\/li><li style=\"font-weight: 400;\" aria-level=\"1\">Enlace entre los sistemas locales y la nube de Azure sin problemas a trav\u00e9s de una pasarela.<\/li><li style=\"font-weight: 400;\" aria-level=\"1\">Maneja grandes vol\u00famenes de datos que son cr\u00edticos en la era del Big Data<\/li><li style=\"font-weight: 400;\" aria-level=\"1\">Capacidad de conectar y trabajar con otros servicios de computaci\u00f3n (Azure Batch, HDInsights) para ejecutar c\u00e1lculos de datos realmente grandes durante el ETL.<\/li><\/ul><p>Por \u00faltimo, una de las mayores ventajas es su r\u00e1pida y f\u00e1cil integraci\u00f3n con otros recursos de Azure Compute &amp; Storage. Hay dos tipos de servicios enlazados, es decir, cadenas de conexi\u00f3n, que se pueden definir:<\/p><ul><li style=\"font-weight: 400;\" aria-level=\"1\">Un servicio de almacenamiento para representar una tienda de datos &#8211; datamart &#8211; que incluye: Azure SQL Database, Azure SQL Data Warehouse, una base de datos local, un lago de datos, un sistema de archivos, <a href=\"https:\/\/liora.io\/es\/sql-vs-nosql-diferencias-usos-ventajas-y-inconvenientes\"><strong>una BD NoSQL<\/strong><\/a>, etc.<\/li><li style=\"font-weight: 400;\" aria-level=\"1\">Un servicio inform\u00e1tico para <b>transformar y enriquecer<\/b> los datos: por ejemplo, Azure HDInsight, Azure Machine Learning, procedimiento almacenado en cualquier SQL, actividad U-SQL Data Lake Analytics, Azure Databricks y\/o Azure Batch (utilizando una actividad personalizada).<\/li><\/ul><p>Los datos requieren software y servicios que puedan agilizar los procesos para limpiar los datos brutos almacenados en los sistemas y convertirlos en datos que puedan ser utilizados por los equipos de datos. Hoy en d\u00eda, dominar un software como Azure Data Factory es esencial para la profesi\u00f3n de ingeniero de datos y cient\u00edfico de datos.&nbsp;<\/p><p>Si quiere saber m\u00e1s sobre las profesiones esenciales de los datos, inf\u00f3rmese sobre la formaci\u00f3n de Ingeniero de Datos impartida por Liora y certificada por MINES ParisTech.<\/p>\t\t\n\t\t\t\n<div class=\"wp-block-buttons is-layout-flex wp-block-buttons-is-layout-flex is-content-justification-center\"><div class=\"wp-block-button \"><a class=\"wp-block-button__link wp-element-button \" href=\"https:\/\/liora.io\/es\/formacion-data-engineer\">Descubre el curso de formaci\u00f3n de Ingeniero de Datos link<\/a><\/div><\/div>\n","protected":false},"excerpt":{"rendered":"<p>En la era del Big Data, los datos brutos suelen estar desorganizados y almacenados en sistemas a veces dispares. Cuando estos datos est\u00e1n aislados, las empresas y los equipos de datos no pueden sacar el m\u00e1ximo partido de ellos ni tomar decisiones. La soluci\u00f3n Microsoft Azure Data Factory tiene como objetivo superar estas dificultades y [&hellip;]<\/p>\n","protected":false},"author":74,"featured_media":91365,"comment_status":"open","ping_status":"open","sticky":false,"template":"elementor_theme","format":"standard","meta":{"_acf_changed":false,"editor_notices":[],"footnotes":""},"categories":[2440],"class_list":["post-154701","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-data-ia"],"acf":[],"_links":{"self":[{"href":"https:\/\/liora.io\/es\/wp-json\/wp\/v2\/posts\/154701","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/liora.io\/es\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/liora.io\/es\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/liora.io\/es\/wp-json\/wp\/v2\/users\/74"}],"replies":[{"embeddable":true,"href":"https:\/\/liora.io\/es\/wp-json\/wp\/v2\/comments?post=154701"}],"version-history":[{"count":1,"href":"https:\/\/liora.io\/es\/wp-json\/wp\/v2\/posts\/154701\/revisions"}],"predecessor-version":[{"id":183544,"href":"https:\/\/liora.io\/es\/wp-json\/wp\/v2\/posts\/154701\/revisions\/183544"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/liora.io\/es\/wp-json\/wp\/v2\/media\/91365"}],"wp:attachment":[{"href":"https:\/\/liora.io\/es\/wp-json\/wp\/v2\/media?parent=154701"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/liora.io\/es\/wp-json\/wp\/v2\/categories?post=154701"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}