{"id":167227,"date":"2023-04-20T08:38:56","date_gmt":"2023-04-20T07:38:56","guid":{"rendered":"https:\/\/liora.io\/es\/?p=167227"},"modified":"2026-02-09T15:37:39","modified_gmt":"2026-02-09T14:37:39","slug":"herramientas-habituales-de-un-data-scientist","status":"publish","type":"post","link":"https:\/\/liora.io\/es\/herramientas-habituales-de-un-data-scientist","title":{"rendered":"Herramientas habituales de un Data Scientist"},"content":{"rendered":"<style><br \/>\n.elementor-heading-title{padding:0;margin:0;line-height:1}.elementor-widget-heading .elementor-heading-title[class*=elementor-size-]>a{color:inherit;font-size:inherit;line-height:inherit}.elementor-widget-heading .elementor-heading-title.elementor-size-small{font-size:15px}.elementor-widget-heading .elementor-heading-title.elementor-size-medium{font-size:19px}.elementor-widget-heading .elementor-heading-title.elementor-size-large{font-size:29px}.elementor-widget-heading .elementor-heading-title.elementor-size-xl{font-size:39px}.elementor-widget-heading .elementor-heading-title.elementor-size-xxl{font-size:59px}<\/style>\n<p><strong><b>En la era del Big Data han surgido varios perfiles profesionales, entre ellos el de Data Scientist. Si nunca has o\u00eddo hablar de \u00e9l, te recomiendo que primero leas este art\u00edculo, pero para los que ya saben lo que hace un Data Scientist, vamos a ver las distintas herramientas que utilizan.<\/b><\/strong><\/p>\n<h3>Recogida de los datos<\/h3>\nLa primera etapa consiste en recopilar datos a trav\u00e9s de fuentes de datos. Es habitual encontrar aqu\u00ed el lenguaje preferido de la Data Science: Python para recopilar estos datos. Tambi\u00e9n es posible utilizar webscraping para recuperar datos de p\u00e1ginas web a trav\u00e9s de Selenium.&nbsp;&nbsp;\n\nTambi\u00e9n es posible consultar los datos de la empresa mediante <b>SQL<\/b>.\n<h4>Herramientas utilizadas:<\/h4>\n<style><br \/>\n.elementor-widget-image{text-align:center}.elementor-widget-image a{display:inline-block}.elementor-widget-image a img[src$=\".svg\"]{width:48px}.elementor-widget-image img{vertical-align:middle;display:inline-block}<\/style>\t\t\t\t\t\t\t\t\t\t\t\t<img decoding=\"async\" width=\"768\" height=\"802\" src=\"https:\/\/liora.io\/app\/uploads\/sites\/7\/2023\/04\/image3.webp\" alt=\"\" loading=\"lazy\" srcset=\"https:\/\/liora.io\/app\/uploads\/sites\/7\/2023\/04\/image3.webp 768w, https:\/\/liora.io\/app\/uploads\/sites\/7\/2023\/04\/image3-287x300.webp 287w\" sizes=\"(max-width: 768px) 100vw, 768px\">\n<img decoding=\"async\" width=\"740\" height=\"485\" src=\"https:\/\/liora.io\/app\/uploads\/sites\/7\/2023\/04\/image4.webp\" alt=\"\" loading=\"lazy\" srcset=\"https:\/\/liora.io\/app\/uploads\/sites\/7\/2023\/04\/image4.webp 740w, https:\/\/liora.io\/app\/uploads\/sites\/7\/2023\/04\/image4-300x197.webp 300w\" sizes=\"(max-width: 740px) 100vw, 740px\">\n<img decoding=\"async\" width=\"400\" height=\"400\" src=\"https:\/\/liora.io\/app\/uploads\/sites\/7\/2023\/04\/image9.webp\" alt=\"\" loading=\"lazy\" srcset=\"https:\/\/liora.io\/app\/uploads\/sites\/7\/2023\/04\/image9.webp 400w, https:\/\/liora.io\/app\/uploads\/sites\/7\/2023\/04\/image9-300x300.webp 300w, https:\/\/liora.io\/app\/uploads\/sites\/7\/2023\/04\/image9-150x150.webp 150w\" sizes=\"(max-width: 400px) 100vw, 400px\">\n<h3>\u00bfQu\u00e9 es la visualizaci\u00f3n? Una de las herramientas del Data Scientist<\/h3>\nLa visualizaci\u00f3n de datos te permite <strong>descubrir informaci\u00f3n oculta en los datos y descubrir tendencias dentro de tu conjunto de datos<\/strong>. <strong><a href=\"https:\/\/liora.io\/es\/todo-sobre-matplotlib-2\">Matplotlib<\/a><\/strong>, <strong><a href=\"https:\/\/liora.io\/es\/seaborn-la-herramienta-de-data-visualization-python\">Seaborn<\/a><\/strong> son herramientas cotidianas del Data Scientist. La visualizaci\u00f3n permite dar sentido a los datos de un vistazo. Es una forma r\u00e1pida de obtener informaci\u00f3n mediante la exploraci\u00f3n visual, la elaboraci\u00f3n de informes fiables y el intercambio de informaci\u00f3n. Todas las categor\u00edas de usuarios pueden dar sentido a la creciente cantidad de datos de tu empresa. <strong>Gracias a la visualizaci\u00f3n<\/strong>, el cerebro es capaz de procesar, absorber e interpretar grandes cantidades de informaci\u00f3n.\n<h4>Herramientas utilizadas:<\/h4>\n<img decoding=\"async\" width=\"512\" height=\"182\" src=\"https:\/\/liora.io\/app\/uploads\/sites\/7\/2023\/04\/image10.webp\" alt=\"\" loading=\"lazy\" srcset=\"https:\/\/liora.io\/app\/uploads\/sites\/7\/2023\/04\/image10.webp 512w, https:\/\/liora.io\/app\/uploads\/sites\/7\/2023\/04\/image10-300x107.webp 300w\" sizes=\"(max-width: 512px) 100vw, 512px\">\n<img decoding=\"async\" width=\"768\" height=\"384\" src=\"https:\/\/liora.io\/app\/uploads\/sites\/7\/2023\/04\/image2.webp\" alt=\"\" loading=\"lazy\" srcset=\"https:\/\/liora.io\/app\/uploads\/sites\/7\/2023\/04\/image2.webp 768w, https:\/\/liora.io\/app\/uploads\/sites\/7\/2023\/04\/image2-300x150.webp 300w\" sizes=\"(max-width: 768px) 100vw, 768px\">\n<img decoding=\"async\" width=\"660\" height=\"794\" src=\"https:\/\/liora.io\/app\/uploads\/sites\/7\/2023\/04\/image15.webp\" alt=\"\" loading=\"lazy\" srcset=\"https:\/\/liora.io\/app\/uploads\/sites\/7\/2023\/04\/image15.webp 660w, https:\/\/liora.io\/app\/uploads\/sites\/7\/2023\/04\/image15-249x300.webp 249w\" sizes=\"(max-width: 660px) 100vw, 660px\">\n<h3>An\u00e1lisis de datos \/ Preprocessing<\/h3>\nEl procesamiento de datos suele realizarlo el Data Scientist (o un equipo de Data Scientists). Es importante que se realice correctamente para que no repercuta negativamente en los pasos siguientes.&nbsp;\n\n&nbsp;Al trabajar con datos en bruto, el Data Scientist los convierte en una forma m\u00e1s legible, d\u00e1ndoles el formato y contexto necesarios para que puedan ser interpretados y utilizados por modelos de <strong>Machine Learning o Deep Learning<\/strong>.&nbsp;\n\n&nbsp;Aunque ingenuamente pensemos que una gran cantidad de datos es suficiente para tener un algoritmo potente, la mayor\u00eda de las veces los datos que tenemos no est\u00e1n adaptados y deben ser procesados antes de ser utilizados: <strong>esta es la etapa de preprocessing<\/strong>.\n<h4>Herramientas utilizadas:<\/h4>\n<img decoding=\"async\" width=\"768\" height=\"637\" src=\"https:\/\/liora.io\/app\/uploads\/sites\/7\/2023\/04\/image6.webp\" alt=\"\" loading=\"lazy\" srcset=\"https:\/\/liora.io\/app\/uploads\/sites\/7\/2023\/04\/image6.webp 768w, https:\/\/liora.io\/app\/uploads\/sites\/7\/2023\/04\/image6-300x249.webp 300w\" sizes=\"(max-width: 768px) 100vw, 768px\">\n<img decoding=\"async\" width=\"700\" height=\"754\" src=\"https:\/\/liora.io\/app\/uploads\/sites\/7\/2023\/04\/image17.webp\" alt=\"\" loading=\"lazy\" srcset=\"https:\/\/liora.io\/app\/uploads\/sites\/7\/2023\/04\/image17.webp 700w, https:\/\/liora.io\/app\/uploads\/sites\/7\/2023\/04\/image17-279x300.webp 279w\" sizes=\"(max-width: 700px) 100vw, 700px\">\n<img decoding=\"async\" width=\"474\" height=\"197\" src=\"https:\/\/liora.io\/app\/uploads\/sites\/7\/2023\/04\/image8-e1681901636607.webp\" alt=\"\" loading=\"lazy\" srcset=\"https:\/\/liora.io\/app\/uploads\/sites\/7\/2023\/04\/image8-e1681901636607.webp 474w, https:\/\/liora.io\/app\/uploads\/sites\/7\/2023\/04\/image8-e1681901636607-300x125.webp 300w\" sizes=\"(max-width: 474px) 100vw, 474px\">\n<h3>El Modeling<\/h3>\nEl modelado es una forma de modelar fen\u00f3menos con el objetivo de tomar decisiones estrat\u00e9gicas.&nbsp;\n\n&nbsp;Modelar significa representar el comportamiento de un fen\u00f3meno para ayudar a resolver un problema empresarial concreto.&nbsp;&nbsp;\n\nEn <strong><a href=\"https:\/\/liora.io\/es\/machine-learning-definicion-funcionamiento-usos\">Machine Learning<\/a><\/strong>, el algoritmo se construye sobre una \u00ab<b>representaci\u00f3n interna<\/b>\u00bb para poder realizar la tarea que se le pide (predicci\u00f3n, identificaci\u00f3n, etc.). Para ello, primero habr\u00e1 de introducir un conjunto de datos de ejemplo para que pueda entrenarse y mejorar, de ah\u00ed la palabra aprendizaje. Este conjunto de datos se denomina <b>training set<\/b>. Se denomina <b>instancia u observaci\u00f3n<\/b> a una entrada del conjunto de datos.&nbsp;&nbsp;\n\n&nbsp;Por tanto, hay dos formas posibles de modelar:\n<ul>\n \t<li style=\"font-weight: 400;\" aria-level=\"1\">Para analizar y explicar&nbsp;<\/li>\n \t<li style=\"font-weight: 400;\" aria-level=\"1\">Para predecir&nbsp;<\/li>\n<\/ul>\nEstas dos dimensiones pueden estar presentes en proporciones variables: no es solo una o la otra. Pero existe una tensi\u00f3n entre ellas: los modelos m\u00e1s predictivos no suelen ser los m\u00e1s explicativos, y viceversa.\n<h4>Herramientas utilizadas:<\/h4>\n<img decoding=\"async\" width=\"768\" height=\"441\" src=\"https:\/\/liora.io\/app\/uploads\/sites\/7\/2023\/04\/image12.webp\" alt=\"\" loading=\"lazy\" srcset=\"https:\/\/liora.io\/app\/uploads\/sites\/7\/2023\/04\/image12.webp 768w, https:\/\/liora.io\/app\/uploads\/sites\/7\/2023\/04\/image12-300x172.webp 300w\" sizes=\"(max-width: 768px) 100vw, 768px\">\n<img decoding=\"async\" width=\"768\" height=\"411\" src=\"https:\/\/liora.io\/app\/uploads\/sites\/7\/2023\/04\/image13.webp\" alt=\"\" loading=\"lazy\" srcset=\"https:\/\/liora.io\/app\/uploads\/sites\/7\/2023\/04\/image13.webp 768w, https:\/\/liora.io\/app\/uploads\/sites\/7\/2023\/04\/image13-300x161.webp 300w\" sizes=\"(max-width: 768px) 100vw, 768px\">\n<img decoding=\"async\" width=\"768\" height=\"189\" src=\"https:\/\/liora.io\/app\/uploads\/sites\/7\/2023\/04\/image14.webp\" alt=\"\" loading=\"lazy\" srcset=\"https:\/\/liora.io\/app\/uploads\/sites\/7\/2023\/04\/image14.webp 768w, https:\/\/liora.io\/app\/uploads\/sites\/7\/2023\/04\/image14-300x74.webp 300w\" sizes=\"(max-width: 768px) 100vw, 768px\">\n<img decoding=\"async\" width=\"768\" height=\"323\" src=\"https:\/\/liora.io\/app\/uploads\/sites\/7\/2023\/04\/image11.webp\" alt=\"\" loading=\"lazy\" srcset=\"https:\/\/liora.io\/app\/uploads\/sites\/7\/2023\/04\/image11.webp 768w, https:\/\/liora.io\/app\/uploads\/sites\/7\/2023\/04\/image11-300x126.webp 300w\" sizes=\"(max-width: 768px) 100vw, 768px\">\n<h3>Despliegue (MLOps)<\/h3>\nMLOps son las siglas de Machine Learning Operations. La definici\u00f3n de MLOps es un conjunto de pr\u00e1cticas y herramientas que pertenecen al \u00e1mbito de la Data. Es una especializaci\u00f3n dentro del perfil profesional de Data Scientist.&nbsp;\n<ul>\n \t<li style=\"font-weight: 400;\" aria-level=\"1\"><strong>ML de Machine Learning&nbsp;<\/strong><\/li>\n \t<li style=\"font-weight: 400;\" aria-level=\"1\"><strong>Ops de Operaciones&nbsp;<\/strong><\/li>\n<\/ul>\nEl desarrollo de m\u00e9todos MLOps responde a las crecientes necesidades de las empresas para llevar a cabo proyectos de datos, adoptando m\u00e9todos eficientes para el desarrollo, despliegue y control de un sistema de Machine Learning.&nbsp;\n\nLas herramientas y pr\u00e1cticas de <b>Machine Learning Operations<\/b> sirven sobre todo para aumentar la productividad de la empresa haciendo explotables al m\u00e1ximo los proyectos gracias a los datos. En efecto, MLOps permite <strong>optimizar cada lanzamiento de producci\u00f3n, facilitando la transici\u00f3n entre la fase de concepto y el proyecto real<\/strong>. Supervisa y actualiza continuamente el proceso que hay que seguir en funci\u00f3n de los nuevos datos. Es lo que se conoce como <strong>estrategia \u00abdata-driven\u00bb<\/strong>.&nbsp;\n\nMLOps es ante todo una cultura en desarrollo. Una cultura que capitaliza la capacidad de automatizar y actuar en todo el ciclo de vida de un modelo.\n<h4>Herramientas utilizadas:<\/h4>\n<img decoding=\"async\" width=\"768\" height=\"657\" src=\"https:\/\/liora.io\/app\/uploads\/sites\/7\/2023\/04\/image7.webp\" alt=\"\" loading=\"lazy\" srcset=\"https:\/\/liora.io\/app\/uploads\/sites\/7\/2023\/04\/image7.webp 768w, https:\/\/liora.io\/app\/uploads\/sites\/7\/2023\/04\/image7-300x257.webp 300w\" sizes=\"(max-width: 768px) 100vw, 768px\">\n<img decoding=\"async\" width=\"512\" height=\"512\" src=\"https:\/\/liora.io\/app\/uploads\/sites\/7\/2023\/04\/image5.webp\" alt=\"\" loading=\"lazy\" srcset=\"https:\/\/liora.io\/app\/uploads\/sites\/7\/2023\/04\/image5.webp 512w, https:\/\/liora.io\/app\/uploads\/sites\/7\/2023\/04\/image5-300x300.webp 300w, https:\/\/liora.io\/app\/uploads\/sites\/7\/2023\/04\/image5-150x150.webp 150w\" sizes=\"(max-width: 512px) 100vw, 512px\">\n<img decoding=\"async\" width=\"768\" height=\"239\" src=\"https:\/\/liora.io\/app\/uploads\/sites\/7\/2023\/04\/image16.webp\" alt=\"\" loading=\"lazy\" srcset=\"https:\/\/liora.io\/app\/uploads\/sites\/7\/2023\/04\/image16.webp 768w, https:\/\/liora.io\/app\/uploads\/sites\/7\/2023\/04\/image16-300x93.webp 300w\" sizes=\"(max-width: 768px) 100vw, 768px\">\n<h3>Conclusi\u00f3n<\/h3>\nSi quieres aprender a utilizar todas las herramientas que acabas de ver, no dudes en consultar los detalles del curso de Data Scientist en Liora.&nbsp;\n\n\n<div class=\"wp-block-buttons is-layout-flex wp-block-buttons-is-layout-flex is-content-justification-center\"><div class=\"wp-block-button \"><a class=\"wp-block-button__link wp-element-button \" href=\"https:\/\/liora.io\/es\/formacion-data-scientist\">Descubrir el curso de Data Scientist<\/a><\/div><\/div>\n","protected":false},"excerpt":{"rendered":"<p>En la era del Big Data han surgido varios perfiles profesionales, entre ellos el de Data Scientist. Si nunca has o\u00eddo hablar de \u00e9l, te recomiendo que primero leas este art\u00edculo, pero para los que ya saben lo que hace un Data Scientist, vamos a ver las distintas herramientas que utilizan. Recogida de los datos [&hellip;]<\/p>\n","protected":false},"author":74,"featured_media":167228,"comment_status":"open","ping_status":"open","sticky":false,"template":"elementor_theme","format":"standard","meta":{"_acf_changed":false,"editor_notices":[],"footnotes":""},"categories":[2440],"class_list":["post-167227","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-data-ia"],"acf":[],"_links":{"self":[{"href":"https:\/\/liora.io\/es\/wp-json\/wp\/v2\/posts\/167227","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/liora.io\/es\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/liora.io\/es\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/liora.io\/es\/wp-json\/wp\/v2\/users\/74"}],"replies":[{"embeddable":true,"href":"https:\/\/liora.io\/es\/wp-json\/wp\/v2\/comments?post=167227"}],"version-history":[{"count":1,"href":"https:\/\/liora.io\/es\/wp-json\/wp\/v2\/posts\/167227\/revisions"}],"predecessor-version":[{"id":183495,"href":"https:\/\/liora.io\/es\/wp-json\/wp\/v2\/posts\/167227\/revisions\/183495"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/liora.io\/es\/wp-json\/wp\/v2\/media\/167228"}],"wp:attachment":[{"href":"https:\/\/liora.io\/es\/wp-json\/wp\/v2\/media?parent=167227"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/liora.io\/es\/wp-json\/wp\/v2\/categories?post=167227"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}