{"id":167160,"date":"2023-04-04T11:17:17","date_gmt":"2023-04-04T10:17:17","guid":{"rendered":"https:\/\/liora.io\/es\/?p=167160"},"modified":"2026-02-26T16:16:57","modified_gmt":"2026-02-26T15:16:57","slug":"chatgpt-como-funciona-este-algoritmo-de-pnl","status":"publish","type":"post","link":"https:\/\/liora.io\/es\/chatgpt-como-funciona-este-algoritmo-de-pnl","title":{"rendered":"ChatGPT: \u00bfC\u00f3mo funciona este algoritmo de PNL?"},"content":{"rendered":"\n<p><strong>Seguro que ya has o\u00eddo hablar de ChatGPT, la herramienta capaz de responder a todas tus preguntas en tiempo real. Lanzada a finales de 2022, parece revolucionar el campo de la inteligencia artificial. \u00a1Te lo contamos todo!<\/strong><\/p>\n\n\n\n<p><strong>ChatGPT (Chat Generative Pretrained Transformer)<\/strong> fue desarrollado en noviembre de 2022 por la empresa estadounidense <b>OpenAI<\/b>. Se trata de un <b>modelo de lenguaje<\/b> que permite a los usuarios comunicarse en tiempo real con un bot en un chat en l\u00ednea. El bot es capaz de mantener una conversaci\u00f3n en varios idiomas, responder a preguntas, transmitir informaci\u00f3n sobre numerosos temas o compartir ideas.<\/p>\n\n\n\n<p>Adem\u00e1s de estas distintas funciones, ChatGPT es capaz de <b>memorizar conversaciones<\/b><\/p>\n\n\n\n<h2 class=\"wp-block-heading\" id=\"h-pero-como-funciona-chatgpt\">Pero, \u00bfc\u00f3mo funciona ChatGPT?<\/h2>\n\n\n\n<p>ChatGPT es un algoritmo de <a href=\"https:\/\/liora.io\/es\/nlp-natural-language-processing-introduccion\">NLP (Natural Language Processing)<\/a> que comprende y genera un <b>lenguaje natural<\/b> de forma aut\u00f3noma. Para ser m\u00e1s precisos, es una versi\u00f3n dedicada al gran p\u00fablico de GPT3, un algoritmo que genera texto especializado en la redacci\u00f3n de art\u00edculos y el an\u00e1lisis de sentimientos. De esta manera, ChatGPT funciona como GPT3, gracias a un modelo previamente entrenado sobre un enorme corpus de 500 000 millones de datos de texto. Utiliza dos tipos diferentes de aprendizaje: el <b>aprendizaje supervisado<\/b> y el <b>reinforcement learning<\/b>.<\/p>\n\n\n\n<p>Durante la fase de aprendizaje supervisado, recibe conversaciones en las que se interpretan ambos roles (bot y usuario) de forma que se etiquetan los datos (preguntas y respuestas esperadas asociadas). Durante la fase de aprendizaje reforzado, se utilizan las interacciones anteriores para clasificar las respuestas. Esta clasificaci\u00f3n la realizan entrenadores humanos (<b>Reinforcement Learning from Human Feedback<\/b>) y permite crear un modelo de recompensa basado en esta clasificaci\u00f3n.<\/p>\n\n\n\n<p>Por ese motivo, adem\u00e1s del entrenamiento previo, el <b>algoritmo sigue autoentren\u00e1ndose durante sus interacciones con los usuarios<\/b>. Esto es lo que le permite recordar el contexto y los mensajes de una conversaci\u00f3n.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\" id=\"h-reinforcement-learning-from-human-feedback-al-detalle\">Reinforcement Learning from Human Feedback al detalle<\/h2>\n\n\n\n<p>Como ya se ha mencionado, la <b>fase de<\/b> <b>reinforcement learning <\/b>es, m\u00e1s concretamente, una fase de <b>Reinforcement Learning from Human Feedback (RLHF)<\/b> que funciona con entrenadores humanos reales. Esta fase se divide en dos etapas, que especificamos:<\/p>\n\n\n\n<ol class=\"wp-block-list\">\n<li>Tras realizar la fase de aprendizaje supervisado sobre datos etiquetados y aprender una fuente supervisada, se genera un modelo\u00a0<b>SFT (Supervised Fine Tuning)<\/b>. A continuaci\u00f3n, los formadores humanos votan sobre la idoneidad de los resultados del modelo, creando un conjunto de datos de comparaci\u00f3n sobre el que se entrena un\u00a0<b>modelo de recompensas RM (Reward Model).<\/b><\/li>\n\n\n\n<li>El modelo de recompensa RM se optimiza mediante\u00a0<b>el algoritmo de<\/b>\u00a0<b>reinforcement learning PPO<\/b>. El algoritmo PPO es un algoritmo \u00abon-policy\u00bb que aprende y actualiza las pol\u00edticas actuales bas\u00e1ndose directamente en las acciones y recompensas obtenidas. Esto genera un nuevo modelo, denominado \u00abPolicy Model\u00bb.<\/li>\n<\/ol>\n\n\n\n<p>Este \u00abPolicy Model\u00bb mejora el <b>modelo inicial<\/b> <b>SFT <\/b>y proporciona un nuevo <a href=\"https:\/\/liora.io\/dataset-definition\">dataset<\/a> comparativo. A partir de ah\u00ed, los dos pasos pueden repetirse en bucle.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\" id=\"h-preguntemos-a-chatgpt-por-los-data-scientists\">\u00a1Preguntemos a ChatGPT por los Data Scientists!<\/h2>\n\n\n\n<p>Ahora que ya conocemos los principales modelos y algoritmos sobre los que se basa ChatGPT, vamos a probar juntos su rendimiento.<\/p>\n\n\n\n<p>Para ello, accedemos al chat en la siguiente direcci\u00f3n: <a href=\"https:\/\/chat.openai.com\/auth\/login\">https:\/\/chat.openai.com\/auth\/login<\/a>. A continuaci\u00f3n, le pedimos al bot que describa el rol de un <strong>Data Scientist<\/strong>. Para obtener una respuesta optimizada, utilizamos un prompt preciso, es decir, una formulaci\u00f3n clara que orienta la conversaci\u00f3n de manera efectiva.<\/p>\n\n\n\n<figure class=\"wp-block-image size-large is-resized\"><img decoding=\"async\" src=\"https:\/\/liora.io\/app\/uploads\/sites\/7\/2023\/04\/Respuestas-chatgpt.png\" alt=\"\" style=\"width:1000px;height:auto\" \/><\/figure>\n\n\n\n<div class=\"wp-block-buttons is-layout-flex wp-block-buttons-is-layout-flex is-content-justification-center\" style=\"margin-top:var(--wp--preset--spacing--columns);margin-bottom:var(--wp--preset--spacing--columns)\">\n<div class=\"wp-block-button\"><a class=\"wp-block-button__link wp-element-button\" href=\"https:\/\/liora.io\/es\/nuestros-cursos-de-data\">Estudiar los mecanismos de ChatGPT<\/a><\/div>\n<\/div>\n\n\n\n<p>ChatGPT es capaz de informarnos sobre <a href=\"https:\/\/liora.io\/es\/curso-data-scientist-en-linea\"><u>el trabajo del Data Scientist<\/u><\/a> y de continuar la conversaci\u00f3n que hemos iniciado. Este es un peque\u00f1o atisbo de las habilidades de esta herramienta, que no solo es una fuente de informaci\u00f3n, sino que tambi\u00e9n puede escribir un texto, resumir otro o proponer contenidos relacionados con un tema. Por tanto, \u00a1su desarrollo <b>podr\u00eda competir con redactores<\/b>!<\/p>\n\n\n<h2 class=\"wp-block-heading\" id=\"y-los-desarrolladores\">&iquest;Y los desarrolladores?<\/h2>\n\n\n\n<p>ChatGPT tambi\u00e9n tiene recursos que normalmente solo est\u00e1n al alcance de los <b>desarrolladores inform\u00e1ticos<\/b>. En efecto, puede generar c\u00f3digo en varios lenguajes de programaci\u00f3n (<a href=\"https:\/\/liora.io\/es\/python-un-zoom-en-el-lenguaje-mas-popular\"><u>Python<\/u><\/a>, Java, C++&#8230;) y desarrollar un algoritmo para resolver un problema. Para obtener tal resultado, basta con indicar claramente lo que debe devolver el c\u00f3digo que se va a generar. Tambi\u00e9n se utiliza en el campo del <b>debugging<\/b> y es capaz de identificar el origen de un fallo inform\u00e1tico y corregirlo, como cualquier otro software.<\/p>\n\n\n\n<p>Para los<a href=\"https:\/\/liora.io\/es\/el-sueldo-de-un-data-engineer-cuanto-gana-un-data-engineer\"> <u>Data Engineers<\/u><\/a>, ChatGPT tambi\u00e9n es \u00fatil ya que puede simular una <b>M\u00e1quina Virtual (VM) <\/b>con un terminal Linux.<\/p>\n\n\n\n<p>Por \u00faltimo, ChatGPT tambi\u00e9n puede <b>detectar vulnerabilidades<\/b> en un programa.<\/p>\n\n\n\n<p>As\u00ed pues, ChatGPT parece ser un modelo de PNL funcional desde el punto de vista de la redacci\u00f3n o de la inform\u00e1tica, \u00a1y esto se aplica a muchos campos!<\/p>\n\n\n<h2 class=\"wp-block-heading\" id=\"cuales-son-las-limitaciones-de-esta-herramienta\">&iquest;Cu&aacute;les son las limitaciones de esta herramienta?<\/h2>\n\n\n\n<p>Cuando se le pregunta, ChatGPT responde: <i>\u00abSoy un modelo de procesamiento del lenguaje entrenado por OpenAI. Mis conocimientos se limitan a la fecha de corte de mis datos de entrenamiento, que es 2021. No puedo navegar por Internet para consultar informaci\u00f3n ni acceder a datos que no est\u00e9n en mi memoria. Hago todo lo posible por responder a las preguntas de forma precisa y completa, pero puede que mi respuesta no siempre sea correcta o est\u00e9 actualizada\u201d<\/i>.<\/p>\n\n\n\n<p>De hecho, desde su lanzamiento, las principales cr\u00edticas que se han hecho a ChatGPT se refieren a <b>su<\/b> <b>l\u00edmite temporal<\/b>, ya que su conocimiento se detiene en los acontecimientos anteriores al a\u00f1o 2021, y las respuestas err\u00f3neas pueden hacer que se comparta informaci\u00f3n falsa, aunque la tasa de error siga siendo m\u00ednima.<\/p>\n\n\n\n<p>En cuanto al c\u00f3digo, ChatGPT tambi\u00e9n <b>tiene limitaciones<\/b>, ya que el c\u00f3digo generado puede contener muchos errores a partir de cierto nivel de dificultad. La herramienta se limita a programas cl\u00e1sicos y repetitivos, pero no es capaz de realizar tareas de an\u00e1lisis inform\u00e1tico, por ejemplo. Por \u00faltimo, sus <b>recursos en ciberseguridad<\/b> son f\u00e1cilmente accesibles y muchos temen que puedan ser utilizados por los hackers con fines malintencionados.<\/p>\n\n\n\n<p>Desde el punto de vista \u00e9tico, la herramienta se enfrenta a otros problemas. Se ha prohibido su uso y se ha vetado su acceso en <b>algunas escuelas estadounidenses<\/b> ante los numerosos casos de plagio.<\/p>\n\n\n\n<p>Por \u00faltimo, como cualquier modelo estad\u00edstico, ChatGPT tiene limitaciones emocionales. A diferencia de la <b>inteligencia humana<\/b>, no tiene pensamiento, intuici\u00f3n, moral ni emociones, lo que puede suponer un cierto peligro.<\/p>\n\n\n\n<p>As\u00ed que, como cualquier innovaci\u00f3n, <b>ChatGPT<\/b> tiene sus l\u00edmites. No obstante, sigue siendo una herramienta de <a href=\"https:\/\/liora.io\/es\/inteligencia-artificial-definicion\">inteligencia artificial<\/a> con un gran potencial cuyo rendimiento sigue mejorando con el tiempo.<\/p>\n\n\n\n<p>Si quieres descubrir otros temas relacionados con otros <b>algoritmos de PNL<\/b> y otros sectores en los que la IA est\u00e1 cobrando cada vez m\u00e1s protagonismo, <a href=\"https:\/\/liora.io\/es\/blog-es\">navega por nuestro blog<\/a>.<\/p>\n\n\n\n<div class=\"wp-block-buttons is-layout-flex wp-block-buttons-is-layout-flex is-content-justification-center\">\n<div class=\"wp-block-button\"><a class=\"wp-block-button__link wp-element-button\" href=\"https:\/\/liora.io\/es\/nuestros-cursos-de-data\">Descubrir los cursos de Liora<\/a><\/div>\n<\/div>\n\n\n\n<script type=\"application\/ld+json\">\n{\n  \"@context\": \"https:\/\/schema.org\",\n  \"@type\": \"FAQPage\",\n  \"mainEntity\": [\n    {\n      \"@type\": \"Question\",\n      \"name\": \"Pero, \u00bfc\u00f3mo funciona ChatGPT?\",\n      \"acceptedAnswer\": {\n        \"@type\": \"Answer\",\n        \"text\": \"ChatGPT es un algoritmo NLP (versi\u00f3n p\u00fablica de GPT3) entrenado previamente con 500.000 millones de datos texto. Usa dos tipos aprendizaje: supervisado (recibe conversaciones etiquetadas con preguntas y respuestas esperadas) y reinforcement learning (interacciones anteriores clasificadas por entrenadores humanos \u2013 Reinforcement Learning from Human Feedback). El algoritmo se autoentrena durante interacciones con usuarios, recordando contexto y mensajes de conversaci\u00f3n.\"\n      }\n    },\n    {\n      \"@type\": \"Question\",\n      \"name\": \"Reinforcement Learning from Human Feedback al detalle\",\n      \"acceptedAnswer\": {\n        \"@type\": \"Answer\",\n        \"text\": \"Fase RLHF con dos etapas: 1) aprendizaje supervisado genera modelo SFT (Supervised Fine Tuning). Entrenadores humanos votan idoneidad resultados, creando dataset comparativo para entrenar modelo recompensas RM (Reward Model). 2) RM optimizado con algoritmo PPO (reinforcement learning on-policy) generando nuevo 'Policy Model'. Este mejora modelo SFT inicial y proporciona nuevo dataset comparativo \u2013 los pasos pueden repetirse en bucle.\"\n      }\n    },\n    {\n      \"@type\": \"Question\",\n      \"name\": \"\u00a1Preguntemos a ChatGPT por los Data Scientists!\",\n      \"acceptedAnswer\": {\n        \"@type\": \"Answer\",\n        \"text\": \"Accediendo a chat.openai.com con prompt preciso (formulaci\u00f3n clara), ChatGPT puede describir rol Data Scientist, continuar conversaci\u00f3n, escribir textos, resumir, proponer contenidos relacionados \u2013 potencial competencia para redactores.\"\n      }\n    },\n    {\n      \"@type\": \"Question\",\n      \"name\": \"\u00bfY los desarrolladores?\",\n      \"acceptedAnswer\": {\n        \"@type\": \"Answer\",\n        \"text\": \"ChatGPT genera c\u00f3digo en varios lenguajes (Python, Java, C++) desarrollando algoritmos para resolver problemas (indicando claramente qu\u00e9 debe devolver). \u00datil para debugging (identifica origen fallos y corrige). Para Data Engineers: simula M\u00e1quina Virtual con terminal Linux. Detecta vulnerabilidades en programas.\"\n      }\n    },\n    {\n      \"@type\": \"Question\",\n      \"name\": \"\u00bfCu\u00e1les son las limitaciones de esta herramienta?\",\n      \"acceptedAnswer\": {\n        \"@type\": \"Answer\",\n        \"text\": \"Limitaciones: conocimiento hasta 2021 (no actualizado), respuestas err\u00f3neas pueden compartir informaci\u00f3n falsa (tasa m\u00ednima), c\u00f3digo con errores a partir cierta dificultad (solo programas cl\u00e1sicos\/repetitivos, no an\u00e1lisis inform\u00e1tico), recursos ciberseguridad f\u00e1cilmente accesibles (riesgo uso malintencionado), problemas \u00e9ticos (plagio, prohibido en algunas escuelas EE.UU.), limitaciones emocionales (sin pensamiento, intuici\u00f3n, moral, emociones \u2013 puede suponer peligro).\"\n      }\n    }\n  ]\n}\n<\/script>\n","protected":false},"excerpt":{"rendered":"<p>Seguro que ya has o\u00eddo hablar de ChatGPT, la herramienta capaz de responder a todas tus preguntas en tiempo real. Lanzada a finales de 2022, parece revolucionar el campo de la inteligencia artificial. \u00a1Te lo contamos todo! ChatGPT (Chat Generative Pretrained Transformer) fue desarrollado en noviembre de 2022 por la empresa estadounidense OpenAI. Se trata [&hellip;]<\/p>\n","protected":false},"author":47,"featured_media":167161,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"_acf_changed":false,"editor_notices":[],"footnotes":""},"categories":[2440],"class_list":["post-167160","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-data-ia"],"acf":[],"_links":{"self":[{"href":"https:\/\/liora.io\/es\/wp-json\/wp\/v2\/posts\/167160","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/liora.io\/es\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/liora.io\/es\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/liora.io\/es\/wp-json\/wp\/v2\/users\/47"}],"replies":[{"embeddable":true,"href":"https:\/\/liora.io\/es\/wp-json\/wp\/v2\/comments?post=167160"}],"version-history":[{"count":4,"href":"https:\/\/liora.io\/es\/wp-json\/wp\/v2\/posts\/167160\/revisions"}],"predecessor-version":[{"id":184553,"href":"https:\/\/liora.io\/es\/wp-json\/wp\/v2\/posts\/167160\/revisions\/184553"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/liora.io\/es\/wp-json\/wp\/v2\/media\/167161"}],"wp:attachment":[{"href":"https:\/\/liora.io\/es\/wp-json\/wp\/v2\/media?parent=167160"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/liora.io\/es\/wp-json\/wp\/v2\/categories?post=167160"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}