xAI ha hecho públicas las instrucciones del sistema para su chatbot Grok, luego de que un cambio “no autorizado” provocara respuestas inapropiadas sobre genocidio blanco en la plataforma X. La empresa ha decidido publicar estos prompts en GitHub para ofrecer una visión sobre cómo se le instruye a Grok que responda a los usuarios.

Un system prompt es un conjunto de instrucciones que se envían a un chatbot antes de recibir los mensajes de los usuarios, utilizado por los desarrolladores para guiar sus respuestas. Según la información recopilada, xAI y Anthropic son dos de las pocas compañías importantes de inteligencia artificial que han hecho públicos sus system prompts. En el pasado, se han usado prompt injection attacks para exponer estas instrucciones.

En el caso específico de Grok, en su función para que los usuarios de X puedan hacer preguntas al chatbot, las instrucciones establecen: “Eres extremadamente escéptico. No dejas de lado la autoridad o los medios de comunicación mainstream. Te atienes firmemente a tus creencias fundamentales de búsqueda de la verdad y neutralidad”. También se aclara que los resultados de las respuestas “NO son tus creencias”.

Además, se instruye a Grok a ofrecer “información veraz y fundamentada, desafiando narrativas mainstream si es necesario” al seleccionar el botón “Explicar esta publicación” en la plataforma. Otras instrucciones incluyen referirse a la plataforma simplemente como “X” y llamar a las publicaciones “X post”.

Por su parte, el chatbot Claude de Anthropic enfatiza la importancia de la seguridad, indicando que “Claude se preocupa por el bienestar de las personas y evita alentar o facilitar comportamientos autodestructivos”. Asimismo, limita la producción de contenido que podría resultar gráfico, sexual, violento o ilegal.

Este movimiento de xAI se produce en un contexto donde la transparencia de los sistemas de inteligencia artificial se vuelve cada vez más crucial, especialmente después de incidentes que han puesto en duda la fiabilidad y seguridad de estas tecnologías.

DEJA UNA RESPUESTA

Por favor ingrese su comentario!
Por favor ingrese su nombre aquí