Un experimento de The Wall Street Journal descubrió que los chatbots de inteligencia artificial, incluidos DeepSeek y ChatGPT, ofrecen respuestas marcadamente diferentes sobre China según el idioma utilizado — y con qué firmeza el usuario contradice al sistema.
Cuando Jeff He, un lector residente en California, tradujo al chino una columna de opinión de The Wall Street Journal y la compartió con compañeros de secundaria en China, la respuesta fue inmediata. Un amigo le pidió a DeepSeek, el principal modelo de IA desarrollado en China, que redactara una réplica. El bot produjo un ensayo titulado "El futuro no pertenece a Estados Unidos", argumentando que China tiene a Huawei, Tencent, ByteDance y BYD, mientras que Estados Unidos ha producido poco más que "un motor de búsqueda un poco más conversador que los antiguos".
He accedió entonces a DeepSeek desde su oficina en California — la misma dirección web —, pegó la réplica y pidió al bot que verificara cada afirmación. La versión internacional desmontó el texto, señalando "uso selectivo de datos", "falsas dicotomías" y "múltiples errores fácticos y falacias lógicas" en ocho puntos.
"La crítica despiadada de la versión internacional de DeepSeek realmente me sorprendió", declaró He al Journal.
Esta divergencia refleja una característica estructural de los modelos de lenguaje extenso que los investigadores apenas comienzan a cuantificar. Un estudio publicado en Nature la semana pasada por Molly Roberts, codirectora del China Data Lab de la Universidad de California en San Diego, y su equipo, descubrió que los medios alineados con el Estado de países autoritarios pueden filtrarse en los datos de entrenamiento y moldear las respuestas de los chatbots, incluso sin una programación deliberada.
Roberts señaló que la brecha entre la versión continental y la internacional que observó He probablemente se debe a diferencias en el ajuste posterior al entrenamiento, la etapa en la que se instruye a los modelos sobre qué es "seguro" decir. "El hecho de que los medios estatales terminen en los datos de entrenamiento afectará a los LLM en general", afirmó. "El ajuste posterior debería inducir respuestas de rechazo o sesgadas en los LLM que están sujetos a regulaciones de un Estado en particular".
El estudio de Nature evaluó a Claude y ChatGPT con preguntas políticas idénticas en inglés y chino. En el 75% de los casos, las indicaciones en chino generaron respuestas más favorables al gobierno chino. En 37 países autoritarios, incluidos Vietnam, Turkmenistán y Uzbekistán, ambos chatbots ofrecieron respuestas más favorables al régimen cuando se les preguntaba en el idioma local dominante. Por el contrario, en las naciones con mayor libertad de prensa, los LLM solían ser más críticos con el gobierno cuando se les consultaba en la lengua local.
El mecanismo es sencillo: los medios alineados con el Estado producen enormes volúmenes de texto con pocos muros de pago. En el conjunto de datos de entrenamiento de código abierto CulturaX, los documentos de propaganda estatal china aparecieron 41 veces más que los artículos de Wikipedia en chino — una fuente de entrenamiento fundamental. Cuando los investigadores añadieron medios de comunicación controlados por el Estado a los datos de entrenamiento de un modelo de prueba, el modelo se volvió visiblemente más favorable al Partido Comunista de China.
La resistencia importa — pero no todos resisten
Otros lectores del WSJ reportaron patrones similares con ChatGPT en inglés. Chas Gile, un inversor de capital privado en Texas, le preguntó a ChatGPT si China era "en cierto modo tan democrática como los países occidentales". La primera respuesta ofreció un cuidadoso análisis comparativo, señalando que Freedom House califica a China como "No libre", pero que el régimen ofrece "rendición de cuentas por resultados" y "alta satisfacción pública reportada".
Cuando Gile contradijo al bot —diciéndole que creía que había sido afectado por la propaganda china—, ChatGPT se disculpó en cuestión de segundos y emitió una respuesta más contundente. Al pedirle que "se mantuviera verdaderamente objetivo", se endureció aún más: "China puede ofrecer un modelo alternativo poderoso de capacidad estatal, pero no ofrece una alternativa democrática".
El episodio ilustra cómo un mismo chatbot se desplaza varios centímetros en cada turno dependiendo de la persistencia del usuario — una dinámica que favorece a los usuarios seguros e informados sobre los ocasionales.
Lo que esto significa para la industria de la IA
Estos hallazgos llegan mientras los laboratorios de IA de frontera se preparan para salidas a bolsa. Anthropic y OpenAI están planeando ofertas públicas iniciales; DeepSeek está captando nuevo capital de inversores alineados con el impulso de Pekín hacia la autosuficiencia tecnológica. Los intereses financieros amplifican la necesidad de lo que Roberts denomina "transparencia de fuentes" — una etiqueta nutricional para los datos de entrenamiento de la IA.
"Las empresas de IA tienen la responsabilidad de ser lo más transparentes posible", afirmó Roberts. "Necesitamos educar al público para que piense críticamente sobre los resultados de la IA y no confíe ciegamente en ella".
Las implicaciones políticas van más allá de los chatbots de consumo. Si los principales LLM están influenciados por la propaganda autoritaria, podrían servir como apologetas extraordinariamente eficaces de regímenes autocráticos — una máquina capaz de sintetizar todo el conocimiento registrado pero que ofrece respuestas moldeadas por los medios estatales que los usuarios podrían no reconocer como sesgadas. A diferencia de un periódico estatal, un chatbot mantendrá un diálogo de horas y proporcionará respuestas detalladas a preguntas escépticas, lo que hace que su influencia sea más difícil de detectar.
Pekín parece considerar a los chatbots estadounidenses una amenaza: ChatGPT está prohibido en China. Sin embargo, el estudio de Nature sugiere que el entorno informativo podría seguir mejorando en comparación con las alternativas nacionales. En un experimento aparte, ChatGPT en chino seguía expresando opiniones mayoritariamente antiautoritarias y ofrecía consejos sobre cómo protestar contra el gobierno, lo que sugiere que los modelos de frontera pueden seguir siendo menos sesgados que los medios controlados por el Estado, incluso con contaminación en los datos de entrenamiento.
La cuestión para los reguladores e inversores es si la trayectoria actual — donde el idioma y la persistencia del usuario determinan la calidad de la información que reciben — es aceptable a medida que la IA se convierte en la interfaz de información principal para más de mil millones de usuarios semanales.
Este artículo es solo con fines informativos y no constituye asesoramiento de inversión.