OpenAI cree saber cómo China entrenó a DeepSeek para igualar a las IA de EUA: usó ChatGPT

Era evidente que, tras su lanzamiento y popularización, comenzarían a revelarse más detalles sobre el desarrollo de los modelos de inteligencia artificial de DeepSeek, sobre todo debido al ruido mediático generado al comparar su rendimiento con opciones como ChatGPT o Gemini. Ahora, OpenAI cree haber identificado cómo lograron crearlos: a partir de sus propios datos.

Un reporte de Bloomberg indica que tanto OpenAI como Microsoft llevan a cabo una investigación para determinar si su competencia china se aprovechó de su API, una pieza de código que permite la comunicación entre dos servicios para compartir información y funcionalidades, al tiempo que protege los datos de las empresas y evita accesos no autorizados.

Según el informe, ambas compañías sospechan que DeepSeek utilizó esta herramienta para mejorar sus propios modelos. La primera alerta surgió cuando investigadores de Microsoft detectaron, a finales de 2024, una filtración masiva de datos mediante cuentas de desarrollador de OpenAI. Se cree que el responsable fue un grupo vinculado a la startup china.

No es el único indicio. OpenAI también afirma haber encontrado evidencia adicional de que DeepSeek empleó sus modelos de IA para entrenar a su competencia, en especial a través de la “destilación“, un método que permite entrenar modelos más pequeños a partir de la extracción de datos de versiones más grandes, capaces y potentes, para generar el equivalente a una versión “lite“.

Si bien este proceso permite la creación de modelos más compactos y eficientes, además de reducir costos en comparación con desarrollarlos desde cero, el uso de datos obtenidos de la API de OpenAI representaría una violación de sus términos y condiciones.

Irónicamente, durante la etapa de desarrollo de ChatGPT, OpenAI utilizó un método similar, donde aprovechaba cualquier dato disponible en internet, sin analizar su procedencia, para así procesar el texto y aprender sus patrones, a pesar de que esta información estuviera protegida por derechos de autor.

La “copia” de modelos más potentes

El respaldo a esta teoría no proviene solo de empresas tecnológicas. David Sacks, “zar” de la inteligencia artificial y las criptomonedas en la Casa Blanca de Estados Unidos, señaló que la llegada de DeepSeek-R1 demuestra que China está cada vez más cerca en el desarrollo de IA, pero también plantea la posibilidad de que la compañía haya robado propiedad intelectual estadounidense.

Sacks coincide con OpenAI en que, a través de la destilación, es posible imitar la lógica de los modelos de IA más potentes, como GPT, para “absorber” su conocimiento. Asegura, además, que existen “pruebas sustanciales” al respecto.

Para abordar esta problemática, el empresario sugiere que las compañías de inteligencia artificial implementen “medidas adicionales” que eviten la extracción de datos y la protección de su propiedad intelectual, lo que ayudaría a frenar el desarrollo de modelos imitadores.

Ia S

Sacks también advierte que, por ahora, una de las principales ventajas de Estados Unidos en el desarrollo de IA es su acceso a una gran cantidad de chips, los cuales, en principio, son más potentes que las alternativas utilizadas en China. En el caso de las GPUs NVIDIA empleadas por el país asiático, estas serían significativamente menos capaces que sus equivalentes estadounidenses.

Sin embargo, a pesar de la confianza de Estados Unidos en su ventaja tecnológica, hay evidencia de que DeepSeek utiliza chips de Huawei para operar su inteligencia artificial. En concreto, emplea los Ascend 910C, mientras que los NVIDIA H100 solo formaron parte de su proceso de entrenamiento.

Cortesía de Xataka



Dejanos un comentario: