6 min lectura
¿Pueden los modelos de inteligencia artificial descentralizados y de código abierto competir con los propietarios bien financiados como el poderoso GPT-4 de OpenAI? La pregunta frecuente generó un animado debate en Twitter después de que un ex investigador de IA de Google tomara partido.
Arnaud Benard, cofundador de Galileo AI, lanzó el desafío, diciendo: "Si crees que los modelos de código abierto superarán a GPT-4 este año, estás equivocado". Citó el talento y los recursos de OpenAI y la naturaleza robusta de GPT-4 como un producto más allá de un LLM, y afirmó que los proyectos de código abierto podrían tener dificultades para pasar de ser desafiantes a campeones de IA.
El tweet de Benard generó reacciones mixtas, que van desde un apoyo enérgico hasta un feroz desacuerdo.
Ryan Casey, un popular entusiasta de la IA que escribe el boletín "Beyond The Yellow Woods", ofreció una visión más optimista sobre el potencial de la IA de código abierto, afirmando que "el código abierto igualará o superará a los modelos privados este año", según sus cálculos. "Si hay demanda, habrá innovación".
Por otro lado, el estratega de IA Jeremi Traguna señaló que "los modelos de OpenAI siguen avanzando", agregando que "los modelos de código abierto tendrán dificultades para mantenerse al día y alcanzar un objetivo en movimiento en el momento en que el objetivo esté en posición de ser alcanzado". En otras palabras, mientras que los modelos de código abierto podrían estar alcanzando a GPT-3.5 en la era de GPT-4, podría haber un GPT-5 para cuando tengamos LLM generalistas que sean comparables a GPT-4.5 Turbo.
Un analista tecnológico llamado Jon Howells, cree que los recursos no son el único criterio que separa a los LLM de código abierto de los de código cerrado.
"Mistral tiene una financiación enorme, un gran equipo y recientemente ha lanzado un modelo de código abierto que supera a GPT-3.5", escribió. "Ellos o una empresa similar lanzarán un modelo de código abierto de nivel GPT-4 para finales de este año".
Mistral AI, una startup francesa, ha ganado reconocimiento después de lanzar su LLM, que ofrece un rendimiento mejorado en muchos casos de uso en comparación con GPT-3.5.
Durante la discusión, el cofundador de Nous Research, "Teknium", destacó un punto importante, aunque filosófico. "Cada aumento de capacidad en OS (Open Source) es algo permanente que nunca se puede quitar del mundo y que se puede utilizar de manera confiable para siempre", dijo. Básicamente, siempre que haya algún avance en la tecnología de IA de código abierto, ninguna empresa puede restringir su acceso.
El debate entre código abierto y código cerrado recuerda a las primeras batallas de sistemas operativos entre Windows y Linux. Santiago Pino de ML School escribió que los modelos de IA propietarios pueden ganar a los consumidores generales como lo hizo Windows, pero que el software de código abierto proporciona personalización y control que pueden ser extremadamente útiles para los usuarios corporativos.
Pino destacó cómo muchas empresas comienzan a experimentar con ChatGPT, pero luego migran a modelos de código abierto, que pueden ajustar y personalizar según sus necesidades específicas y requisitos de cumplimiento de datos. Las soluciones de código abierto evitan el bloqueo del proveedor y brindan transparencia, dijo.
"Los modelos cerrados y propietarios pueden ganar a nivel individual, pero la mayoría de las empresas no quieren enviar sus datos a Microsoft o Google. Quieren tener control. Los modelos de código abierto son la respuesta", dijo en un tweet días antes de que el hilo de Bernard se volviera viral.
Este tipo de opinión fue compartida en el debate sobre el tweet de Bernard por Sciumo Inc., una empresa de desarrollo de software, que enfatizó el potencial de nicho de los modelos de código abierto: "(Los modelos de código abierto) competirán donde importa: problemas específicos de dominio con datos y conocimientos específicos del dominio que (OpenAI) no tiene".
Furkan Gözükara, un ingeniero informático conocido por su canal de YouTube SECourses, también está entre aquellos con una postura más matizada. Hablando con Decrypt, estuvo de acuerdo con Bernard, diciendo que "solo en tareas específicas los LLM de código abierto superarán a OpenAI".
Gözükara da el ejemplo de una empresa que "entrena LLM en sus propios documentos". Sí, OpenAI tiene la capacidad de personalizar los GPTs basándose en instrucciones y documentos específicos, pero siempre existe la preocupación de manejar datos sensibles de terceros. Esa preocupación se validó recientemente cuando se reveló que los GPTs personalizados revelaron datos sensibles a usuarios de terceros.
Yan Lecun, jefe de desarrollo de IA de Meta y un feroz defensor del código abierto, ha afirmado repetidamente que "los modelos de base de IA de código abierto eliminarán los modelos de IA cerrados y propietarios". Google, otro gigante de la IA, también reconoce la amenaza que representa la IA de código abierto: "Los modelos de código abierto son más rápidos, más personalizables, más privados y más capaces en relación al peso", según un memo filtrado de Google en 2023.
Queda por ver si los modelos de código abierto igualarán o superarán a GPT-4 y a futuras iteraciones este año. Sin embargo, las perspectivas de los expertos de ambos lados revelan una tensión intrigante. Los modelos de código cerrado pueden tener ventaja en recursos y en iteración rápida, pero las herramientas de código abierto están evolucionando rápidamente, ofreciendo capacidades permanentes y personalizables.
Por ahora, la comunidad de IA puede observar cómo se desarrolla la competencia y disfrutar de los beneficios de utilizar la mejor tecnología disponible.
Editado por Ryan Ozawa.
Decrypt-a-cookie
This website or its third-party tools use cookies. Cookie policy By clicking the accept button, you agree to the use of cookies.