En Resumen

  • KAIKAKU.AI publicó Epicure, tres modelos entrenados con 4,14 millones de recetas en siete idiomas comprimidos en 2 megabytes.
  • El sistema mapea 1.790 ingredientes en 300 dimensiones matemáticas para predecir combinaciones por tradición culinaria o química.
  • A diferencia de chatbots generalistas, Epicure no puede alucinar ingredientes fuera de su base de datos de 1.790 elementos conocidos.

Josef Chen dice que comprimió todas las recetas de cocina humana en dos megabytes. Es una afirmación audaz. Y también resulta ser cierta.

Chen, cofundador y CEO de la startup londinense de IA culinaria KAIKAKU.AI, publicó esta semana un paper en arXiv, junto al investigador Jakub Radzikowski, en el que presentan Epicure: tres modelos de IA entrenados con 4,14 millones de recetas extraídas de 11 conjuntos de datos en siete idiomas. El resultado: un mapa de 1.790 ingredientes, cada uno descrito por 300 números, que cabe en el límite de un adjunto de correo electrónico y sobra espacio.

"4,1 millones de recetas. 7 idiomas. 1.790 ingredientes. 300 dimensiones", escribió Chen en X. "Toda la cocina humana comprimida en 2 megabytes".

No almacena recetas

Antes de imaginar una memoria USB de dos megabytes repleta de instrucciones para preparar salteados, hay que aclarar que el modelo no almacena ni una sola receta. Esos dos megabytes se parecen más a una tabla de coordenadas que a un libro de cocina.

Piénsese como un mapa. Cada ingrediente obtiene una ubicación precisa según su comportamiento en millones de platos reales alrededor del mundo. La matemática es directa: 1.790 ingredientes × 300 números por ingrediente × 4 bytes cada uno ≈ 2,05 megabytes. Esos números codifican qué ingredientes aparecen juntos, cuáles comparten compuestos de sabor y cuáles pertenecen a la misma tradición culinaria. Una vez que el modelo aprende todo eso de las recetas, estas pueden descartarse. El conocimiento vive en las coordenadas.

Este es esencialmente el mismo truco que word2vec aplicó al lenguaje en 2013, cuando investigadores de Google demostraron que era posible hacer aritmética con el significado. Epicure hace eso con la comida. Toma la carne de res, apúntala hacia América y obtendrás pan, lechuga, quizás cerveza. Apúntala hacia el sudeste asiático y el modelo deja de pensar en hamburguesas y parrillas para empezar a pensar en salsa de soja, jengibre y aceite de sésamo.

Esto ocurre mediante lo que el paper describe como un operador de dirección llamado rotación SLERP. Se toma un ingrediente base —pollo— y se rota matemáticamente hacia una dirección culinaria. A 30 grados se empieza a ver territorio Tex-Mex. A 60 grados, el pollo y la carne de res convergen en la misma despensa mexicana: tortilla de maíz, salsa, queso monterey jack, chile poblano. El ángulo es un dial entre "mantenerse cerca de este ingrediente" y "llegar a algo nuevo".

Epicure viene en tres versiones, y elegir la correcta depende de lo que realmente se está preguntando. Cooc aprende de la co-ocurrencia en recetas: qué aparece junto en platos reales. Chem aprende de la química del sabor: qué ingredientes comparten compuestos aromáticos de la base de datos química FlavorDB. Core es una combinación de las dos anteriores.

Pregúntale a Cooc qué combina con el chocolate y puede que obtengas compañeros de despensa para postres: cacao en polvo, vainilla, almendra. Pregúntale a Chem y obtendrás pares de química de sabor: toffee, fudge, ganache.

El mismo ingrediente, distinta pregunta. Un chef que busca un sustituto tiene necesidades diferentes a las de uno que mapea la compatibilidad de sabores.

Por qué esto no es ChatGPT para la cocina

Epicure no tiene conocimiento general, no genera lenguaje y no tiene capacidad de alucinar un ingrediente que nunca ha visto. Conoce 1.790 ingredientes. Ese es su mundo entero. Lo que pierde en amplitud lo gana en confiabilidad, a diferencia de los chatbots de recetas que sugerirán con total confianza ingredientes tóxicos si se les presiona de cierta manera.

El estado del arte anterior en este campo era FlavorGraph, un modelo de 2021 que combinaba datos químicos con el conjunto de datos Recipe1M+, disponible solo en inglés. Epicure incorpora un corpus multilingüe más de cuatro veces más grande y depura el vocabulario para mayor eficiencia.

Los usos prácticos no son difíciles de imaginar. Un chef pregunta cómo se ve el equivalente asiático oriental de un ingrediente mediterráneo. Un desarrollador de productos alimenticios pregunta qué sustituto mínimamente procesado queda en la misma zona de sabor que un aditivo. Una app de recetas necesita una sustitución coherente cuando falta un ingrediente en la despensa. Esa última es la brecha donde los modelos pequeños de propósito específico superan silenciosamente a los grandes generalistas.

El paper de Epicure es una publicación de investigación. Los modelos entrenados están disponibles en Hugging Face y un mapa interactivo de ingredientes es accesible públicamente en epicure.kaikaku.ai. También lanzaron un MCP para tus agentes. El código de entrenamiento completo no ha sido publicado por el momento.

Daily Debrief Newsletter

Start every day with the top news stories right now, plus original features, a podcast, videos and more.