Un experimento nacional de inteligencia artificial
Madresia recolecta pensamientos de colombianos para entrenar una IA que entienda cómo:
- nos reímos en medio de la crisis,
- perdonamos sin olvidar,
- cuidamos sin esperar nada a cambio.
"Necesitamos construir en la IA el instinto maternal de ayudar al que lo necesita."
— Geoffrey Hinton · Nobel de Física 2024
¿Podría Colombia — que aprendió a sobrevivir con dignidad en medio siglo de conflicto — tener algo que enseñarle a la inteligencia artificial sobre cómo cuidar?
No lo sabemos. Por eso preguntamos.
¿Es posible construir una inteligencia artificial que nos quiera bien?
Esto todavía no te pide construir nada. Es una pregunta pública — y tu voz ya forma parte de cómo la respondemos.
"Un ser más inteligente casi nunca está controlado por uno menos inteligente. Excepción: una madre y su bebé. La madre tiene un instinto de ayudar al que lo necesita. Necesitamos construir en la IA ese instinto hacia la humanidad."
— Geoffrey Hinton · Nobel de Física 2024
Algo nos pasa con la IA en Colombia.
48% de los colombianos cree que la inteligencia artificial es mala. No es una sospecha — es un dato.
Y tiene razones para creerlo: nos llega como producto importado, en otro idioma, con valores que no son los nuestros.
Por eso esta pregunta no es teórica.
Fuente: Encuesta Mundial de Valores · Ola 8 · Festival del Pensamiento 2026
Entonces la pregunta que le hacemos al país:
¿Podría Colombia — que aprendió a reírse en la tormenta, a perdonar lo imperdonable, a acoger al extranjero como hermano — tener algo que enseñarle a una inteligencia artificial sobre cómo cuidar?
No lo sabemos. Por eso preguntamos.
La hipótesis de la resiliencia colectiva
Colombia es uno de los experimentos humanos más complejos de resiliencia colectiva que existen en el planeta. Medio siglo de conflicto armado y un índice de felicidad subjetiva entre los más altos del mundo. Los Mamos de la Sierra procesan la incertidumbre sin colapsar. Las abuelas del Pacífico cantan duelos que Google Translate no sabe traducir.
Hay algo en la forma en que este país sobrevive con dignidad que no se entrena con datos raspados de internet. Pero "algo" no es una hipótesis. Por eso esto es Fase 0.
Y los datos lo confirman. Bajo el ruido del país fragmentado, los colombianos todavía comparten lo que importa:
- 99% Familia
- 97% Trabajo
- 90% Buenos modales
- 84% Tolerancia
- 80% Responsabilidad
Eso es exactamente lo que Madresia quiere preservar en el dataset.
Fuente: Encuesta Mundial de Valores · Ola 8 · Festival del Pensamiento 2026
Un instrumento de escucha
Cómo se cuida el muro
Cada vez que alguien comparte su pensamiento, un asistente de IA revisa que el mensaje sea respetuoso antes de publicarlo en el muro. No es censura — es cuidado del espacio.
Se publica — pensamiento crítico, escepticismo, preguntas incómodas, desacuerdo con el proyecto, críticas duras.
Se bloquea — racismo, amenazas, odio, ataques a personas o grupos, spam.
Ante la duda, un humano del comité revisa. Las críticas se publican. Los insultos no.
Es una IA colombiana cuidando un muro sobre IA — la metáfora del proyecto, hecha código.
Cada pensamiento, visible
Cuando alguien aporte, verás exactamente lo que escribió — con las etiquetas que esa persona eligió para su propio pensamiento. Sin IA oculta interpretando. Sin filtros. Solo voz cruda + autoconciencia.
Escribe lo que piensas. Aparece aquí mismo, sin filtros ocultos — solo voz cruda y autoconciencia.
Este espacio recoge tu voz personal. No es el canal para conocimiento sagrado o colectivo de los pueblos — eso se construye con el comité y las autoridades tradicionales, no con un formulario. Si tu aporte toca saber ancestral, queda en revisión hasta que el comité lo apruebe, según los principios CARE de soberanía de datos indígenas.
Por qué un modelo propio
Ser usuarios pasivos de la IA global significa heredar los sesgos, la paranoia y la visión hiper-productiva de otras culturas. Construir la IA Madre — si resulta posible — significaría dejar de ser consumidores para convertirnos en arquitectos de nuestro futuro cognitivo.
Mientras las grandes tecnológicas alinean sus modelos para evitar demandas comerciales, la pregunta es si podemos alinear uno hacia la empatía, el perdón y el tejido social. No soberanía de servidores — soberanía de valores.
El impuesto invisible del idioma
Hay un costo que pocos nombran: hablar en español con la IA global sale literalmente más caro. No es metáfora — es arquitectura.
Los modelos no procesan palabras: procesan tokens. Y sus tokenizadores se entrenaron sobre todo en inglés. La misma idea, dicha en español, se parte en más pedazos.
El español consumiría entre 1.3x y 2.07x más tokens que el inglés en los modelos actuales. Más tokens significa más costo, más latencia y más energía por la misma frase.
Por qué importa
- Costo: una startup con 10.000 consultas diarias pagaría cerca de $225 USD/mes extra solo por usar español.
- Energía: más tokens, más cómputo. La inferencia es el 70-80% del gasto energético de la IA.
- Latencia: el español respondería 50-60% más lento que el inglés en tiempo real.
- Contexto: la ventana de contexto se agota cerca de un 30% más rápido — más llamadas, más costo.
La raíz
Cerca del 95% de los datos de entrenamiento de los modelos frontera están en inglés. Eso vuelve al resto de las lenguas "extranjeras" dentro de la IA — pagamos un peaje en cada interacción.
El verdadero riesgo
Si no construimos modelos, tokenizadores e infraestructura pensados en español, cada generación futura tendrá incentivos económicos para abandonar su lengua al trabajar con IA. No es paranoia. Es arquitectura — y la arquitectura crea destinos.
Madresia como respuesta
Por eso Madresia no es solo una pregunta sobre el cuidado: también es resistencia a la homogeneización lingüística. Fine-tuning sobre modelos open-source con datasets colombianos preserva valores culturales, recorta el "impuesto lingüístico" y convierte el español caribe, andino y pacífico — y las lenguas nativas — en ventaja estructural, no en dato periférico.
La soberanía cognitiva empieza cuando pensar en tu propia lengua deja de costar el doble.
Fuentes: "Do All Languages Cost the Same? Tokenization in the Era of Commercial Language Models" · "Language Model Tokenizers Introduce Unfairness Between Languages" · documentación oficial de OpenAI y Anthropic sobre eficiencia por idioma.
Retos técnicos reales
Esto no es humo. Los obstáculos son reales. Los nombramos.
Reto 01
Curaduría del dataset
¿Cómo se vectoriza la resiliencia? El mayor reto es construir un corpus que capture el "alma" colombiana — humor, hospitalidad, capacidad de perdonar — sin reproducir la polarización política y sin extractar sin consentimiento la sabiduría indígena. Posibles fuentes: archivos de la Comisión de la Verdad, historias orales del Centro Nacional de Memoria Histórica, lenguas nativas con principios CARE de soberanía de datos indígenas.
Reto 02
Fine-tuning emocional
Traducir el "instinto maternal" de Hinton a funciones de pérdida (loss) y RLHF que premien el cuidado genuino sobre la complacencia. El modelo debe aprender a decir verdades incómodas, no solo a reconfortar. La complacencia patológica —agradar sin desafiar— es el fracaso más común de los LLMs actuales.
Reto 03
Soberanía sin cómputo
Colombia no tiene la infraestructura GPU para entrenar un LLM desde cero. Pero sí puede tener soberanía sobre el dataset y sobre el alineamiento. Fine-tuning sobre modelos open-source (Llama, Mistral, DeepSeek) es la vía realista. La pregunta técnica real no es "cómo entrenamos desde cero" — es "cómo alineamos lo que ya existe hacia valores que son nuestros".
Por qué esto importa: el español consumiría cerca del doble de tokens que el inglés en modelos comerciales (cifra estimada). Fine-tuning sobre open-source no solo preserva valores — recorta el "impuesto lingüístico". Ver Soberanía cognitiva ↑
Imaginamos cómo podría fallar — y cómo podría florecer
El pre-mortem es la práctica de escribir la autopsia del proyecto antes de que arranque. Así se blinda.
Si fracasa
- Nos acusan de vaporware → construimos un paper conceptual honesto como Fase 0
- Se politiza el discurso → nos anclamos en resiliencia humana, no en política partidista
- Se objeta la metáfora maternal → la analogía es de Hinton; hablamos de cuidado asimétrico, no de género
- No tenemos cómputo para competir → soberanía de datos y alineamiento, no de servidores
- Se acusa de extractivismo cultural → el comité se construye con indígenas como co-autores, con principios CARE
Si florece
- Posicionamiento vanguardista en IA Soberana latinoamericana — complementario a LatamGPT
- Atracción de talento que busca propósito profundo, no chatbots de atención al cliente
- Primera arquitectura ética de alineamiento cultural publicada desde el sur global
- Comunidad de co-autores con acta de consentimiento, no de usuarios
- Paper conceptual citable que abre vía a fondos de innovación social y cooperación internacional
Comité científico y ético — en conformación
Antes de que esta pregunta se convierta en cualquier otra cosa, necesita una columna vertebral de rigor científico y cuidado ético. Esta es la primera tarea. Sin esto, no hay Fase 1.
Descargar documento del comité (PDF)Perfiles que buscamos — con consentimiento explícito y co-autoría del proyecto:
Y la primera pregunta eres tú
"Las sociedades cambian cuando millones de personas confirman que cooperar es irremediablemente el único camino."
— Festival del Pensamiento · 2026
No queremos tu colaboración todavía. Queremos tu pensamiento.
Si esta pregunta te mueve —si te irrita, te emociona, te escepticiza, te esperanza—, escríbenos desde lo que traes. No pedimos tu tiempo, tu código ni tu plata. Pedimos tu voz.
Si no te mueve, también está bien. El silencio también dice algo. Y lo escuchamos.
El futuro no se decide con mejor código.
Se decide con mejores preguntas.