Skip to content
Tornar al Blog
9 de febrer del 2026|5 min read|
#Intel·ligència Artificial#Enginyeria de Dades#Estratègia Tecnològica#Data Readiness

Garbage In, Garbage Out: Per Què El Teu Projecte d'IA Va Fallar Abans de Començar

El 80% dels projectes d'IA fracassen, i no és culpa de l'algoritme. Descobreix per què la qualitat de les teues dades (Data Readiness) és més crítica que utilitzar el model més sofisticat del mercat.

Compartir:
Garbage In, Garbage Out: Per Què El Teu Projecte d'IA Va Fallar Abans de Començar

Són les 9:00 AM del dilluns. El Comitè de Direcció espera la demo del nou "Sistema Predictiu de Vendes amb IA". Han sigut sis mesos de desenvolupament, contractacions de consultors externs i una factura de llicenciament que fa vertigen.

El CTO connecta la pantalla. Tot sembla futurista. Introdueix una consulta simple per validar el ROI del projecte: "Quina és la previsió d'estoc de seguretat per a la referència X-500 en la campanya de Nadal?".

La IA, connectada a un LLM d'última generació i al vostre ERP, processa, "pensa" i respon amb aplom: "Basat en l'històric de 2023, es recomana reduir l'estoc a zero, ja que la referència X-500 no va tenir cap eixida comercial".

El Director d'Operacions es posa pàl·lid. "Zero? La X-500 és el nostre best-seller. El que passa és que el 2023 li vam canviar el codi a Y-500 durant la migració del SAP, i després vam tornar a l'original el 2024".

Silenci. La IA no ho sabia. Ningú li ho va dir. Per al model, X-500 i Y-500 són dos universos diferents.

Resultat: Una recomanació que, d'haver-se executat automàticament, hauria costat milions en trencaments d'estoc. El projecte es pausa indefinidament. El CEO sentencia: "La IA no està preparada".

Però la IA va funcionar perfectament. Van ser les teues dades les que van mentir.

La Mentida del "Big Data"

Durant l'última dècada, les empreses es van obsessionar a acumular dades. "Les dades són el nou petroli", deien. Van guardar-ho tot: logs, transaccions, Excels, correus. Van crear Data Lakes gegantins.

El problema és que, sense context i estructura, un Data Lake es converteix ràpidament en un Data Swamp (Pantà de Dades).

Tenir petabytes d'informació no significa tenir coneixement. Si les teues dades de vendes viuen en un CRM, les teues dades d'inventari en un ERP antic, i la "veritat real" de l'operativa viu als post-its de l'encarregat de planta o en un Excel local anomenat PRODUCCION_FINAL_VFINAL_REAL.xlsx, la teua empresa no és llegible per a una màquina.

La Jerarquia de Necessitats de la IA

Abans de córrer, cal caminar. A SAUCO visualitzem la IA com la cúspide d'una piràmide de necessitats, similar a la de Maslow:

  1. Recol·lecció (La base): Tens les dades? Són accessibles?
  2. Flux: Es mouen de forma fiable i automatitzada entre sistemes? (ETL/ELT).
  3. Exploració i Neteja: Estan normalitzades? Sabem què falta?
  4. Agregació i Etiquetatge: Tenen sentit semàntic? Estan connectades?
  5. IA / Machine Learning (El cim): Predicció i automatització.

La majoria d'empreses intenten saltar del pas 1 al 5. Compren l'API d'OpenAI i la connecten a una base de dades bruta. Això viola el principi fonamental de la computació: Garbage In, Garbage Out (GIGO).

Si entra brossa (dades incoherents, duplicades, esbiaixades), ix brossa (al·lucinacions, prediccions errònies). I el pitjor: ix brossa amb aparença de veritat, la qual cosa és molt més perillosa que un error obvi.

El 80% del Treball Invisible

La indústria ven la "màgia" de l'algoritme. Però qualsevol enginyer de dades sènior et dirà la veritat incòmoda:

El 80% de l'èxit d'un projecte d'IA és Enginyeria de Dades. Només el 20% és el model en si.

Preparar les teues dades per a la IA (Data Readiness) implica:

  • Resolució d'Entitats: Entendre que "Telefónica", "Tfos" i "Client 892" són la mateixa entitat.
  • Captura de Context: Digitalitzar el coneixement tribal. Per què van baixar les vendes al maig? "Ah, perquè hi va haver vaga de transport". Si eixa dada no està digitalitzada, la IA aprendrà patrons falsos (ex: "les vendes baixen al maig perquè sí").
  • Governança: Qui pot veure què i quina és la "font de la veritat".

FDE: Enginyeria Inversa de la Realitat

A SAUCO no comencem instal·lant models. Comencem posant-nos les botes i baixant al fang.

El nostre enfocament de Forward Deployed Engineering (FDE) és radicalment distint:

  1. Mapeig de l'Operativa Física: Entenem primer el procés real. Com es mou una caixa? Qui signa l'albarà?
  2. Construcció de l'Ontologia: Creem un model digital que reflecteix com funciona el TEU negoci, no com diu el programari que hauria de funcionar. Unim els punts entre l'ERP, el CRM i la realitat.
  3. Higiene de Dades en Origen: Implementem sistemes perquè les dades nasquen netes. Validacions en temps real, interfícies que impedeixen errors humans.

Només quan els fonaments són de formigó armat, construïm el gratacel de la Intel·ligència Artificial.

Conclusió: Deixa de Comprar Màgia

La IA no és una vareta màgica que arregla processos trencats. És un amplificador.

  • Si amplifiques processos eficients i dades netes -> Escalabilitat exponencial.
  • Si amplifiques caos i dades brutes -> Caos exponencial.

La pròxima vegada que et proposen un projecte d'IA, no preguntes quin model utilitzaran. Pregunta com garantiran que les teues dades diguen la veritat.

Estàs a punt per deixar de jugar a la loteria amb les teues dades? Parlem d'enginyeria seriosa.

Compartir: