✒️Com fer un projecte de dades pas a pas

Aquest article t’endinsa en l’evolució d’un projecte de dades, des de la pregunta inicial fins a la presa de decisions, destacant la importància del coneixement del negoci i la qualitat de les dades. Inclou una infografia amb els punts clau.

📊Consulta infografia

En moltes organitzacions s’ha popularitzat la idea que les dades són el nou petroli. Però qualsevol persona que hagi participat en un projecte real sap que la realitat és més complexa. Les dades, per si soles, no resolen problemes. El que realment genera valor és la capacitat de formular bones preguntes, entendre què ens expliquen les dades i convertir aquest coneixement en decisions que transformin l’organització.

Un projecte de dades és, en essència, un procés d’aprenentatge. Comença amb una intuïció o una necessitat del negoci i evoluciona a través d’un recorregut que combina coneixement del domini, anàlisi de dades i interpretació dels resultats. Tot i que cada projecte té les seves particularitats, hi ha una lògica comuna que acostuma a repetir-se.


 

Tot comença amb una bona pregunta

El punt de partida gairebé sempre és una pregunta. De vegades és molt concreta com per exemple: per què alguns usuaris abandonen el servei? I d’altres és més oberta: què està passant amb el servei de recollida de residus?.

Aquesta pregunta inicial és més important del que sembla. Si està mal plantejada, el projecte pot dispersar-se. Si és clara i rellevant, en canvi, pot orientar tot el procés analític. Les dades no substitueixen el pensament; el que fan és ajudar-nos a contrastar hipòtesis i entendre millor la realitat.

Entendre les dades disponibles

Un cop el repte està clar, el següent pas és identificar quines dades poden ajudar a respondre la pregunta. En moltes organitzacions la informació està repartida entre diferents sistemes: bases de dades internes, històrics d’activitat, registres operatius o dades d’usuaris.

En alguns casos també cal mirar cap a fora i incorporar fonts externes que aportin context, com dades demogràfiques, informació geogràfica o indicadors sectorials. Però aquesta fase també exigeix realisme. Hi ha preguntes per a les quals simplement no tenim les dades adequades, i reconèixer aquesta limitació forma part del procés analític.

La importància del coneixement del negoci

En aquest moment del projecte es fa evident que l’anàlisi de dades no és només una qüestió tècnica. Els equips de negoci tenen un paper fonamental perquè són qui entenen el context real en què es generen les dades.

Els analistes poden detectar patrons o correlacions, però només els experts del domini poden explicar si aquests patrons tenen sentit dins de la realitat operativa de l’organització. Quan tècnics i negoci treballen conjuntament, els resultats acostumen a ser molt més útils.

El repte inevitable: la qualitat de les dades

En qualsevol projecte de dades apareix tard o d’hora el mateix problema: la qualitat de la informació. Dades incompletes, inconsistents o duplicades poden alterar significativament els resultats de qualsevol model.

Per això una part important del treball consisteix a revisar, netejar i validar les dades abans de confiar en les conclusions que se’n poden extreure.

Explorar les dades abans de modelitzar

Abans d’aplicar models avançats, cal fer una cosa aparentment senzilla: explorar les dades amb atenció. Analitzar distribucions, detectar anomalies o observar relacions entre variables ajuda a entendre millor la informació disponible.

Aquesta fase, coneguda com a anàlisi exploratòria, és sovint una de les més creatives del projecte. Moltes idees i hipòtesis apareixen simplement observant les dades amb curiositat.

Quan entren en joc els algoritmes

Quan les dades ja s’han entès i preparat, és possible aplicar tècniques d’analítica avançada. Segons el problema plantejat, poden utilitzar-se models capaços de predir comportaments, estimar valors futurs o descobrir grups d’elements amb característiques similars.

Aquestes tècniques permeten identificar patrons que difícilment serien visibles a simple vista i obren la porta a models predictius o sistemes de recomanació que poden anticipar situacions futures.

En els últims anys, a més, s’ha incorporat un nou tipus d’eines basades en intel·ligència artificial generativa. Els models coneguts com a LLM permeten analitzar grans volums de text, extreure informació de documents o ajudar a sintetitzar resultats complexos. No substitueixen els models analítics tradicionals, però amplien notablement les possibilitats d’explotació de la informació.

Interpretar i explicar els resultats

Quan els models generen resultats, arriba una fase crítica: interpretar-los correctament. Un algoritme pot detectar patrons, però entendre què signifiquen requereix combinar coneixement tècnic amb coneixement del negoci.

La visualització de dades té aquí un paper essencial. Un bon gràfic pot explicar en pocs segons allò que una taula de números no aconsegueix transmetre. Les visualitzacions ajuden a construir una narrativa clara que permet entendre què està passant i per què és rellevant.

Quan l’anàlisi es converteix en acció

El valor real d’un projecte de dades apareix quan el coneixement obtingut es tradueix en decisions concretes. Les conclusions poden donar lloc a canvis en processos, noves estratègies comercials o sistemes automatitzats que incorporen models predictius en el funcionament diari de l’organització.

En aquest moment el projecte deixa de ser un exercici analític i es converteix en una eina de transformació.

Un procés que continua

Tanmateix, els projectes de dades no s’acaben amb la primera implementació. Després d’aplicar les decisions, cal observar què passa i avaluar si els resultats milloren. Sovint aquest procés genera noves preguntes que donen lloc a noves anàlisis.

Per això els projectes de dades s’assemblen més a un cicle d’aprenentatge continu que a una activitat puntual. Cada iteració ajuda a entendre millor la realitat de l’organització i a prendre decisions més informades.

I, al final, aquest és el veritable valor de les dades: ajudar-nos a entendre millor el que passa al nostre voltant per decidir millor cap a on volem anar.