Revistes Catalanes amb Accés Obert (RACO)

Estratègies d'anàlisi de daes en quimiometria: selecció versus compressió

Alberto J. Ferrer-Riquelme

Resum


La quimiometria utilitza eines de mineria de dades
per a la modelització empírica de sistemes (bio)químics. El
desenvolupament explosiu de les tecnologies de la informació i
de les comunicacions ha possibilitat la fabricació d'una gran
varietat de sensors que són capaços de recollir grans quantitats
de dades i emmagatzemar-les en dispositius informàtics. El
repte està a extreure eficientment la informació potencial
continguda en aquestes dades, la qual cosa depèn en gran
mesura de l'estratègia d'anàlisi usada. Amb tanta quantitat de
dades disponible, cal usar algun procediment de reducció del
nombre de variables a analitzar. En aquest article es presenten
dues estratègies per a aquesta necessària simplificació:
compressió versus selecció. La gran diferència entre ambdues
és que en seleccionar, s'eliminen algunes de les variables
mesurades, mentre que en comprimir, no. Si la selecció es
realitza al principi de la investigació, es corre el risc d'eliminar
variables amb informació útil per resoldre el problema en
qüestió. La recomanació és, per tant, comprimir i, si és
necessari, seleccionar amb posterioritat. Els beneficis d'aquesta
recomanació s'il·lustren amb diversos exemples reals.

Text complet: PDF