Fitning til husbehov

- nogle basale overvejelser


Når man vælger at fitte et bestemt matematisk udtryk der indeholder nogle ukendte parametre til et datasæt er det vigtigt at tænke over hvad man rent faktisk gør. Her følger en række basale (og muligvis banale) overvejelser:

1: Man kan ikke opnå mere information, end der rent faktisk er i datasættet. Hvis der er flere parametre end der er datapunkter, vil der i almindelighed være mange parametersæt der kan fitte datasættet. I sådanne tilfælde resultatet af fittet arbitrært, og fittet er derfor meningsløst. Selv hvis man har mange datapunkter kan man komme ud for, at hvert af disse punkter udtrykker den samme "ting" omkring systemet. Disse datapunkter er derfor ikke uafhængige, så selv med mange datapunkter kan problemt optræde. (Eksempler).

2: Eksperimentielle data har altid måleusikkerheder. Det betyder, at man ikke kan forvente at fittet bliver perfekt. Fitterutinerne regner med at fejlene der stammer fra måleusikerhederne er tilfældige fejl. Hvis dette er tilfældet vil et større antal punkter altid føre til et bedre fit. Man bør overveje, om der kan forventes lige stor usikkerhed på alle datapunkterne. Hvis ikke er der mulighed for at vægte de forskellige datapunkter forskelligt i fitningen.

3: "Systematiske afvigelser" tyder på, at der fittes til et forkert udtryk. Hvis fittet afviger systematisk fra dataene er det ofte et tegn på, at det udtryk, man forsøger at fitte med, ikke beskriver dataene. F.eks. kunne man forestille sig, at man forsøger at fitte en ret linie til et datasæt der tydeligvis har en krumning (eksempel). Denne type fejl opdages nemmest når det fittede udtryk plottes oven på datasættet. I princippet er et fit med en systematisk afvigelse ubrugeligt, idet man ved at det ikke beskriver dataene særlig godt. Man kan forsøge at fitte med et andet udtryk, hvis ellers man har et godt forslag til hvad det skal være. (Fortsættelse af eksemplet. Nu fittes med en andengradsligning).

4: At et fit er godt er ikke ensbetydende med at man har fittet til "det rigtige" udtryk. Det vil ofte være sådan at mange forskellige matematiske udtryk kan fittes til det samme datasæt. Man kan derfor ikke konkludere at et udtryk er "det rigtige udtryk" alene fordi fittet er godt. Omvendt gælder selvfølgelig at et dårligt fit udelukker muligheden for at udtrykket er "det rigtige". I mange tilfælde har man udledt udtrykket fra en model, der beskriver det man forventer der foregår. Hvis sådan et udtryk giver et godt fit, kan fittet og teorien gensidigt bekræfte hinanden. På den anden side vil et dårligt fit i dette tilfælde betyde, at der er noget galt med teorien.

5: Man kan ikke være sikker på at få det bedst mulige fit. Det skyldes den måde fitterutinerne arbejder på. De mest almindelige fittemetoder laver en lokal optimering, dvs. de startes med et startgæt og finder så et lokalt minimum for afvigelsen mellem udtrykket og datasættet. Hvis startgættet ikke er godt, vil det lokale minimum ikke være det globale minimum.  Resultatet bliver et dårligt fit. Der er to ting man kan gøre ved dette problem: sørge for at have gode startgæt og forholde sig kritisk til resultatet af fitningen.