Forvirrende pandemistatistikk: Hva skal vi med logaritmer i grafer?

Takk for fin og interessant spalte! Jeg har som sikkert mange andre brukt mye av det siste ett og halve året til å studere grafer over antall smittetilfeller av korona som oftest med målet om å finne ut om trenden går opp, ned eller er på det jevne. Jeg har merket meg at det for en del av grafene blir tilbudt visning av grafen med logaritmisk inndeling på antall smittetilfeller. Jeg har noen ganger prøvd å skru denne på, men jeg synes ikke grafene blir noe lettere å tolke eller gir noe ny innsikt med denne funksjonen. Så spørsmålet mitt blir da hva skal vi med logaritmer i grafer?

Hilsen Logaritmetviler

Pierre Lison, informatiker

Jeg er enig med deg! Jeg synes også at det har vært et voldsomt overforbruk av logaritmiske skalaer i mediene i det siste. Misforstå meg rett: Som informatiker bruker jeg logaritmer nesten hver dag. Som Anders forklarer nedenfor, har logaritmer en rekke matematiske egenskap som gjør dem til et fantastisk verktøy for alle forskere som jobber med tall i en eller annen form. I informatikk bruker vi ofte logaritmer for å gjøre det lettere å utføre presise beregninger på veldig store eller veldig små tall. Men akkurat når det gjelder å visualisere data, kan logaritmer være ganske forvirrende.

La meg først forklare hvorfor det i noen tilfeller kan være nyttig å benytte logaritmiske skalaer i grafer. Det er hovedsakelig to grunner. Den første er å vise på samme graf verdier som står veldig langt fra hverandre, for eksempel når en verdi er størrelsesorden større eller mindre enn andre verdier. Tenk om vi for eksempel skulle lage et diagram som sammenligner formuen til ti personer, med en milliardær blant disse. Med en vanlig, såkalt «lineær» skala vil vi ikke i grafen kunne se inntektsforskjeller mellom de ni andre personene, siden disse utgjør rene bagateller i forhold til gapet mellom dem og milliardæren.

Den andre grunnen, som Jørgen også påpeker nedenfor, handler om å analysere eksponentielle trender. Når en verdi (som for eksempel antall smittetilfeller i en pandemi) øker veldig raskt kan det være vanskelig å finne ut om det blir endringer i utviklingstakten. En graf med logaritmisk skala kan hjelpe oss med å oppdage om en eksponentiell utvikling er i ferd med å avta eller ikke.

---

Ukens spørsmål

Noen ganger virker det som en får helt ulike svar fra forskere avhengig av hva slags forskere en spør. For å sette galskapen i et tverrfaglig system vil vi i denne spalten stille det samme spørsmålet til tre medlemmer av Akademiet for yngre forskere, fra ulike fagdisipliner. Flere spørsmål – og ikke minst svar – finner du her.

---

Logaritmiske skalaer har altså helt klart noen bruksområder. Men de bør brukes med stor omhu. Hjernen vår er nemlig vant til å forholde seg til en lineær målestokk og glemmer fort at en logaritmisk skala «komprimerer» verdier som kan stå veldig langt fra hverandre. I fjor kom det faktisk noen veldig interessante forskningsresultater som viste at de fleste av oss har store vansker med å tolke logaritmiske grafer som avbilder covid-smittetilfeller. Og dette er ikke begrenset til lekmenn: En artikkel i Nature fra tre år siden demonstrerte at også naturforskere ofte ikke klarer å tolke slike grafer heller!

Så, kjære logaritmetviler, du har altså helt rett i din skepsis til bruken av logaritmiske skalaer. Men hvorfor fortsetter da mediene å vise slike grafer, siden vi vet de kan føre til en rekke misforståelser og feiltolkninger? Min hypotese, som jeg må innrømme er basert på ren synsing, er at grafiske designere kan ha en del av skylden her. Logaritmiske grafer ser nemlig bra ut rent estetisk sett (med mindre skarpe opp og ned bevegelser), og er lettere å tilpasse ulike formater. Men er disse fordelene verdt forvirringen den skaper hos mange i møte med slike grafer?

Jørgen Bølstad, statsviter

Jeg tenker utgangspunktet her er en grunnleggende usikkerhet: Det er vanskelig å vite hvordan fremtiden vil se ut, og i dette tilfellet har de som lager grafene, gitt oss flere visningsmuligheter i tilfelle det skulle være nyttig. Vi vet jo at smittespredningen kan bli eksponentiell dersom et virus skulle få spre seg uhindret: Hvis hver smittet person smitter tre til, som igjen smitter tre nye, og så videre, vil smitten øke svært raskt. Hvis dette får fortsette over tid, kan en logaritmisk skala være nyttig, fordi den trykker sammen høyere verdier sammenlignet med lavere verdier.

En logaritmisk transformasjon gjør dessuten at eksponentiell vekst fremstår som lineær, og dette kan gjøre det lettere å se endringer i smittetakten: Hvis stigningen til kurven i det logaritmiske plottet avtar, tyder det på at hver nye smittede smitter færre enn før.

Angående usikkerheten jeg nevnte, så har kanskje fremtiden vært ekstra vanskelig å spå når det gjelder koronaviruset, fordi smittetrendene skapes i et dynamisk samspill mellom innbyggere, virus, og myndigheter.

Dette ble tydelig i en debatt i sommer, da Aftenposten satte et kritisk lys på prognosene som ble laget i løpet av pandemien: 15. juni kunne vi lese en artikkel med overskriften «Prognosene bommet fullstendig på antallet pasienter. Igjen og igjen». Artikkelen stiller spørsmålet om helsemyndighetene har styrt Norge etter «helt urealistiske skrekkscenarioer». Antallet innleggelser ble jo lavere enn skissert? Veksten har ikke vært eksponentiell over lengre tid?

Ironisk nok er en viktig grunn til at de mørkeste scenarioene ikke har slått til at det nettopp har vært et politisk mål å forhindre at de skulle inntreffe. Man har forsøkt å holde det beryktede «R-tallet» lavt for å unngå at smittespredningen skulle løpe løpsk. Når smitten har økt, har man satt inn tiltak, og når den har sunket, har man lettet opp igjen.

Resultatet har vært perioder med mer og mindre smitte, uten at veksten har vært eksponentiell over lengre tid. Uten tiltak kunne nok situasjonen vært ganske annerledes, og hvis den logaritmiske skalaen oppleves som overflødig, tror jeg vi skal prise oss veldig lykkelige over det!

Anders Kvellestad, fysiker

Kjære Logaritmetviler,

Kun logaritmer kan romme selve livet! Jeg overlater diskusjonen av covid-grafer til Jørgen og Pierre – mitt anliggende nå er å omvende deg fra knugende logaritmetvil til frigjørende logaritmetro.

«Det var da voldsomt», tenker du kanskje, «jeg stilte jo bare et enkelt spørsmål om grafer?» Vel, rett bak spørsmålet ditt ligger temaer så omfattende at jeg har hatt skrivesperre i to dager nå. For hva bør man fokusere på for å overbevise noen om logaritmenes fortreffelighet? Her kan man grave seg ned i alt fra protestantisk reformasjon og potensregning (Michael Stifel) til sammenhengen mellom rot i universet og moderne informasjonsteori (Gibbs-entropi og Shannon-entropi).

Men en matematisk ligning sier som kjent mer enn en hel haug med ord, så la oss gå rett til sakens kjerne. Grunnen til å elske logaritmer er denne korte ligningen:

log(A*B) = log(A) + log(B)

Logaritmer knytter altså multiplikasjon av to tall (A og B) til addisjon av to andre tall (log(A) og log(B)). Som vi skal se er det i denne dype sammenhengen vi finner logaritmenes frigjørende kraft.

I grafer bruker vi vanligvis logaritmer med 10 som grunntall. Det betyr at log(10) = 1. Da forteller ligningen over at logaritmen til 100 er 2, siden log(100) = log(10*10) = log(10) + log(10). På samme måte får vi log(1000) = 3, osv. Vi kan også bevege oss mot lavere tall: log(1) = 0, log(0.1) = -1, log(0.01) = -2, log(0.001) = -3, osv. Vi kan altså bruke logaritmer til å lage en alternativ skala for tallene fra 0.001 til 1000: en enkel skala fra -3 til 3, der et steg med lengde 1 tilsvarer en tidobling på den opprinnelige skalaen.

Det vakre med denne logaritmiske skalaen er at den behandler alle størrelsesordener likt: en økning fra 0.001 til 0.01 får like mye plass som en økning fra 100 til 1000! Til sammenligning vil en vanlig, lineær skala gjøre at alt som foregår mellom 0.001 og 10 blir så godt som usynlig – det utgjør jo bare 1% av skalaens lengde – mens den største størrelsesordenen (100 til 1000) får bre seg utover 90% av skalaen.

Hvorfor er denne matematikken så viktig? Vel, i universet vårt foregår det interessante greier på enormt ulike størrelsesordener: En Higgspartikkel «lever» i cirka én titusendels milliardtedels milliardtedels sekund, et menneskeliv varer cirka én milliard sekunder og universets alder er rundt regnet hundre millioner milliarder sekunder. I fysikkeksperimenter har vi utforsket lengder så små som én hundredels milliardtedels milliardtedels meter, menneskelivets klabb og babb foregår på lengder rundt én meter og det observerbare universet har en diameter på cirka én milliard milliard milliard meter. Om vi kun tenker på denne virkeligheten gjennom lineære skalaer vil de store fenomenene raskt overskygge de små. Ja, kanskje kan vår hang til å «tenke lineært» delvis forklare den utbredte tankefeilen der størrelse forveksles med viktighet – som når det hevdes at mennesket må være ubetydelig fordi universet er så stort?

Uansett, kjære Logaritmetviler, ikke la litt forvirrende presentasjon av pandemistatistikk ta fra deg all logaritmetro. For kun logaritmer kan fri oss fra de lineære skalaers størrelsessjåvinisme! Kun logaritmer kan likebehandle alle livets størrelsesordener!

Har du spørsmål til forskerne? Send e-post til ukens@morgenbladet.no

Forvirrende pandemistatistikk: Hva skal vi med logaritmer i grafer?

Pierre Lison, informatiker

Ukens spørsmål

Jørgen Bølstad, statsviter

Anders Kvellestad, fysiker

Mer fra Forskning