Det var en gång...

Flera decennier inom QA ger en del dråpliga och insiktsgivande berättelser att förmedla. För min egen skull har jag börjat besrkiva en del av dessa här.

Detta är en av dem.


Allt kan man inte hitta i testlabbet

Vi jobbade med ett system som monterades i fartyg. Det var ett system designat för tuffa tag. Ett antal servrar stod på land, men i varje fartyg fanns det minst två servrar som, när de kunde, kommunicerade med de i land.

Det gjordes rigorösa tester i labbet i land. De gick bra.

Systemet monterades så småningom i testfartyg och vi gjorde installationsprov vid kaj. De testerna gick också bra.

Fartyget åkte ut för att testa systemet, men de kom snart tillbaka med besvikna miner. Ingenting funkade. Vi startade om systemet och testade om vid kaj. Det funkade fortfarande bra och de gav sig ut igen. De kom dock snart tillbaka och hävdade ånyo att ingenting funkade.

Förbryllade satte vi en tekniker vid servrarna i fartyget för att övervaka när/varför det gick fel och fartyget gav sig iväg igen.

När fartyget kom in igen var en stackars blåslagen tekniker lösningen på spåret. Det visade sig att när fartyget gick upp i hög fart och studsade hårt på vågorna hoppade läshuvudet omkring på hårddisken och läste slumpmässiga ettor och nollor.

Servrarna var redan i hårda och tåliga case som var så väl avdämpade vi klarade av att skapa.

En lösning bestående av en stor RAM-drive konstruerades (detta var innan SSD:ernas tid). Vid uppstart läses stora delar av datat upp i RAM-minne.

Nya försök med nya lösningen. Nu gick det bättre. Efter några timmar visade det sig dock att systemet slutade fungera. Servrarna dog. Tydligen var den stora mängden RAM-minnen tungt för moderkortet så det vibrerade sönder i stötarna.

Kompletterande stöttor och så många skruvar vi förmådde skruva fast ett moderkort med löste till slut detta problem. Systemet var i drift i något decennium innan SSD kom in och tog över.

Jag vet fortfarande än idag inte hur vi kunde gjort testerna bättre från början.