Re: problemer med min maskines hardware

From: Flemming Jacobsen (none@fj--batmule.dk.lh.bsd-dk.dk)
Date: Fri 05 May 2000 - 07:10:09 CEST


From: Flemming Jacobsen <none@fj--batmule.dk.lh.bsd-dk.dk>
Subject: Re: problemer med min maskines hardware
To: bsd-dk@bsd-dk.dk
Date: Fri, 5 May 2000 07:10:09 +0200 (CEST)

Hej alle,

Phil Regnauld wrote:
> On Thu, May 04, 2000 at 11:13:44PM +0200, jyrgen wrote:
> > min maskine har en eller anden harware defeckt. Da det eneste OS jeg har
> > lagt ind er freeBSD. Vil jeg spørge om nogle kan fortælle mig hvordan
> > jeg kan køre en form for test der viker over langt tid, så at fejlen kan
> > blive fundet da den vist er perioiske. Jeg har en mistake til at det er
> > rammen der ikke fungere, men et test program har ikke fundet nogle fejl.
>
> Du kan faktisk ikke teste RAM med en software tester.
> En rigtig RAM tester er hardware baseret, og kan teste
> ting som en slow (i.e.: almindelig) memory copy ikke viser.

Helt korrekt. Nogle gange er det dog muligt at få en SW baseret tester
til at detektere fejl. I disse (relativt få) tilfælde er SW testeren
ret god at dunke forretningen i hovedet med.
Drengene på freebsd-hardware listen lader til at kunne lide:
  http://reality.sgi.com/cbrady_denver/memtest86/
Jeg har (heldigvis) ikke haft behov for at lege med den selv ...
 
> > Derfor vil jeg håbe nogle kan hjælpe mig da jeg er newbie inden for BSD.
> Jeg anbefaler stærkt at du prøver andre RAM blokker.

Yes. Start med at fjerne helvdelen af memory (hvis du kan), og lav en binær
søgning efter fejlen.
Andre "usual suspects" er:
        cache+tag ram - Kan som regel ikke pilles ved på nyere boards.
        CPU - Du overclocker vel ikke? Får den nok køling?

> PS: får du signal 11 ved at kompilere store ting ?

Programmer der dør "hist og her", men ikke altid det samme sted, med
div. signaler (oftest 11) er en helt klar indikation af dårlig hardware.

Et godt testprogram er at installere fuld source og derefter køre dette
script (som root - det piller IKKE ved dit system, alt output genereres
i /usr/obj - ha' 200MB fri):

----8<---- ----8<---- ----8<----
#!/bin/sh

cd /usr/src

while : ; do
  make buildworld >/dev/null
done
----8<---- ----8<---- ----8<----

Fejlfri hardware SKAL kunne køre dette script uafbrudt i al evighed.
Tvivlsom hardware vil næsten altid resultere i at konsol loggen
(og /var/log/messages) vil liste fejl som denne:
  /kernel: pid 3959 (<program>), uid 0: exited on signal 11

Håndbogen og/eller FAQen skriver også noget om signal-11 problemer.

'rm -rf /usr/obj/*;time make buildworld' er iøvrigt en rimelig god benchmark
for HW der skal køre som server.

        Hyg'
        Flemming

-- 
Flemming Jacobsen       Email: fj@batmule.dk       Phone: +45 3916 1833
   ---===   If speed kills, Windows users may live forever.   ===---



This archive was generated by hypermail 2b30 : Wed 15 Nov 2006 - 18:24:02 CET