Actions











Message aux utilisateurs du courriel

Écrit le 20/07/2006 @ 22:28 par Drizzt

Site - Entretien/TweakMalheureusement, nous avons des problèmes de stabilité avec Zacknafein depuis l'ajout de mémoire. Avant de partir pour la fin de semaine, j'ai fait quelques modifications dans l'espoir de le rendre stable, ce qui semble avoir été en vain. Puisque le courriel est l'un des seuls services qui n'est pas répliqué.. Roll Eyes

Vous devrez donc prendre votre mal en patience jusqu'à samedi soir ou dimanche après-midi. Je vais pousser les vérifications plus loin dès mon retour.

Vos courriels ne sont pas perdus! Ne vous inquiétez pas pour ce côté, notre 2e serveur les retiens jusqu'à ce que tout revienne dans l'ordre!

Update 25/07/2006 @ 01h25 :
De retour en ligne, en espérant que cette fois-ci soit la bonne!

Dernière modification le 06/08/2006 @ 19:33 par Drizzt

Commentaire par Drizzt  Score: 2
Écrit le: 22/07/2006 @ 20:45

Je suis présentement en train de faire du SpinRite sur mes disques, la mémoire n'étant pas en cause..

Commentaire par Drizzt  Score: 2
Écrit le: 23/07/2006 @ 01:13

J'ai essayé du SpinRite sur différents disques, le serveur a fonctionné un peu ce soir. Par contre, dès que le Backup s'est lancé, ça a fait kaboom..

Je suis en train de passer le 80GB au complet sur SpinRite, en espérant régler le problème. Les courriels seront donc indisponibles jusqu'à dimanche avant-midi, sinon plus.

Commentaire par Drizzt  Score: 2
Écrit le: 23/07/2006 @ 09:29

Il est maintenant rendu à la partition de 17GB contenant mon BackUp..

Il a corrigé plus d'un million d'erreurs ECC sur cette partition Eek!

Il reste encore /home après!

Commentaire par Nick  Score: 2
Écrit le: 23/07/2006 @ 09:41

Penses-tu que tu vas être capable de le réparer aujourd'hui ?

Commentaire par Drizzt  Score: 2
Écrit le: 23/07/2006 @ 11:11

Il est back online pour l'instant. Il me reste /home à scanner, je vais faire ça de nuit parce que ça va prendre 8h30..

Je vais aussi, probablement, relocaliser des disques durs dans le boîtier..
Dernière modification le 23/07/2006 @ 11:12

Commentaire par Nick  Score: 2
Écrit le: 23/07/2006 @ 12:37

J'arrive pas à accéder à mes eMails, suis-je le seul ?

Commentaire par Drizzt  Score: 2
Écrit le: 23/07/2006 @ 13:14

Non.. je travaille encore sur le problème..

Quand tout va être stable, je vais l'écrire Wink

Commentaire par Drizzt  Score: 2
Écrit le: 23/07/2006 @ 19:33

Je pense qu'après le scan de /home, les problèmes vont être réglés!

Commentaire par Drizzt  Score: 2
Écrit le: 24/07/2006 @ 08:13

Les réparations sont faites, quelque chose comme 12 millions d'erreurs!

On va laisser le temps à Zack de rattrapper le temps perdu cette nuit, puis on va lancer le backup

Commentaire par Nick  Score: 2
Écrit le: 24/07/2006 @ 18:04

Je ne suis pas sur de comprendre, est-ce que t'as un disque dur de brisé ou pas?
S'il est pas brisé, il est quoi?

Commentaire par Drizzt  Score: 2
Écrit le: 24/07/2006 @ 18:42

Il fait juste des erreurs d'ECC. Ça m'était arrivé, il y a longtemps, avec d'autres disques. Je crois que le 40GB en aurait de besoin lui aussi..

SpinRite est capable d'arranger ça.. jusqu'à la prochaine fois!

Commentaire par Drizzt  Score: 2
Écrit le: 25/07/2006 @ 01:27

18 millions d'erreurs ECC, avec des erreurs de Seak, sur mon 40GB..

En espérant que tout rentre dans l'ordre...

Commentaire par Drizzt  Score: 2
Écrit le: 25/07/2006 @ 01:39

Je crois que je vais devoir essayer de prendre un backup de ce disque, et de le formatter.. Aussi non le remplacer.
Dernière modification le 25/07/2006 @ 01:40

Commentaire par Drizzt  Score: 2
Écrit le: 25/07/2006 @ 11:58

Ça a été fait, et ça n'a rien changé..

J'ai changé la carte réseau pour le 'Net, la 3Com me faisait chier. Je suis en train de télécharger des mises à jour de BIOS pour ma carte maîtresse.

J'ai trouvé l'erreur dans les logs, mais aucune information en fouillant sur le 'Net. Ça ressemble à ceci :

Jul 24 11:26:02 Zacknafein kernel: Unable to handle kernel paging request at virtual address ffcb0afc

Jul 24 11:26:02 Zacknafein kernel: printing eip:
Jul 24 11:26:02 Zacknafein kernel: c01cad74
Jul 24 11:26:02 Zacknafein kernel: *pde = 00002067
Jul 24 11:26:02 Zacknafein kernel: Oops: 0000 [#1]
Jul 24 11:26:02 Zacknafein kernel: Modules linked in: nfsd exportfs lockd nfs_acl
autofs4 i2c_dev i2c_core sunrpc ipt_MASQUERADE iptable_nat ipt_recent ipt_state
ip_conntrack iptable_filter ip_tables dm_mirror dm_mod button battery ac uhci_hcd
parport_pc parport sk98lin 3c59x mii floppy ext3 jbd
Jul 24 11:26:02 Zacknafein kernel: CPU: 0
Jul 24 11:26:02 Zacknafein kernel: EIP: 0060:[<c01cad74>] Not tainted VLI
Jul 24 11:26:02 Zacknafein kernel: EFLAGS: 00010202 (2.6.9-34.0.2.EL)
Jul 24 11:26:02 Zacknafein kernel: EIP is at avc_lookup+0x5f/0xaf
Jul 24 11:26:02 Zacknafein kernel: eax: ffcb0afc ebx: 000001a2 ecx: ffcb0ad8 edx: f7f0488c
Jul 24 11:26:02 Zacknafein kernel: esi: 00000000 edi: 00000007 ebp: 00000039 esp: d9b3cd90
Jul 24 11:26:02 Zacknafein kernel: ds: 007b es: 007b ss: 0068
Jul 24 11:26:02 Zacknafein kernel: Process pidof (pid: 12845, threadinfo=d9b3c000 task=f56da0f0)
Jul 24 11:26:02 Zacknafein kernel: Stack: 00000136 00000007 00000136 00000010 00000007 c01cc111 00000010 00000000
Jul 24 11:26:02 Zacknafein kernel: 00000039 00000136 d9b3cdc0 00100000 00000001 00000000 00000000 f7cebd00
Jul 24 11:26:02 Zacknafein kernel: f7cc3940 00000000 00000000 f7cebd00 d9b3cf0c f7cebd78 00000007 00000136
Jul 24 11:26:02 Zacknafein kernel: Call Trace:
Jul 24 11:26:02 Zacknafein kernel: [<c01cc111>] avc_has_perm_noaudit+0x2d/0xda
Jul 24 11:26:02 Zacknafein kernel: [<c01cc1de>] avc_has_perm+0x20/0x46
Jul 24 11:26:02 Zacknafein kernel: [<c0178033>] do_lookup+0x1f/0x8f
Jul 24 11:26:02 Zacknafein kernel: [<c01cd736>] inode_has_perm+0x4c/0x54
Jul 24 11:26:02 Zacknafein kernel: [<c0181caf>] dput+0x33/0x423
Jul 24 11:26:02 Zacknafein kernel: [<c0178ecb>] link_path_walk+0x90/0xb9
Jul 24 11:26:02 Zacknafein kernel: [<c01cf298>] selinux_inode_getattr+0x48/0x50
Jul 24 11:26:02 Zacknafein kernel: [<c017343f>] vfs_getattr+0x1b/0x88
Jul 24 11:26:02 Zacknafein kernel: [<c017350b>] vfs_lstat+0x25/0x37
Jul 24 11:26:02 Zacknafein kernel: [<c01cf84a>] selinux_file_permission+0x114/0x11d
Jul 24 11:26:02 Zacknafein kernel: [<c0173aec>] sys_lstat64+0xf/0x23
Jul 24 11:26:02 Zacknafein kernel: [<c0181caf>] dput+0x33/0x423
Jul 24 11:26:02 Zacknafein kernel: [<c01699ce>] __fput+0xc9/0xee
Jul 24 11:26:02 Zacknafein kernel: [<c011a7f9>] do_page_fault+0x0/0x4dc
Jul 24 11:26:02 Zacknafein kernel: [<c03115ff>] error_code+0x2f/0x38
Jul 24 11:26:02 Zacknafein kernel: [<c031147b>] syscall_call+0x7/0xb
Jul 24 11:26:02 Zacknafein kernel: Code: dc 8b 41 24 8d 74 26 00 8d 04 dd e0 99
41 c0 39 c2 74 3d 8b 04 24 3b 01 75 0b 66 39 79 08 75 05 3b 69 04 74 18 8b 41
24 8d 48 dc <8b> 51 24 8d 74 26 00 8d 14 dd e0 99 41 c0 39 d0 eb d4 85 c9 89
Jul 24 11:26:02 Zacknafein kernel: <0>Fatal exception: panic in 5 seconds



C'est la raison pour laquelle je vais essayer de mettre à jour le BIOS..
Dernière modification le 25/07/2006 @ 11:59

Commentaire par Drizzt  Score: 2
Écrit le: 25/07/2006 @ 12:08

Erreur de pagination.......

J'enlève l'une de mes 2 partitions de Swap.. on verra bien! Smart!

Commentaire par Alexandre  Score: 1.5
Écrit le: 25/07/2006 @ 13:42

Toujours "amusant" de voir le kernel tombé en "panic"... I will be in a panic mode in, well let's say, 5 seconds if everything goes fine... Wink

Commentaire par Alexandre  Score: 2
Écrit le: 25/07/2006 @ 13:44

Sur une note plus sérieuse cette fois, ça n'arrive que depuis que tu as ajouté de la mémoire, right? Quelle est ta version de kernel. Je crois avoir lu quelque chose là-dessus sur kerneltrap.org, mais j'aimerais vérifier avant de partir de fausses rumeurs.

Commentaire par Drizzt  Score: 2
Écrit le: 25/07/2006 @ 15:49

Oui, mais je ne crois pas que ce soit lié..

Anyway, là tout semble stable, on va voir ce qui s'y passe!

Commentaire par Drizzt  Score: 2
Écrit le: 26/07/2006 @ 00:11

Bon.. on a fait pratiquement 12h00 stable. J'ai réactivé le swap, en prenant soin de le formater avec vérification des secteurs, sur le disque sur lequel j'avais un doute. C'est un setup temporaire, le backup va commencer bientôt, si ça plante.. on va savoir pourquoi! Laughing out loud

Commentaire par Drizzt  Score: 2
Écrit le: 26/07/2006 @ 00:56

Ça a replanté presque instantanément..

Aussi bien oublier cette partition de swap.. le disque est en train de mourrir je crois Cry

Commentaire par Drizzt  Score: 2
Écrit le: 26/07/2006 @ 01:09

Merde.. même sans cette partition de swap, j'ai replanté presque immédiatement après le boot..

J'y comprends plus rien Surrender

Commentaire par Nick  Score: 2
Écrit le: 26/07/2006 @ 07:32

La théorie de Zalex sur la mémoire a-t-elle été infirmée ?

Commentaire par Drizzt  Score: 2
Écrit le: 26/07/2006 @ 10:42

J'ai pas fait le test de 4h dessus.. mais normalement, memtest86 le trouve très rapidement lorsqu'il y a un problème de mémoire..

Commentaire par blanalex  Score: 2
Écrit le: 26/07/2006 @ 11:12

Par expérience, memtest86 trouve pas toute! Essaie de swapper des barettes de mémoires ou les enlever une par une si tu veux *vraiment* savoir!

Commentaire par Drizzt  Score: 2
Écrit le: 26/07/2006 @ 11:16

Prochain crash! Laughing out loud

Commentaire par Drizzt  Score: 2
Écrit le: 26/07/2006 @ 11:15

Je viens d'activer le reboot automatique sur un panic..

Commentaire par Drizzt  Score: 2
Écrit le: 26/07/2006 @ 18:53

J'ai enlevé l'une des 2 barrettes pour voir..

Commentaire par Drizzt  Score: 2
Écrit le: 28/07/2006 @ 10:37

Stable depuis 35h..

On va essayer l'autre voir!

Commentaire par Drizzt  Score: 2
Écrit le: 28/07/2006 @ 13:26

L'autre a fait planter la machine en moins de 2 heures.

Retour sur la première barrette, et j'ai mis 3 barrettes dans la machine (pour la chaleur). Si dans 35h il n'y a pas eu de plante, j'entre en contact avec le vendeur pour remboursement ou échange.

Commentaire par Drizzt  Score: 2
Écrit le: 29/07/2006 @ 01:14

Théorie infirmée. Le serveur a redémarré vers 21h10, et puisque j'étais à Sherbrooke, ce n'était pas moi!

Ce serait donc soit :

  • La première banque de mémoire
  • La chaleur



Dans les 2 cas.. chu tanné des poutines! Mad

Commentaire par blanalex  Score: 2
Écrit le: 29/07/2006 @ 10:50

Tu peux avoir les mêmes troubles avec du brand-name, et une fois la garantie échue, t'es dans le même trouble qu'avec une poutine...

Commentaire par Drizzt  Score: 2
Écrit le: 29/07/2006 @ 10:51

Vrai.. mais au moins ce serait plus facile de trouver la solution.. Là chu dans un void d'idée.. j'ai cru l'avoir trouvé plusieurs fois, et finalement c'est jamais ça..

Commentaire par Drizzt  Score: 2
Écrit le: 29/07/2006 @ 11:29

Bon.. j'ai décidé de tester autrement..

Normalement, j'avais dans la machine : 512MB - 512MB - 256MB

La machine a été stable très longtemps ainsi : 256MB - 128MB - 128MB

J'ai donc décidé de mettre : 256MB - 512MB - 512MB

En espérant que ça ne plante plus..

Prochaine étape, je vais essayer de me trouver des câbles IDE, mais pas en nappe, pour améliorer la circulation de l'air.

Commentaire par Drizzt  Score: 2
Écrit le: 31/07/2006 @ 08:07

Planté environ 7 fois depuis hier midi.

Prochaine fois, je vais l'ouvrir (à nouveau) et essayer de rooter les câbles autrement autour de la mémoire, question d'améliorer l'aération.

Éventuellement, je vais acheter une autre (4e) fan, pour mettre près du CPU..

Commentaire par Drizzt  Score: 2
Écrit le: 31/07/2006 @ 08:43

J'ai décidé de le faire tout de suite..

Donc :

  • 1 nappe IDE + 1 nappe floppy passent sur le long des drive bays, pour monter jusqu'aux périphériques
  • Les câbles électriques sont attaqués sur le côté, laissant de la place pour l'air
  • On voit les barrettes de mémoire!
  • J'ai changé la carte vidéo pour une Radeon 7000.. c'était peut-être ça.. on sait jamais! Laughing out loud

Commentaire par Drizzt  Score: 2
Écrit le: 31/07/2006 @ 09:55

Ça a replanté, alors j'ai décidé de changer un disque qui était malade.. en espérant que ça règle le problème.

Commentaire par Drizzt  Score: 2
Écrit le: 31/07/2006 @ 16:03

Replanté.. alors j'ai débranché mon 60GB malade (mais qui fonctionnait encore)

Commentaire par Drizzt  Score: 2
Écrit le: 01/08/2006 @ 10:53

19h sans pépins..

On dirait que je vais devoir acheter un nouveau disque dur Roll Eyes

Au moins je vais avoir plus de place pour mes films! Laughing out loud

Commentaire par Drizzt  Score: 2
Écrit le: 01/08/2006 @ 11:43

Le 60GB est en train d'être scanné sur Feu-Menzoberranzan. Il ne retourne aucune données Smart, c'est peut-être là le problème..

M'enfin.. je vais voir ce que je vais faire avec ça!

Commentaire par Drizzt  Score: 2
Écrit le: 02/08/2006 @ 08:19

2 nuits sans problèmes, je crois qu'on a notre coupable Roll Eyes

Commentaire par Drizzt  Score: 2
Écrit le: 02/08/2006 @ 09:32

Je viens de remettre le disque dans le serveur, mais sur un autre contrôleur IDE. J'ai remis toute la RAM aussi..

On verra ce que ça donne!

Commentaire par Drizzt  Score: 2
Écrit le: 02/08/2006 @ 18:02

Je crois qu'on a un gagnant! Aucune plantage aujourd'hui, avec les 1.25GB de RAM et tous les disques! Eek!

SeLinux est enablé, j'ai poussé l'utilisation de la mémoire jusqu'à ce qu'il n'y ait que quelques MB de libre, et j'ai écouté des MP3 toute la journée, qui sont sur le disque malade.

Demain on va être certains, mais ça reste que je crois que le dossier est clos!

Commentaire par Drizzt  Score: 2
Écrit le: 03/08/2006 @ 12:30

Cet après-midi je vais aller acheter un disque dur (si possible avec une garantie de plus de 3 ans), pour remplacer mon 40GB et mon 60GB qui sont en train de mourrir (même pas capable de lire les données dessus présentement Cry)

Commentaire par Drizzt  Score: 2
Écrit le: 03/08/2006 @ 15:09

J'ai perdu mes 12GB de Futurama Roll Eyes En moins d'un miracle..

Pour le 60GB, ça semble moins pire.. on verra bien..

Commentaire par Drizzt  Score: 2
Écrit le: 04/08/2006 @ 00:38

Stable depuis plus de 8h, ça semble même plus stable via WiFi Bugeye Probablement un hasard.

Commentaire par Drizzt  Score: 2
Écrit le: 04/08/2006 @ 01:12

On dirait que c'est un problème que j'ai depuis longtemps, sans le savoir. J'ai trouvé des erreurs similaires dans les logs datant du 30 avril et du mois de mai Bugeye

Aussi, je viens de trouver que le circuit 3.3V sur le motherboard est placé à 3.53V de compagnie, pour aider à l'overclocking ( Confused Roll Eyes).

J'ai changé le jumper de place, le ramenant à 3.35V selon les sensors.
Dernière modification le 04/08/2006 @ 01:42

Commentaire par Drizzt  Score: 2
Écrit le: 06/08/2006 @ 19:33

0 reboot pour 66h, dossier clos!


Tous les blogs
<< Une peur incontrôlable | Retour aux blogs | Un logiciel pour faire du bug tracking >>
Blogs de la même catégorie
<< La mémoire pour Zack est arrivée! | Edition naturelle du contenu >>