Probleme avec heartbeat - Bide story

Probleme avec heartbeat - Bide story - réseaux et sécurité - Linux et OS Alternatifs

Marsh Posté le 22-04-2004 à 09:04:03    

Salut, j ai un probleme avec Heartbeat,
 
 
kan j active le 1ier Node, pas de probleme, kan j active le second :

Citation :


 Both machines own our resources!


 
et ensuite, il n y a plus ke le 2nd node ki repond a l IP.
Une idee ?
 
PS: Je vise le Bide avec ce topic (comme avec beaucoup d autre ke je fais sur ce forum) je sent


Message édité par Z_cool le 22-04-2004 à 10:31:00

---------------
#mais-chut
Reply

Marsh Posté le 22-04-2004 à 09:04:03   

Reply

Marsh Posté le 22-04-2004 à 10:51:39    

kool, j adore avoir raison


---------------
#mais-chut
Reply

Marsh Posté le 22-04-2004 à 11:51:44    

mouai bon ba deciedment.


---------------
#mais-chut
Reply

Marsh Posté le 22-04-2004 à 12:08:00    

T'as suivi à la lettre le tuto du hors série linux mag?

Reply

Marsh Posté le 22-04-2004 à 12:08:57    

chaica a écrit :

T'as suivi à la lettre le tuto du hors série linux mag?


 
oui, enfin je pense.
 
l une des seul difference, c est ke j ai un RedHat 9 et un Red Hat 7.2
 
hors, sur le site de monkeychose, la 1ier distribution est pour redhat 7.3


Message édité par Z_cool le 22-04-2004 à 12:10:36

---------------
#mais-chut
Reply

Marsh Posté le 22-04-2004 à 12:11:35    

Z_cool a écrit :

Salut, j ai un probleme avec Heartbeat,
 
 
kan j active le 1ier Node, pas de probleme, kan j active le second :

Citation :


 Both machines own our resources!


 
et ensuite, il n y a plus ke le 2nd node ki repond a l IP.
Une idee ?
 
PS: Je vise le Bide avec ce topic (comme avec beaucoup d autre ke je fais sur ce forum) je sent


 
T'as pas des log sur le 1er noeud ? Genre il s'est disabled ? ( pê que uniquement coté NIC )
Si c'est HeartBeat qui désactive ton noeud, ca ressemeble à un pbl de conf... (les machines ne se "voient" pas ? )


Message édité par Phoenix le 22-04-2004 à 12:14:23
Reply

Marsh Posté le 22-04-2004 à 12:35:04    

config 1 :  

Citation :


ha.cf
bcast           eth0
 
debugfile       /var/log/ha-debug
logfile         /var/log/ha-log
logfacility     local0
 
keepalive       2
deadtime        10
warntime        6
initdead        60
 
udp             eth0
udpport         694
node            proxy1.test
node            proxy2.test
nice_failback   on
 
haresources
proxy1.test IPaddr::10.104.58.225
 
log:
[root@proxy1 root]# tail -f /var/log/ha-log
heartbeat: 2004/04/22_12:32:07 info: UDP Broadcast heartbeat started on port 694 (694) interface eth0
heartbeat: 2004/04/22_12:32:07 info: UDP Broadcast heartbeat started on port 694 (694) interface eth0
heartbeat: 2004/04/22_12:32:08 info: pid 3700 locked in memory.
heartbeat: 2004/04/22_12:32:08 info: pid 3701 locked in memory.
heartbeat: 2004/04/22_12:32:08 info: pid 3702 locked in memory.
heartbeat: 2004/04/22_12:32:08 info: pid 3703 locked in memory.
heartbeat: 2004/04/22_12:32:08 info: pid 3704 locked in memory.
heartbeat: 2004/04/22_12:32:08 info: Local status now set to: 'up'
heartbeat: 2004/04/22_12:32:08 info: pid 3697 locked in memory.
heartbeat: 2004/04/22_12:32:10 info: Link proxy1.test:eth0 up.
heartbeat: 2004/04/22_12:33:08 WARN: node proxy2.test: is dead
heartbeat: 2004/04/22_12:33:08 WARN: No STONITH device configured.
heartbeat: 2004/04/22_12:33:08 WARN: Shared resources (storage!) are not protect
ed!
heartbeat: 2004/04/22_12:33:08 info: Resources being acquired from proxy2.test.
heartbeat: 2004/04/22_12:33:08 info: Local status now set to: 'active'
heartbeat: 2004/04/22_12:33:08 info: Running /etc/ha.d/rc.d/status status
heartbeat: 2004/04/22_12:33:08 info: /usr/lib/heartbeat/mach_down: nice_failback
: acquiring foreign resources
heartbeat: 2004/04/22_12:33:08 info: mach_down takeover complete.
heartbeat: 2004/04/22_12:33:08 info: mach_down takeover complete for node proxy2
.test.
heartbeat: 2004/04/22_12:33:08 info: Resource acquisition completed.
heartbeat: 2004/04/22_12:33:08 info: Running /etc/ha.d/rc.d/ip-request-resp ip-r
equest-resp
heartbeat: 2004/04/22_12:33:08 received ip-request-resp IPaddr::10.104.58.225 OK
 yes
heartbeat: 2004/04/22_12:33:09 info: Acquiring resource group: proxy1.test IPadd
r::10.104.58.225
heartbeat: 2004/04/22_12:33:09 info: Running /etc/ha.d/resource.d/IPaddr 10.104.
58.225 start
heartbeat: 2004/04/22_12:33:09 info: /sbin/ifconfig eth0:0 10.104.58.225 netmask
 255.255.255.0  broadcast 10.104.58.255
heartbeat: 2004/04/22_12:33:09 info: Sending Gratuitous Arp for 10.104.58.225 on
 eth0:0 [eth0]
heartbeat: 2004/04/22_12:33:09 /usr/lib/heartbeat/send_arp eth0 10.104.58.225 00
E000C10C16 10.104.58.225 ffffffffffff
heartbeat: 2004/04/22_12:33:11 /usr/lib/heartbeat/send_arp eth0 10.104.58.225 00
E000C10C16 10.104.58.225 ffffffffffff
heartbeat: 2004/04/22_12:33:13 /usr/lib/heartbeat/send_arp eth0 10.104.58.225 00
E000C10C16 10.104.58.225 ffffffffffff
heartbeat: 2004/04/22_12:33:15 /usr/lib/heartbeat/send_arp eth0 10.104.58.225 00
E000C10C16 10.104.58.225 ffffffffffff
heartbeat: 2004/04/22_12:33:17 /usr/lib/heartbeat/send_arp eth0 10.104.58.225 00
E000C10C16 10.104.58.225 ffffffffffff
heartbeat: 2004/04/22_12:33:18 info: Local Resource acquisition completed. (none
)
heartbeat: 2004/04/22_12:33:18 info: local resource transition completed.
 
 


Message édité par Z_cool le 22-04-2004 à 12:37:06
Reply

Marsh Posté le 22-04-2004 à 12:44:41    

puis maintenant demarage du 2nd noeud
 
 
Log noeud 1 :
 
heartbeat: 2004/04/22_12:37:36 info: Link proxy2.test:eth0 up.
heartbeat: 2004/04/22_12:37:36 info: Status update for node proxy2.test: status up
heartbeat: 2004/04/22_12:37:36 info: Running /etc/ha.d/rc.d/status status
^[[A^[[A^[[B^[[B^[[B
[root@proxy1 root]# tail -f /var/log/ha-log
heartbeat: 2004/04/22_12:33:09 /usr/lib/heartbeat/send_arp eth0 10.104.58.225 00E000C10C16 10.104.58.225 ffffffffffff
heartbeat: 2004/04/22_12:33:11 /usr/lib/heartbeat/send_arp eth0 10.104.58.225 00E000C10C16 10.104.58.225 ffffffffffff
heartbeat: 2004/04/22_12:33:13 /usr/lib/heartbeat/send_arp eth0 10.104.58.225 00E000C10C16 10.104.58.225 ffffffffffff
heartbeat: 2004/04/22_12:33:15 /usr/lib/heartbeat/send_arp eth0 10.104.58.225 00E000C10C16 10.104.58.225 ffffffffffff
heartbeat: 2004/04/22_12:33:17 /usr/lib/heartbeat/send_arp eth0 10.104.58.225 00E000C10C16 10.104.58.225 ffffffffffff
heartbeat: 2004/04/22_12:33:18 info: Local Resource acquisition completed. (none)
heartbeat: 2004/04/22_12:33:18 info: local resource transition completed.
heartbeat: 2004/04/22_12:37:36 info: Link proxy2.test:eth0 up.
heartbeat: 2004/04/22_12:37:36 info: Status update for node proxy2.test: status up
heartbeat: 2004/04/22_12:37:36 info: Running /etc/ha.d/rc.d/status status
heartbeat: 2004/04/22_12:38:27 info: Status update for node proxy2.test: status active
heartbeat: 2004/04/22_12:38:27 info: Running /etc/ha.d/rc.d/status status
heartbeat: 2004/04/22_12:38:27 info: remote resource transition completed.
heartbeat: 2004/04/22_12:38:27 ERROR: Both machines own our resources!
heartbeat: 2004/04/22_12:38:27 ERROR: Both machines own foreign resources!
heartbeat: 2004/04/22_12:38:30 ERROR: Both machines own our resources!
heartbeat: 2004/04/22_12:38:30 ERROR: Both machines own foreign resources!
heartbeat: 2004/04/22_12:38:39 ERROR: Both machines own our resources!
heartbeat: 2004/04/22_12:38:39 ERROR: Both machines own foreign resources!
 
Log noeud 2 :
Log noeud 2 :  
 
heartbeat: 2004/04/22_12:37:35 WARN: WARNING: directive 'udp' replaced by 'bcast'  
heartbeat: 2004/04/22_12:37:35 info: **************************  
heartbeat: 2004/04/22_12:37:35 info: Configuration validated. Starting heartbeat 1.0.4  
heartbeat: 2004/04/22_12:37:35 info: nice_failback is in effect.  
heartbeat: 2004/04/22_12:37:35 info: heartbeat: version 1.0.4  
heartbeat: 2004/04/22_12:37:35 info: Heartbeat generation: 15  
heartbeat: 2004/04/22_12:37:36 info: UDP Broadcast heartbeat started on port 694 (694) interface eth0  
heartbeat: 2004/04/22_12:37:36 info: UDP Broadcast heartbeat started on port 694 (694) interface eth0  
heartbeat: 2004/04/22_12:37:36 info: pid 1194 locked in memory.  
heartbeat: 2004/04/22_12:37:36 info: pid 1195 locked in memory.  
heartbeat: 2004/04/22_12:37:36 info: pid 1196 locked in memory.  
heartbeat: 2004/04/22_12:37:36 info: pid 1198 locked in memory.  
heartbeat: 2004/04/22_12:37:36 info: Local status now set to: 'up'  
heartbeat: 2004/04/22_12:37:36 info: pid 1191 locked in memory.  
heartbeat: 2004/04/22_12:37:37 info: pid 1197 locked in memory.  
heartbeat: 2004/04/22_12:37:37 info: Link proxy2.test:eth0 up.  
heartbeat: 2004/04/22_12:38:37 WARN: node proxy1.test: is dead  
heartbeat: 2004/04/22_12:38:37 WARN: node proxy1.test: is dead  
heartbeat: 2004/04/22_12:38:37 WARN: No STONITH device configured.  
heartbeat: 2004/04/22_12:38:37 WARN: Shared resources (storage!) are not protected!  
heartbeat: 2004/04/22_12:38:37 info: Resources being acquired from proxy1.test.  
heartbeat: 2004/04/22_12:38:37 info: Local status now set to: 'active'  
heartbeat: 2004/04/22_12:38:37 info: Running /etc/ha.d/rc.d/status status  
heartbeat: 2004/04/22_12:38:37 info: No local resources [/usr/lib/heartbeat/ResourceManager listkeys proxy2.test]  
heartbeat: 2004/04/22_12:38:37 info: Resource acquisition completed.  
heartbeat: 2004/04/22_12:38:38 info: Taking over resource group IPaddr::10.104.58.225  
heartbeat: 2004/04/22_12:38:38 info: Acquiring resource group: proxy1.test IPaddr::10.104.58.225  
heartbeat: 2004/04/22_12:38:38 info: Running /etc/ha.d/resource.d/IPaddr 10.104.58.225 start  
heartbeat: 2004/04/22_12:38:39 info: /sbin/ifconfig eth0:0 10.104.58.225 netmask 255.255.255.0  broadcast 10.104.58.255  
heartbeat: 2004/04/22_12:38:39 info: Sending Gratuitous Arp for 10.104.58.225 on eth0:0 [eth0]  
heartbeat: 2004/04/22_12:38:39 info: /usr/lib/heartbeat/mach_down: nice_failback: acquiring foreign resources  
heartbeat: 2004/04/22_12:38:39 /usr/lib/heartbeat/send_arp eth0 10.104.58.225 00  
50564E929E 10.104.58.225 ffffffffffff  
heartbeat: 2004/04/22_12:38:39 info: mach_down takeover complete.  
heartbeat: 2004/04/22_12:38:40 info: mach_down takeover complete for node proxy1.test.  
heartbeat: 2004/04/22_12:38:42 /usr/lib/heartbeat/send_arp eth0 10.104.58.225 0050564E929E 10.104.58.225 ffffffffffff  
heartbeat: 2004/04/22_12:38:44 /usr/lib/heartbeat/send_arp eth0 10.104.58.225 0050564E929E 10.104.58.225 ffffffffffff  
heartbeat: 2004/04/22_12:38:46 /usr/lib/heartbeat/send_arp eth0 10.104.58.225 0050564E929E 10.104.58.225 ffffffffffff  
heartbeat: 2004/04/22_12:38:48 /usr/lib/heartbeat/send_arp eth0 10.104.58.225 0050564E929E 10.104.58.225 ffffffffffff  
heartbeat: 2004/04/22_12:38:49 info: Local Resource acquisition completed. (none)  
heartbeat: 2004/04/22_12:38:49 info: local resource transition completed.


Message édité par Z_cool le 22-04-2004 à 13:01:13
Reply

Marsh Posté le 22-04-2004 à 12:56:06    

Je tiens a preciser ke le ping passe bien entre les 2 machines


---------------
#mais-chut
Reply

Marsh Posté le 22-04-2004 à 13:07:41    

Ton firewall local ne bloque les paquets heartbeat ? (c'est pas du ping si je me souviens bien)

Reply

Marsh Posté le 22-04-2004 à 13:07:41   

Reply

Marsh Posté le 22-04-2004 à 13:25:04    

Shyamalan a écrit :

Ton firewall local ne bloque les paquets heartbeat ? (c'est pas du ping si je me souviens bien)


 
ba je me rappel pas avoir installé de FW, comme je peux verifier ?


---------------
#mais-chut
Reply

Marsh Posté le 22-04-2004 à 13:35:40    

"/etc/init.d/iptables stop" sur les 2 machines juste le temps de tester


Message édité par Shyamalan le 22-04-2004 à 13:36:03
Reply

Marsh Posté le 22-04-2004 à 13:46:43    

j y ai bien cru kan j ai vu ke le service etait demarré, mais non, ca n etait pas ca.


---------------
#mais-chut
Reply

Marsh Posté le 22-04-2004 à 13:50:24    

Bon, pour recapitulé :
 
Noeud 1 :  
Red Hat 9
Heartbeat 1.0.4-2 pour RedHat 9
 
noeud 2 : serveur sous VMWARE
Red Hat 7.2
Reartbeat 1.0.4-1 pour redHat 7.3


---------------
#mais-chut
Reply

Marsh Posté le 22-04-2004 à 13:58:22    

- haresources est bien le meme sur les 2 machines ?
- tu as créé le fichier authkeys ?
 
Tu devrais peut etre aussi tester la derniere version d'heartbeat (1.2.1)

Reply

Marsh Posté le 22-04-2004 à 14:06:02    

Z_cool a écrit :

Je tiens a preciser ke le ping passe bien entre les 2 machines


 
yes, mais le heartbeat utilise UDP sur le port 694...
Donc faudrait vérifier déja coté réseau !
 
un "nmap -sUv proxy1.test" depus proxy2 et inversement, car visiblement tes noeuds ne se voient pas.
 
Sinon toujours au niveau réseau, un "tcpdump -i eth0 host proxy1.test" depuis proxy2.test et la même chose de l'autre coté.

Reply

Marsh Posté le 22-04-2004 à 14:19:05    

Shyamalan a écrit :

- haresources est bien le meme sur les 2 machines ?
- tu as créé le fichier authkeys ?
 
Tu devrais peut etre aussi tester la derniere version d'heartbeat (1.2.1)


oui, le fichier haresources est bien le meme.
 
 
bon je m etais basé sur le repertoir nomé stable.latest mais il semble ke ce soit pas tout a fait la derniere.
 
je vais donc tester la 1.3


---------------
#mais-chut
Reply

Marsh Posté le 22-04-2004 à 14:26:18    

phoenix a écrit :

yes, mais le heartbeat utilise UDP sur le port 694...
Donc faudrait vérifier déja coté réseau !
 
un "nmap -sUv proxy1.test" depus proxy2 et inversement, car visiblement tes noeuds ne se voient pas.
 
Sinon toujours au niveau réseau, un "tcpdump -i eth0 host proxy1.test" depuis proxy2.test et la même chose de l'autre coté.
 


 
avec nmap, aucun des 2 ne semble voir ces port d ouvert  :sweat:


---------------
#mais-chut
Reply

Marsh Posté le 22-04-2004 à 15:17:06    

et tcpdump -i eth0 udp

Reply

Marsh Posté le 22-04-2004 à 15:19:10    

Phoenix a écrit :

et tcpdump -i eth0 udp


pas installé TCPDUMP  [:sisicaivrai]


---------------
#mais-chut
Reply

Marsh Posté le 23-04-2004 à 14:17:39    

bouhhh, je viens d installer la derniere version, elle a correctement demarré.
 
J ai essayé de voir tout les ports ouvert grace a un soft de scannage de port et il ne m a pas trouvé celui la.


---------------
#mais-chut
Reply

Marsh Posté le 23-04-2004 à 15:01:14    

fais gaffe, la majeur partie des softs de scan scanne les port TCP, or la il s'agit d'UDP !
Sur chaquune de tes machines, passe un "netstat -lpun | grep :694" histoire de voir si le port est bindé (et si c'est bien sur le bon port)
 
 

Reply

Marsh Posté le 03-06-2004 à 09:21:37    

salut, j ai un nouveau problem avec heartbeat :
 
voila le Log :
 
heartbeat: 2004/06/03_09:16:55 ERROR: Error sending packet: Invalid argument    
heartbeat: 2004/06/03_09:16:55 ERROR: write failure on bcast eth0.: Invalid arg
ment                                                                            
heartbeat: 2004/06/03_09:16:56 ERROR: Error sending packet: Invalid argument    
heartbeat: 2004/06/03_09:16:56 ERROR: write failure on bcast eth0.: Invalid arg
ment                                                                            
                                                                               
J ai aucune idee de ce ki peut causer ca.
 
le plus amusant, c est ke la machine Host bien l IP "virtuel"
 


---------------
#mais-chut
Reply

Marsh Posté le 03-06-2004 à 11:11:44    

Personellement je fais pas de broadcast, je vois pas trop l'interet pour heartbeat entre 2 machines.
Tu peux peut etre testé, remplace dans ha.cf ta ligne bcast par :  
ucast eth0 <ip>
 
Mais j'suis pas convaincu que ca vienne de là  [:spamafote]  
Donne nous les fichiers de conf, ce sera plus simple.

Reply

Marsh Posté le 03-06-2004 à 11:23:11    

fichier de config :
 

debugfile /var/log/ha-debug    
logfile /var/log/ha-log        
logfacility     local0          
deadtime 10                    
                               
udp     eth0                    
                               
node    Proxy1                  
node    Proxy2    

J ai pas de ligne bcast  [:tinostar]


Message édité par Z_cool le 03-06-2004 à 11:23:48

---------------
#mais-chut
Reply

Marsh Posté le 03-06-2004 à 11:30:09    

T'as trouvé où le parametre udp que t'as mis dans ton fichier de conf  :??:  
 
Essaye de remplacer "udp eth0" par "bcast eth0" ou "ucast eth0 <ip>"

Reply

Marsh Posté le 03-06-2004 à 11:39:37    

si je me rappel bien, dans la revue Linux Mag
 
mais aussi dans des exemples de configuration du site linux-ha.org


---------------
#mais-chut
Reply

Marsh Posté le 03-06-2004 à 11:51:39    

j arrive pas a retrouver le parametre ki dit kelle est la machine prioritaire pour une IP ?
 
c est a dir ke si la machine principale revien a la vie, il recupere sont IP


---------------
#mais-chut
Reply

Marsh Posté le 03-06-2004 à 12:02:57    

cela dit, ucast marche bien, merci


---------------
#mais-chut
Reply

Marsh Posté le 03-06-2004 à 12:25:25    

auto_failback on

Reply

Marsh Posté le 03-06-2004 à 13:04:30    

ok, merci encors.
 
sans vouloir abuser, j arrive pas non plus a retrouver la procedure pour l envoi de mail...  :whistle:


---------------
#mais-chut
Reply

Marsh Posté le 03-06-2004 à 13:14:23    

La je vois pas, moi j'utilise MON qui surveille mes services et m'envoie un mail en cas de basculement.

Reply

Marsh Posté le 03-06-2004 à 13:29:13    

en fait, il sagit de rajouter un MailTo dans haressources, mais je me souvient plus des parametre ni rien


---------------
#mais-chut
Reply

Marsh Posté le    

Reply

Sujets relatifs:

Leave a Replay

Make sure you enter the(*)required information where indicate.HTML code is not allowed