probleme de désynchronisation du service temps sur PDC

probleme de désynchronisation du service temps sur PDC - Infrastructures serveurs - Systèmes & Réseaux Pro

Marsh Posté le 03-12-2015 à 10:45:51    

Bonjour,
 
Je constate depuis 4 semaine un phénomène étrange sur mon PDC. Celui-ci se désynchronise de façon aléatoire ( + ou - 1 semaine) le mercredi ou le jeudi matin. Cela impactant forcément toutes mon infrastructure et surtout bloquant les utilisateurs de l'entreprise.
ce serveur 2012 R2 tourne sur un vm hyper-v.
J'ai déjà enlevé la synchro entre l'hyperviseur et la vm, modifié mes sources de temps (passé de time.windows à ntp.org) mais rien n'y fait.
chaque milieu de semaine vers 04H00 du matin il y a un changement brutale de la date et de l'heure sans aucune logique. j'ai activé le mode debug du service de temps mais les logs sont un peu incompréhensible pour moi.
Je suis donc preneur de toute aide pouvant m'éclairer.
 
merci d'avance
 
voici les logs :
151545 04:02:20.9219456s - ListeningThread STC:26118924
151545 04:02:20.9219456s - Computing server signature: OLD:FALSE, RID:00000526, format:0x1
151545 04:02:20.9107998s - ClockDispln Discipline: *SKEW*TIME* - PhCRR:597902462 CR:156249 PhCR:78124 UI:100 phcT:4445 KPhO:6431485937959
151545 04:02:20.9664721s - TransmitResponse: sent 0.0.0.0:123(192.168.44.2:123)->192.168.44.9:123
151545 04:02:20.9664721s - W32TmServiceMain: timeout
151545 04:02:20.9664721s - Sample Prepared at 130935025409664721 for peer 0.fr.pool.ntp.org,1.fr.pool.ntp.org,2.fr.pool.ntp.org,3.fr.pool.ntp.org,0x8 (ntp.m|0x1|0.0.0.0:123->129.250.35.250:123)
151545 04:02:20.9664721s - NtpClient returned 1 samples.
151545 04:02:20.9664721s - Sample 0 offset:-00.0027759s delay:+00.0485535s dispersion:00.1322681s
151545 04:02:20.9664721s - Intersection successful with 0 dropped samples.
151545 04:02:20.9664721s -   0: Sample:0 SyncDist:321565448 SelectDisp:0
151545 04:02:20.9664721s - Sample 0 chosen. Select Dispersion:00.0000000s STC:26056265
151545 04:02:20.9776189s - ClockDispln Update: *STALE*(NextSTC=26056265 <= LastUTC=26056265) Sync
151552 15:01:11.1283568s - ClockDispln Discipline: *SET*TIME* - PhCR:9186982907 KPho:6430888035497
 (AUDIT)151552 15:01:11.2500808s - ClockDispln Discipline: *SKEW*TIME* - PhCRR:0 CR:156249 PhCR:9186982907 UI:100 phcT:1 KPhO:0
151552 15:01:11.2500808s - TimeProvCommand([NtpClient], TPC_TimeJumped) called.
151552 15:01:11.2500808s - TimeProvCommand([NtpServer], TPC_TimeJumped) called.
151552 15:01:11.2500808s - W32TmServiceMain: waiting 1024.000s
151552 15:01:11.2500808s - PeerPollingThread: PeerListUpdated
151552 15:01:11.2500808s - Polling peer 0.fr.pool.ntp.org,1.fr.pool.ntp.org,2.fr.pool.ntp.org,3.fr.pool.ntp.org,0x8 (ntp.m|0x1|0.0.0.0:123->129.250.35.250:123)
151552 15:01:11.2500808s - PollIntervalChange(0.fr.pool.ntp.org,1.fr.pool.ntp.org,2.fr.pool.ntp.org,3.fr.pool.ntp.org,0x8 (ntp.m|0x1|0.0.0.0:123->129.250.35.250:123)): adjust: (++) -> 11
151552 15:01:11.2500808s - PollIntervalChange(0.fr.pool.ntp.org,1.fr.pool.ntp.org,2.fr.pool.ntp.org,3.fr.pool.ntp.org,0x8 (ntp.m|0x1|0.0.0.0:123->129.250.35.250:123)): reclamp: 11 -> 10 (min=4, max=15, sys=10)
151552 15:01:11.2500808s - Peer poll: Max:3600.0000000s (special) Cur:00.0000000s
151552 15:01:11.2500808s - PeerPollingThread: waiting 3600.000s
151552 15:01:11.2500808s - W32TmServiceMain: ********** Time Slip Notification **********


Message édité par fabienf le 03-12-2015 à 12:27:23
Reply

Marsh Posté le 03-12-2015 à 10:45:51   

Reply

Marsh Posté le 03-12-2015 à 13:29:57    

Comment as-tu configuré ton PDC ? Via w32tm ? Les autres machines sont configurées de quelle façon ? Tu as quoi comme équipement entre ton PDC et le Web ?

Reply

Marsh Posté le 03-12-2015 à 14:14:48    

nebulios a écrit :

Comment as-tu configuré ton PDC ? Via w32tm ? Les autres machines sont configurées de quelle façon ? Tu as quoi comme équipement entre ton PDC et le Web ?


 
non via modification directe dans le registre (pour les pools), mes machines "clientes" sont configurées via une GPO qui leur fait se synchroniser sur mon DC1.
entre mon serveur virtuel et le web , il y a l'hyperviseur, un switch HP, notre routeur cisco.
Cela reste une configuration de base sans complexité.
 
la ou je ne comprends pas c'est pourquoi cela se passe une fois par semaine de façon récurrente.
maintenant que l'on connait l'origine du problème la résolution est plutôt facile vu qu'il n'y a qu'a forcer une resynchronisation.
mais sans la cause je ne peu rien stabiliser.
 

Reply

Marsh Posté le 03-12-2015 à 14:36:43    

Non ce n'est pas une configuration de base, où tu as juste besoin de lancer une ligne de commande sur le PDC.
 
Commence par désactiver toute synchronisation entre tes VM et les hyperviseurs, enlever la GPO, vérifie qu'ils récupèrent correctement la synchro pour commencer.

Reply

Marsh Posté le 03-12-2015 à 14:43:50    

nebulios a écrit :

Non ce n'est pas une configuration de base, où tu as juste besoin de lancer une ligne de commande sur le PDC.
 
Commence par désactiver toute synchronisation entre tes VM et les hyperviseurs, enlever la GPO, vérifie qu'ils récupèrent correctement la synchro pour commencer.


- la GPO ne s'active que pour une OU particulière de mon AD mais j'ai vérifié quand même et elle ne s'applique pas à mon DC.
- la synchro entre l'hyperviseur et ma VM sont déjà désactivés depuis le premier plantage (redémarrage du serveur hôte fait) (il y avait juste un relicat dans la clé HKEY_LOCAL_MACHINE\SYSTEM\CurrentControlSet\Services\W32Time\TimeProviders\VMICTimeProvider\ ou enabled etait à 1 ... du coup je l'ai passé à 0)
- dernier synchro entre mon dc et le pool à 14H20 aujourd'hui.
 

Reply

Marsh Posté le 03-12-2015 à 14:51:05    

Non, là je te demande de vérifier la partie DC <-> Client, avant de vérifier le reste. Si celle-ci n'est pas OK dépanner le NTP sur ton DC ne va pas servir à grand-chose.

Reply

Marsh Posté le 03-12-2015 à 15:15:35    

nebulios a écrit :

Non, là je te demande de vérifier la partie DC <-> Client, avant de vérifier le reste. Si celle-ci n'est pas OK dépanner le NTP sur ton DC ne va pas servir à grand-chose.


 autant pour moi ...
je viens de lancer : w32tm /query /source d'un serveur client et il me retourne bien mon DC
et dans le /status heure  de dernière synchro 15H10

Reply

Marsh Posté le 03-12-2015 à 15:20:00    

Tu as combien de DC ?

Reply

Marsh Posté le 03-12-2015 à 15:37:50    

nebulios a écrit :

Tu as combien de DC ?


j en ai 2 ...
le DC2 se synchronisant sur le DC1 ... synchro ok entre les deux

Reply

Marsh Posté le 03-12-2015 à 15:54:16    

Sur ton PDC, lance w32tm /config /syncfromflags:manual /manualpeerlist:fr.pool.ntp.org /reliable:YES /update puis redémarre le service de temps pour remettre en place une conf correcte (vérifie les journaux d'évènements).
Ensuite il va falloir creuser les logs Windows/Cisco/HP pour identifier le pourquoi de la coupure.
 
Et pour info, se synchroniser sur une source externe est déconseillé par MS, mais on peut rarement faire autrement dans une petite boîte.

Reply

Marsh Posté le 03-12-2015 à 15:54:16   

Reply

Marsh Posté le 03-12-2015 à 16:17:33    

nebulios a écrit :

Sur ton PDC, lance w32tm /config /syncfromflags:manual /manualpeerlist:fr.pool.ntp.org /reliable:YES /update puis redémarre le service de temps pour remettre en place une conf correcte (vérifie les journaux d'évènements).
Ensuite il va falloir creuser les logs Windows/Cisco/HP pour identifier le pourquoi de la coupure.
 
Et pour info, se synchroniser sur une source externe est déconseillé par MS, mais on peut rarement faire autrement dans une petite boîte.


 
commande passée, service redémarré ... maintenant y a plus qu'à croiser les doigts en espérant que tout va bien se passer en milieu de semaine ;)
 
en tous cas merci pour tes conseils.
 
Je ferai un retour de situation en milieu de semaine prochaine.
Tu pense que cela peut être due à une coupure réseaux ?

Reply

Marsh Posté le 03-12-2015 à 16:28:56    

Possible. Tu n'as pas de tâche de maintenance planifiée sur un équipement quelconque à ce moment-là par hasard ?

Message cité 1 fois
Message édité par nebulios le 03-12-2015 à 16:29:34
Reply

Marsh Posté le 03-12-2015 à 16:37:53    

nebulios a écrit :

Possible. Tu n'as pas de tâche de maintenance planifiée sur un équipement quelconque à ce moment-là par hasard ?


j'ai cherché partout mais n'ai rien trouvé.
le plus troublant c'est que tout à bien fonctionné pendant 6 mois et que les premiers problèmes sont intervenus juste le mercredi après le changement d'heure d'hiver (coïncidence??)
il n'y a vraiment rien de logique dans ce problème. les heures de "crash" sont différentes à chaque fois, le jour varie du mercredi au jeudi, et le décalage n'est pas régulier car il peut prendre 7 jours d'avance comme en perdre 5.
j'ai pensé à une tache système planifiée mais cette piste à menée nulle part ...
si cela vient de mon switch c'est pas terrible car il n'est pas manageable et si c'est le routeur fourni par completel pour avoir les logs ça va être compliqué

Reply

Marsh Posté le 03-12-2015 à 18:23:32    

Tu as la date et l'heure qui changent à chaques fois ?
est un décalage de quelques minutes, heures ?  
 
Au niveau des journaux d’événements applications et système, est ce qu'il y a quelque chose de particulier à cette heure là ?

Reply

Marsh Posté le 16-12-2015 à 10:01:03    

bonjour,
 
la semaine dernière c’était ok et le problème s'est reproduit ce matin :(.
je vais basculer mes rôles sur le DC2 en attendant la fin des vacances.
merci pour votre aide

Reply

Sujets relatifs:

Leave a Replay

Make sure you enter the(*)required information where indicate.HTML code is not allowed