2012-07-01 16 views
35

Por lo tanto, en este momento (pero probablemente no por mucho tiempo) Reddit, Meetup, Fark, LinkedIn, Yelp, 4Chan están caídos. Netflix aparentemente estuvo fuera por un tiempo también.¿Por qué los problemas de segunda causa de salto?

De acuerdo con el tweet de Reddit, que están teniendo problemas relacionados con la Segunda Salto del 6/30/2012: https://twitter.com/redditstatus/status/219244389044731904

"Estamos teniendo algunos problemas de Java/Cassandra relacionados con el segundo salto a las 5 pm PST Estamos trabajando lo más rápido posible para restaurar el servicio ".

Aparentemente, los problemas que afectan a los otros sitios están todos relacionados con un segundo problema.

Después de leer el artículo de Wikipedia sobre Leap seconds, yo creo entiendo lo que los segundos intercalares son ... pero lo que no entiendo es qué tipo de comportamientos extraños que puede suceder si segundo salto no se contabiliza? ¿Y cómo, como programadores, deberíamos prepararnos para segundos rápidos cuando codificamos y configuramos servidores?

Quiero decir que es solo un segundo ¿no?

+1

Para el registro, Yelp ya no estaba abajo cuando se publicó esta pregunta. – Amber

+2

la costa este está siendo golpeada por una gran tormenta que está dejando a millones sin energía y también eliminó un gran centro de datos utilizado por Amazon (Elastic Compute Cloud de Amazon en Virginia del Norte), reedit, netflix y muchos otros, esto también la razón por la cual muchos sitios web están caídos hoy. – compcobalt

Respuesta

25

Ciertos kernels de Linux (versiones anteriores a la 2.6.29) tienen issues handling leap seconds, hasta el punto donde it can cause a kernel panic. Otros kernels de Linux can suffer from a livelock. Obviamente, esto tiene efectos perjudiciales para el sistema, dado que requiere un reinicio.

Aquí está the related ServerFault question on this topic, ya que es realmente un problema con el servidor Linux.

+6

¿Por qué? ¿Qué es aproximadamente un segundo intercalar que causa pánico en el kernel? –

+2

El código de kernel que maneja el segundo mensaje de salto de 'ntp' tiene errores. (Si desea una explicación más detallada, le recomiendo leer las entradas de la lista de correo vinculada/informes de errores.) – Amber

+1

marcado como respuesta correcta, pero sería bueno si el problema específico también se puso en la respuesta. gracias @Amber! – K2xL

Cuestiones relacionadas