Storage

Backup, come risolvere i più comuni errori NDMP

Molto utilizzato dai software di backup, il Network Data Management Protocol presenta una serie di errori non facilmente decifrabili. Il prontuario può aiutarvi a capire cosa in effetti non funzione

Pubblicato il 16 Apr 2012

network-mondo-connessione-121119145755

Il Network Data Management Protocol (NDMP) è un protocollo di rete che, a partire da una singola applicazione, permette di effettuare il backup di più server su cui girano svariati sistemi operativi. Questo approccio rende molto più facile eseguire copie di sicurezza eterogenee.

In genere, i fornitori di software di backup creano degli agent specifici per ogni piattaforma che si basano sul protocollo NDMP. Il compito di tali agenti è di stabilire una comunicazione NDMP-based con l’applicazione di backup, che a sua volta utilizza NDMP per comunicare con l’hardware di backup.

Tuttavia, come si evince dal nome, NDMP è un protocollo di rete e, come con qualsiasi altro protocollo di questo tipo, non è esente da errori. Purtroppo, la risoluzione di tali errori può essere un po’ impegnativa. Quando NDMP è stato originariamente definito nel 1996, il draft descriveva una serie di messaggi di errore, che potrebbero essere restituiti in varie condizioni.

La lista seguente descrive brevemente tutti gli errori che la versione originale di NDMP potrebbe fornire e il loro significato:

Errori di backup NDMP

  • NDMP_DEVICE_BUSY_ERR – L’ unità a nastro specificata è già in uso.
  • NDMP_DEVICE_OPENED_ERR – NDMP sta tentando di aprire più connessioni rispetto a quelle consentite.
  • NDMP_NOT_AUTHORIZED_ERR – Questo errore viene restituito se una richiesta NDMP è avviata prima che la connessione sia stata autenticata.
  • NDMP_PERMISSIONS_ERR – La connessione è stata autenticata, ma le credenziali utilizzate non dispongono delle autorizzazioni necessarie.
  • NDMP_DEV_NOT_OPEN_ERR – Si è tentato di accedere a un dispositivo senza prima aprire una connessione verso di esso.
  • NDMP_IO_ERR – L’unità a nastro ha restituito un errore di I/O.
  • NDMP_TIMEOUT_ERR – L’attuale operazione è scaduta.
  • NDMP_ILLEGAL_ARGS_ERR – La domanda contiene un argomento non consentito.
  • NDMP_NO_TAPE_LOADED_ERR – Non vi è alcun nastro nell’unità.
  • NDMP_WRITE_PROTECT_ERR – Il nastro nel drive è protetto da scrittura.
  • NDMP_EOF_ERR – Si è avuta un’inaspettata fine del file.
  • NDMP_EOM_ERR – Il nastro ha esaurito lo spazio (è stato raggiunto il marcatore The End of Media).
  • NDMP_FILE_NOT_FOUND_ERR – Il file richiesto non è stato trovato.
  • NDMP_BAD_FILE_ERR – Un descrittore di file danneggiato ha causato un errore.
  • NDMP_NO_DEVICE_ERR – È stata fatta una richiesta relativa a un’unità a nastro che non esiste.
  • NDMP_NO_BUS_ERR – Il bus SCSI specifico non può essere trovato.
  • NDMP_NOT_SUPPORTED_ERR – Il protocollo NDMP non è supportato o è supportato solo un sottoinsieme del protocollo.
  • NDMP_XDR_DECODE_ERR – Un messaggio non può essere decodificato.
  • NDMP_ILLEGAL_STATE_ERR – Allo stato attuale, una richiesta non può essere processata.
  • NDMP_UNDEFINED_ERR – Si è verificato un errore non definito.
  • NDMP_XDR_ENCODE_ERR – È stato individuato un errore di codifica in un messaggio di risposta.
  • NDMP_NO_MEM_ERR – Errore di allocazione della memoria.

Come potete vedere, la maggior parte dei messaggi di errore elencati sopra è piuttosto generica. Tuttavia, molto cose sono cambiate dal 1996. Nel corso degli ultimi 14 anni, il protocollo NDMP si è evoluto ed alcuni fornitori di software di backup hanno addirittura fatto proprie modifiche al protocollo.

Come se ciò non rendesse abbastanza difficile la risoluzione dei problemi, alcuni vendor hanno addirittura mascherato i codici di errore NDMP reali sostituendoli con i propri messaggi di errore.

Uno dei migliori esempi in questo senso è NetBackup di Symantec (ma anche Backup Exec), che trascodifica gli errori di NDMP attraverso codici numerici. I più comuni di questi codici di errore sono 16 e 99.

Codici di errore 16
L’errore 16 è l’equivalente del messaggio di errore NDMP_NO_DEVICE_ERR e a volte è espresso come NDMP_NO_DEVICE_ERR (16). In sostanza, questo errore notifica che il software di backup sta avendo problemi di comunicazione con un’unità a nastro (o con un disco).

Nonostante un errore 16 possa essere originato da un problema correlato all’hardware (drive a nastro difettoso, mancanza di energia elettrica, controller SCSI rovinato e così via), l’hardware non è sempre la causa effettiva. Quando si verifica questo tipo di errore, la soluzione migliore è di riavviare la macchina su cui il software di backup è in esecuzione.

Naturalmente, questa via non è sempre praticabile. Se il reboot non è possibile, il passo successivo è di resettare le componenti software coinvolte nel problema.

Ricordate che NDMP è un protocollo cross platform, quindi la procedura che si usa dipende dalla piattaforma e dal software di backup che si sta usando.

Per esempio, se è in esecuzione Backup Exec su un server NetWare, allora occorre fermare il software Backup Exec e poi effettuarne l’unload. Fatto ciò, potrebbe accadere che il driver SCSI non controlli più lo storage su disco del server. In tal caso, si dovrebbe effettuare l’unload e il reload dei driver SCSI prima e il reload del software Backup Exec poi. Sul suo sito web, Novell fornisce la documentazione della procedura completa per il fixing dell’errore 16 di NDMP.

La procedura appena descritta è più una scappatoia che non una reale soluzione. Tramite il reload dei driver SCSI e del software di backup in genere è possibile accedere all’unità a nastro (sempre che non ci siano problemi hardware), ma in realtà non risolverete la vera causa del problema.

Se questo problema si verifica regolarmente, allora dovreste controllare la documentazione in vostro possesso per adeguare le soglie di timeout, in quanto sia i timeout SCSI sia una eccessiva latenza di rete sono spesso causa dell’errore 16.

Codici di errore 99
L’errore 99 può essere un po’ più difficile da identificare e risolvere. È un errore generico che notifica semplicemente il fatto che il backup non è riuscito.

Nella maggior parte dei casi, l’errore 99 si verifica se il software di backup ha problemi ad accedere ai file di cui si intende fare una copia di sicurezza (a causa di un errore di percorso, non di permessi).

Questo tipo di errore può verificarsi anche se viene eseguito un backup incrementale, ma i file non sono stati modificati dal backup precedente. Se vi capita di avere in esecuzione il software di backup su un sistema Unix, allora potreste ricevere questo errore come risultato di una voce localhost non valida nel file /etc/hosts.

Se si verifica un errore 99, bisogna cercare eventuali indizi circa l’origine del problema nei log del software di backup. Ricordate infatti che l’errore 99 è un messaggio di errore generico e potrebbe significare qualsiasi cosa, perciò i log sono il posto migliore per iniziare la ricerca delle tracce delle potenziali cause.

Conclusioni
In questo articolo, abbiamo visto che, come qualsiasi altro protocollo, NDMP visualizzi messaggi di errore. Il problema è che spesso i messaggi sono eccessivamente semplificati o che il software di backup può mascherare il vero messaggio di errore. In tal senso, quando si verificano degli errori, può essere necessario controllare i log del server o consultare il vostro fornitore di backup per avere ulteriori informazioni.

Valuta la qualità di questo articolo

La tua opinione è importante per noi!

Articoli correlati

Articolo 1 di 2