Eine sequenzielle Dataset in SAS komprimieren

June 10

Die SAS "KOMPRIMIEREN =" Optionen "squeeze-out" und entfernen Sie die Leerzeichen aus Datasets zu Beobachtungen an zwei oder drei Bytes-Vertretungen und verringern die Gesamtdateigröße des Datasets. Zwei Methoden der sequenziellen Dataset Kompression Auftritt in SAS: innerhalb von "Daten" oder "OUT =" Prozedur Schritt oder auf Systemebene. Datenkomprimierung Schritt SAS komprimiert Zeichendaten in eine einzelne Datentabelle. System-Komprimierung reduziert die Größe aller neu erstellten Datasets.

Anweisungen

Datensatzebene

1 Das SAS-Programm mit dem SAS-Programm-Editor zu öffnen. Suchen Sie das einzelne Dataset in der Kompression angewendet.

2 Tragen Sie die KOMPRESSE = Option innerhalb der Output DATA-Anweisung, mit der folgenden Syntax:

Daten MyTestSet (KOMPRIMIEREN = YES);SET MyInitialSet;AUSFÜHREN;

3 Tragen Sie die KOMPRESSE = Option in der "OUT =" Option einer SAS-Prozedur mithilfe der folgenden Syntax:

PROC SORT DATA = MyInitialSet OUT = MyTestSet (KOMPRIMIEREN = YES); VON id1; AUSFÜHREN;

4 Führen Sie die Programmlinien. Überprüfen Sie die SASLOG für die Ergebnisse von den Daten oder SAS Prozedur Schritt.

Systemebene

5 Das SAS-Programm mit dem SAS-Programm-Editor zu öffnen.

6 Tragen Sie die KOMPRESSE = Option innerhalb der globalen Ebene an der Spitze des Programms innerhalb einer "Optionen"-Anweisung, mit der folgenden Syntax:

OPTIONEN COMPRESS = YES;

7 Führen Sie die Programmlinien. Überprüfen Sie das SAS-Protokoll nach einem Daten-Schritt zu überprüfen, ob die Komprimierung stattgefunden hat.

Tipps & Warnungen

  • Die KOMPRESSE = Option funktioniert effektiv für große Datenmengen und Typs Zeichendaten. Lesen Sie die Anmerkung in der Ausgabedatei SASLOG zu ermitteln, ob die-Verkleinerung die Komprimierungsoptionen rechtfertigen und des SAS-Programms entsprechend Anpassungen.
  • Betrachten Sie, wie häufig das komprimierte Dataset zugegriffen werden soll, vor der Anwendung von Kompression. Während Kompression Dateigrößen verringern kann, kann es auch zusätzliche CPU-Zeit zum Prozess sowie zusätzliche Zeit, um Code in das Programm verlangen.